金融商業(yè)數據分析:基于Python和SAS
定 價:99 元
叢書名:金融商業(yè)數據分析與應用系列
這是一本金融商業(yè)數據分析的實戰(zhàn)工具書。作者都是在金融行業(yè)有10~20年數據分析經驗的資深專家,他們將多年來的項目經驗、培訓和咨詢經驗融合成了這本書。它將指導讀者零基礎掌握金融數據分析的工具、思路、方法和技巧,快速實現從入門到進階的突破。
本書強調實戰(zhàn),方法論與實踐相結合,所有案例均來自實際的金融業(yè)務,涵蓋工具使用、數據處理、統(tǒng)計分析等數據分析的全流程。
本書內容共14章,可分為3篇。分析工具篇(第1~4章):首先介紹了數據科學和數理統(tǒng)計的基本常識,然后講解了數據分析工具SAS EG和Python的基礎知識。數據處理篇(第5~9章):首先通過描述性統(tǒng)計分析進行數據探索,繼而講到基本的報表和統(tǒng)計制圖,還包括使用SAS EG進行數據處理,用Python進行數據整合、數據清洗,構建出滿足分析需求的數據集。統(tǒng)計分析篇(第10~14章):從統(tǒng)計學的基本概念引出假設檢驗與樣本t檢驗,三大統(tǒng)計檢驗、構造預測模型,并分享基于時間序列算法的建模方法。
(1)作者背景資深:4位作者都是在金融領域有10~20年數據挖掘和分析經驗的資深專家,技術功底深厚,業(yè)務經驗豐富。
(2)高維指導低維:作者在金融行業(yè)有10~20年項目實戰(zhàn)和項目咨詢經驗,深知初學者的難點和痛點,量身打造,事半功倍。
(3)金融業(yè)務驅動:以真實的業(yè)務場景和案例為驅動,涵蓋金融數據分析的全流程,告別純理論和不接地氣。
(4)從入門到進階:幫助讀者零基礎掌握金融數據分析的工具、思路、方法和技巧,快速實現從入門到進階的突破。
為什么要寫這本書隨著現代信息技術的不斷發(fā)展,以大數據為基礎的各類金融科技應用成為市場熱點。近年來,隨著數據治理不斷被強化及數據資產的熱度不斷升溫,各金融機構已經有了一定的數據基礎。基于數據挖掘手段開展精準營銷、風險管控、運營優(yōu)化,已經成為數據應用的必然趨勢。未來,隨著物聯網等技術的不斷推廣,數據量的增速將更為迅猛,大數據應用勢不可擋。在大數據轉型趨勢下,各企業(yè)也在思考如何不被市場淘汰,如何使數據的價值化。大數據應用一方面需要有數據可挖掘,另一方面需要數據分析專家。賦能金融企業(yè)內部人員,使之成為業(yè)務感知能力強、分析技術過硬的雙料人才,是培養(yǎng)數據分析專家快捷、實際的途徑。因此,市場上急需一本金融業(yè)務與數據分析技術相融合的參考書。基于對當前金融機構在數據分析中的痛點、通病的認識,以及在業(yè)界一流企業(yè)和咨詢公司的實踐,我們決心編寫一本適合金融行業(yè)數據分析人員入門的圖書。 讀者對象根據當前金融行業(yè)數字化轉型先進案例,我們知道客戶、產品、運營等前臺部門,以及數據管理、風險管理等中臺部門的從業(yè)人員均需要具備數據分析思維。也就是說,本書面向的讀者群包括:營銷、運營部門的數據分析師風控部門的從業(yè)人員大數據部門的工程師高校數學、統(tǒng)計學、金融工程、計算機科學及技術等專業(yè)的學生科技金融、金融大數據相關行業(yè)的同人本書特色雖然數據分析已經不是新概念,但是市面上系統(tǒng)地講解金融行業(yè)數據分析師如何成長的書不多。本書在業(yè)務方面涵蓋用戶畫像、客戶價值預測、精準營銷預測等,在方法論方面涵蓋描述統(tǒng)計、假設推斷、預測性建模等。同時,本書貼合金融行業(yè)的分析軟件環(huán)境,將新興的Python與傳統(tǒng)的SAS相結合,以便于讀者快速掌握相關技術。另外,市面上Python的編程基礎和機器學習圖書眾多,但是鮮有從數據分析角度進行講解的,而且Python本身的數據分析軟件包也不完善。在本書中,筆者結合多年的數據分析咨詢經驗,提供了常用的函數,便于讀者在實際工作中快速上手。如何閱讀本書本書共14章,分為3篇。分析工具篇(第1~4章):介紹SAS EG的菜單操作和Python的入門知識。數據處理篇(第5~9章):從構建統(tǒng)計指標和數據可視化開始講解,將數據查詢、數據整合、數據清洗相結合,構建出滿足分析需求的數據集。統(tǒng)計分析篇(第10~14章):從假設檢驗開始,介紹如何從業(yè)務洞察中獲取靈感,然后用數據驗證靈感,并且根據得到的靈感構建統(tǒng)計模型,以便預測客戶的未來價值或者營銷響應的概率。其中,統(tǒng)計分析篇通過實例講解數據分析應用,相比于前兩篇更獨立。如果你是一名有編程經驗的高手,可以直接閱讀這部分內容。如果你是一名初學者,請一定從第1章的基礎理論知識開始學習。勘誤和支持請關注微信公眾號數據資管,以下載書中的演示數據和腳本,觀看教學視頻,交流問題和反饋意見。也可以發(fā)送郵件至453288431@qq.com與作者聯系。期待得到你們的真摯反饋!致謝首先,感謝指導過我們工作和寫作的各位領導、老師,正是他們的鼓勵和鞭策才使得本書終面市。其次,感謝機械工業(yè)出版社華章公司的策劃編輯楊福川,他在這一年多時間中始終支持我們的寫作,鼓勵和幫助我們順利完稿。后,謹以此書獻給我們親愛的家人,以及眾多熱愛金融數據分析的朋友們!
張秋劍就職于騰訊云金融拓展中心,從事微信財富營銷管理、數據中臺、AI應用等解決方案拓展工作,研究方向包括數字化轉型、創(chuàng)新實踐等。
張浩曾任騰訊云金融首席架構師和星環(huán)科技金融行業(yè)技術總監(jiān),主要從事大數據、人工智能、云計算、區(qū)塊鏈、聯邦學習等相關技術研發(fā)與產品設計,具有豐富的企業(yè)架構設計、企業(yè)數字化戰(zhàn)略轉型運營與業(yè)務咨詢經驗。
周大川就職于某中央金融企業(yè)金融科技研發(fā)中心,主要從事企業(yè)級數據平臺開發(fā)、核心業(yè)務平臺建設、AI賦能金融科技創(chuàng)新等工作,具有豐富的新一代金融業(yè)務系統(tǒng)建設經驗。
常國珍曾任畢馬威咨詢大數據總監(jiān),具有近20年數據挖掘、精益數據治理、數字化運營咨詢經驗,是金融信用風險、反欺詐和反洗錢算法領域的專家。
前言分析工具篇第1章 數據科學與數理統(tǒng)計21.1 數據科學的基本概念21.2 數理統(tǒng)計技術51.2.1 描述性統(tǒng)計分析51.2.2 統(tǒng)計推斷與統(tǒng)計建模6第2章 SAS EG數據操作基礎82.1 SAS EG入門82.1.1 SAS EG簡介82.1.2 SAS EG的窗口及菜單92.2 訪問數據102.2.1 SAS EG實現方式112.2.2 SAS程序實現方式132.3 定義SAS數據集132.3.1 SAS數據的相關概念132.3.2 SAS EG實現方式162.3.3 SAS程序實現方式182.4 導入其他格式的數據文件192.4.1 SAS EG實現方式192.4.2 SAS程序實現方式21第3章 Python編程基礎223.1 Python概述223.2 Anaconda的安裝及使用方法233.2.1 下載與安裝233.2.2 使用Jupyter Notebook243.2.3 使用Spyder253.2.4 使用Conda管理第三方庫273.3 Python的基本數據類型293.3.1 字符串293.3.2 浮點型和整型293.3.3 布爾類型303.3.4 其他數據類型313.4 Python的基本數據結構313.4.1 列表323.4.2 元組333.4.3 集合333.4.4 字典343.5 Python的編程結構353.5.1 三種基本的編程結構簡介353.5.2 順序結構353.5.3 分支結構363.5.4 循環(huán)結構373.6 Python的函數與模塊403.6.1 Python的函數403.6.2 Python的模塊423.7 使用Pandas讀寫結構化數據433.7.1 讀數據433.7.2 寫數據46第4章 在SAS EG中使用程序474.1 如何在SAS EG中使用程序474.2 SAS程序494.2.1 SAS程序分析簡介494.2.2 DATA步504.2.3 PROC步51數據處理篇第5章 描述性統(tǒng)計分析與制圖545.1 描述性統(tǒng)計分析545.1.1 變量度量類型與分布類型545.1.2 變量的統(tǒng)計量565.1.3 連續(xù)變量的分布與集中趨勢565.1.4 連續(xù)變量的離散程度585.1.5 數據分布的對稱與高矮595.2 制作報表與統(tǒng)計圖605.3 制圖步驟及統(tǒng)計圖適用場景645.4 利用SAS EG進行統(tǒng)計分析675.4.1 連續(xù)變量描述性統(tǒng)計分析675.4.2 單因子頻數統(tǒng)計分析695.4.3 匯總統(tǒng)計分析725.4.4 繪制條形圖進行統(tǒng)計分析765.4.5 繪制地圖進行統(tǒng)計分析79第6章 表數據的行處理826.1 數據篩選826.1.1 SAS EG實現方式826.1.2 SAS程序實現方式846.2 排序與求秩876.2.1 SAS EG實現方式876.2.2 SAS程序實現方式946.3 抽樣956.3.1 抽樣理論介紹956.3.2 SAS EG實現方式976.3.3 SAS程序實現方式996.4 數據分組和匯總1006.4.1 SAS EG實現方式1006.4.2 SAS程序實現方式102第7章 表數據的列處理1037.1 構造列變量1037.2 拆分列1057.3 堆疊列1077.4 轉置列1107.4.1 SAS EG實現方式1117.4.2 SAS 程序實現方式1137.5 對列重編碼1147.5.1 SAS EG實現方式1147.5.2 SAS程序實現方式1197.6 變量標準化1197.6.1 SAS EG實現方式1207.6.2 SAS程序實現方式122第8章 數據集的操作1248.1 縱向連接1248.1.1 SAS EG實現方式1258.1.2 SAS程序實現方式1278.2 橫向連接1318.2.1 SAS EG實現方式1318.2.2 SAS程序實現方式1358.3 數據集的比較1388.3.1 SAS EG實現方式1388.3.2 SAS程序實現方式1418.4 創(chuàng)建格式1428.4.1 相關理論介紹1428.4.2 SAS EG實現方式1438.4.3 SAS程序實現方式1468.5 刪除數據集、格式和視圖1478.5.1 SAS EG實現方式1478.5.2 SAS程序實現方式148第9章 利用Python處理數據1499.1 數據整合1509.1.1 行操作和列操作1509.1.2 條件查詢1529.1.3 橫向連接1559.1.4 縱向合并1579.1.5 排序1599.1.6 分組匯總1609.1.7 拆分與堆疊列1639.1.8 賦值與條件賦值1659.2 數據清洗1679.2.1 重復值處理1679.2.2 缺失值處理1689.2.3 噪聲值處理1709.3 實戰(zhàn)1759.3.1 提取行為特征的RFM方法1759.3.2 使用RFM方法計算變量1769.3.3 數據整理與匯報177統(tǒng)計分析篇第10章 數據科學的統(tǒng)計推斷18010.1 基本的統(tǒng)計學概念18010.1.1 總體、樣本和統(tǒng)計量18010.1.2 點估計、區(qū)間估計和中心極限定理18110.2 假設檢驗18610.2.1 理論介紹18610.2.2 利用Python實現單樣本t檢驗18910.2.3 利用SAS EG實現單樣本t檢驗18910.2.4 利用SAS EG實現雙樣本t檢驗18910.2.5 利用Python實現雙樣本t檢驗19110.3 方差分析19310.3.1 利用Python實現單因素方差分析19310.3.2 利用SAS EG實現單因素方差分析19810.3.3 利用Python實現多因素方差分析20210.3.4