本書是企業(yè)業(yè)務數(shù)據(jù)分析方法的集大成著作,由知名數(shù)據(jù)分析研究機構CDA 數(shù)據(jù)科學研究院組織多名行業(yè)知名專家進行研討、策劃、編著而成。書中內容源自對各行業(yè)領軍企業(yè)實際業(yè)務數(shù)據(jù)分析技能需求的提煉及總結,這些企業(yè)包括但不限于京東、阿里巴巴、騰訊、百度、德勤、畢馬威、IBM、微軟、GrowingIO 等。全書由八大部分構成:緒論、表格結構數(shù)據(jù)與表結構數(shù)據(jù)、數(shù)據(jù)庫應用、描述性統(tǒng)計分析、多維數(shù)據(jù)透視分析、業(yè)務分析方法、業(yè)務分析報告與數(shù)據(jù)可視化報表、CDA 職業(yè)發(fā)展。
CDA數(shù)據(jù)科學研究院簡介2013年,大數(shù)據(jù)行業(yè)方興未艾,CDA數(shù)據(jù)科學研究院孕育而生,是國內率先成立的專注于數(shù)據(jù)科學領域的專業(yè)研究團隊。CDA數(shù)據(jù)科學研究院匯集數(shù)據(jù)行業(yè)專家,團隊具有專業(yè)的學術素養(yǎng)、精湛的研究水平、扎實的企業(yè)實戰(zhàn)經驗,豐富的行業(yè)資源,通過對各類企業(yè)、社會組織等進行全面、系統(tǒng)、深入的調查和訪問,從而獲得緊跟技術發(fā)展的經驗與數(shù)據(jù),并結合數(shù)據(jù)行業(yè)的未來發(fā)展方向進行系統(tǒng)的研究,不斷研發(fā)新的知識體系和技術應用。近十年來,CDA數(shù)據(jù)科學研究院秉持“專業(yè)性、前沿性、科學性”的定位,深耕數(shù)據(jù)分析、大數(shù)據(jù)、人工智能等核心領域,持續(xù)推進數(shù)據(jù)科學的行業(yè)發(fā)展。未來,CDA數(shù)據(jù)科學研究院也將順應數(shù)字化時代浪潮,持續(xù)開拓創(chuàng)新,繼續(xù)加大數(shù)據(jù)科學領域的內容建設,推進人才數(shù)字化賦能,助力企業(yè)數(shù)字化轉型。
目錄
第1 章 緒論. 1
1.1 數(shù)據(jù)分析概述 .1
1.1.1 數(shù)據(jù)分析的分類 .3
1.1.2 數(shù)據(jù)分析的基本流程 .4
1.1.3 數(shù)據(jù)分析的落地方法 .7
1.2 數(shù)據(jù)分析師概述 .8
1.2.1 數(shù)據(jù)分析師的不同角色與職責 .8
1.2.2 數(shù)據(jù)分析師職業(yè)道德和行為準則 .10
1.3 數(shù)據(jù)相關的安全與立法 13
1.3.1 各國的數(shù)據(jù)隱私相關法律 .13
1.3.2 我國大數(shù)據(jù)立法的歷程和展望 .14
1.4 本章練習題 16
第2 章 表格結構數(shù)據(jù)與表結構數(shù)據(jù). 18
2.1 表格結構數(shù)據(jù) .19
2.1.1 表格結構數(shù)據(jù)概述 .19
2.1.2 表格結構數(shù)據(jù)特征 .20
2.2 表格結構數(shù)據(jù)的獲取、引用與使用 .24
2.2.1 表格結構數(shù)據(jù)的獲取 .24
2.2.2 表格結構數(shù)據(jù)的引用、查詢與計算方法 .28
2.3 表結構數(shù)據(jù) 38
2.3.1 表結構數(shù)據(jù)概述 .38
2.3.2 表結構數(shù)據(jù)特征 .40
2.4 表結構數(shù)據(jù)的獲取、加工與使用 45
2.4.1 表結構數(shù)據(jù)的獲取 .45
2.4.2 數(shù)據(jù)庫與商業(yè)智能的概念解析 .46
2.4.3 表結構數(shù)據(jù)的合并 .54
2.4.4 表結構數(shù)據(jù)的匯總 .60
2.5 本章練習題 65
第3 章 數(shù)據(jù)庫應用. 71
3.1 數(shù)據(jù)庫相關概念 71
3.1.1 數(shù)據(jù)庫簡介 71
3.1.2 認識數(shù)據(jù)庫 .74
3.1.3 SQL .76
3.1.4 數(shù)據(jù)倉庫 .77
3.2 數(shù)據(jù)定義語言 .79
3.2.1 DDL 在業(yè)務中的作用 .80
3.2.2 定義數(shù)據(jù)庫 .80
3.2.3 數(shù)據(jù)表 .82
3.2.4 數(shù)據(jù)類型 .88
3.2.5 約束條件 .92
3.3 數(shù)據(jù)操作語言 .100
3.3.1 DML 的作用 .100
3.3.2 添加數(shù)據(jù) .100
3.3.3 將查詢結果添加到表中 .102
3.3.4 更新數(shù)據(jù) .103
3.3.5 刪除數(shù)據(jù) .104
3.4 數(shù)據(jù)查詢語言 .104
3.4.1 單表查詢 .105
3.4.2 函數(shù) .125
3.4.3 多表查詢 .142
3.4.4 子查詢 .158
3.5 視圖 168
3.5.1 視圖的作用 .168
3.5.2 創(chuàng)建視圖 .169
3.5.3 修改視圖 .169
3.5.4 刪除視圖 .170
3.6 本章練習題 170
第4 章 描述性統(tǒng)計分析. 181
4.1 統(tǒng)計學概述 181
4.1.1 統(tǒng)計學的定義及應用 .181
4.1.2 統(tǒng)計學的基本概念 .185
4.2 數(shù)據(jù)的描述性統(tǒng)計分析 192
4.2.1 集中趨勢的描述 .192
4.2.2 離散程度的描述 .203
4.2.3 分布形態(tài)的描述 .208
4.2.4 描述性統(tǒng)計圖表 .211
4.3 常用的數(shù)據(jù)分布 .218
4.3.1 兩點分布與二項分布 .219
4.3.2 正態(tài)分布與標準正態(tài)分布 .221
4.3.3 c2 分布 .228
4.3.4 t 分布.229
4.3.5 F 分布 .230
4.3.6 分位點的概念 .232
4.4 相關分析 233
4.4.1 相關分析的含義 .233
4.4.2 簡單線性相關關系的描述 .234
4.4.3 簡單線性相關關系的度量 .235
4.5 本章練習題 239
第5 章 多維數(shù)據(jù)透視分析 246
5.1 多維數(shù)據(jù)模型 .246
5.1.1 多維數(shù)據(jù)模型概述 .247
5.1.2 多維數(shù)據(jù)模型創(chuàng)建方法 .248
5.2 5W2H 思維模型 .261
5.2.1 5W2H 思維模型概述 .261
5.2.2 5W2H 思維模型應用案例 262
5.3 多維數(shù)據(jù)透視分析應用案例 .265
5.3.1 業(yè)務場景介紹 .265
5.3.2 案例設計制作過程 .265
5.4 本章練習題 267
第6 章 業(yè)務分析方法 274
6.1 業(yè)務指標分析 .274
6.1.1 通用指標計算方法 .276
6.1.2 場景指標 .286
6.1.3 指標體系 .302
6.2 業(yè)務模型分析 .307
6.2.1 分類模型 .308
6.2.2 漏斗模型 .312
6.3 業(yè)務分析方法論 .318
6.3.1 帕累托分析方法 .318
6.3.2 A/B 測試分析方法 .320
6.3.3 同期群分析方法 .320
6.3.4 因果分析方法 .321
6.4 本章練習題 322
第7 章 業(yè)務分析報告與數(shù)據(jù)可視化報表. 330
7.1 可視化分析圖表 .330
7.1.1 業(yè)務圖表決策樹 .330
7.1.2 比較類圖表 .331
7.1.3 序列類圖表 .338
7.1.4 構成類圖表 .339
7.1.5 描述類圖表 .340
7.2 業(yè)務分析報表 .340
7.2.1 業(yè)務分析報表的分類與區(qū)別 .341
7.2.2 業(yè)務分析報表的創(chuàng)建方法 .342
7.3 業(yè)務分析報告 345
7.3.1 業(yè)務分析報告的分類 .346
7.3.2 業(yè)務分析報告撰寫注意事項 .346
7.3.3 業(yè)務分析報告案例1 348
7.3.4 業(yè)務分析報告案例2 352
7.4 本章練習題 355
第8 章 CDA 職業(yè)發(fā)展 361
8.1 CDA 職業(yè)概述 361
8.1.1 CDA 職業(yè)背景 .361
8.1.2 CDA 職業(yè)特點 .362
8.1.3 CDA 職業(yè)前景 .363
8.2 CDA 認證簡介 364
8.2.1 CDA 認證標準 .364
8.2.2 CDA 認證方式 .365
8.2.3 CDA 認證流程 .366
8.2.4 CDA 認證證書 .367
8.3 CDA 持證人與會員 .368
8.3.1 成為CDA 會員 368
8.3.2 CDA 持證人權益 .369
8.3.3 年檢和繼續(xù)教育 .370
附錄A 數(shù)據(jù)類型列表 371
附錄B 練習題答案及解析. 374
附錄C 名詞解釋 393