數據科學統(tǒng)計基礎(數據科學與大數據技術叢書)
定 價:49 元
叢書名:數據科學與大數據技術叢書
當前圖書已被 30 所學校薦購過!
查看明細
- 作者:呂曉玲 黃丹陽
- 出版時間:2021/1/1
- ISBN:9787300286921
- 出 版 社:中國人民大學出版社
- 中圖法分類:C8
- 頁碼:324
- 紙張:
- 版次:1
- 開本:16
在數據科學的時代背景下,統(tǒng)計學作為一門學科基礎課和方法論課程,更強調的是統(tǒng)計思想在數據科學中的應用。編寫教材、組織教學都是圍繞著這個核心內容來安排的。我們不再將傳統(tǒng)的正態(tài)分布下的抽樣分布、參數估計、假設檢驗的理論和方法作為重點講述內容, 而是將其融入到具體例子中進行講授,突出統(tǒng)計思維在其中的應用.
本書首先介紹統(tǒng)計量的概念及其性質,在此基礎上介紹經典統(tǒng)計的兩個重要內容,參數估計和假設檢驗,將其作為統(tǒng)計研究問題中的兩個例子, 介紹統(tǒng)計研究方法的重要思想。之后介紹統(tǒng)計決策與貝葉斯方法。最后介紹基于再抽樣和數據重利用的統(tǒng)計方法與理論。本書的每個小節(jié)后面都有批判性思考題目,目的是引起討論、啟發(fā)思考。每章的最后一節(jié)介紹了與本章知識點相關的R語言操作, 包括本書介紹的各種方法的計算機實現(xiàn), 以及使用統(tǒng)計模擬來輔助各種方法的更深入理解等.
呂曉玲 中國人民大學統(tǒng)計學院教授,博士生導師;數據科學與大數據統(tǒng)計系系主任;中國人民大學數據挖掘中心主任。本科與碩士畢業(yè)于南開大學數學系概率統(tǒng)計專業(yè),博士畢業(yè)于香港城市大學管理科學系。曾經是奧地利約翰開普勒大學應用統(tǒng)計系以及美國加州大學伯克利分校統(tǒng)計系訪問學者。一直從事統(tǒng)計機器學習、數據科學領域的研究。主持教育部人文社會科學研究項目以及中國國家自然科學基金項目。學術論文在Journal of American Statistical Association, Journal of Electronic Commerce Research等SSCI/SCI檢索的國際學術期刊發(fā)表。
第 1章 數據及其描述 :統(tǒng)計量
1.1數據和變量
1.1.1數據的例子
1.1.2變量的類型
批判性思考
習題1.1
1.2總體、樣本和統(tǒng)計量
1.2.1總體和分布
1.2.2樣本
1.2.3統(tǒng)計量
批判性思考
習題 1.2
1.3從樣本認識總體的圖表方法
1.3.1頻數頻率表與直方圖
1.3.2餅圖與條形圖
1.3.3樣本的經驗分布函數
1.3.4高維數據的圖表展示方法
1.3.5數據變換
批判性思考
習題 1.3
1.4次序統(tǒng)計量
1.4.1次序統(tǒng)計量的概念
1.4.2樣本極差
1.4.3樣本中位數與樣本 p分位數
1.4.4箱線圖和 Q–Q圖
批判性思考
習題 1.4
1.5抽樣分布
1.5.1樣本均值的抽樣分布
1.5.2正態(tài)總體各統(tǒng)計量的分布
1.5.3次序統(tǒng)計量的分布
1.5.4用隨機模擬法尋找統(tǒng)計量的近似分布
批判性思考
習題 1.5
1.6充分統(tǒng)計量
1.6.1充分統(tǒng)計量的概念
1.6.2因子分解定理
批判性思考
習題 1.6
1.7常用的概率分布族
1.7.1常用概率分布族表
1.7.2伽瑪分布族
1.7.3貝塔分布族
1.7.4指數型分布族
批判性思考
習題 1.7
1.8與本章相關的 R語言操作
1.8.1基本統(tǒng)計量的計算
1.8.2圖表
1.8.3隨機模擬統(tǒng)計量的抽樣分布
附錄:定理證明
第 2章 參數估計
2.1點估計與無偏性
批判性思考
習題2.1
2.2矩估計與相合性
2.2.1矩估計
2.2.2相合性
批判性思考
習題2.2
2.3最大似然估計與漸近正態(tài)性
2.3.1最大似然估計
2.3.2最大似然估計的不變原理
2.3.3最大似然估計的漸近正態(tài)性
2.3.4 EN算法
批判性思考
習題2.3
2.4最小方差無偏估計
2.4.1無偏估計的有效性
2.4.2有偏估計的均方誤差準則
2.4.3一致最小方差無偏估計
2.4.4完備性及其應用
批判性思考
習題2.4
2.5 C-R不等式
2.5.1 C-R不等式
2.5.2有效估計
批判性思考
習題2.5
2.6置信區(qū)間
2.6.1置信區(qū)間概念
2.6.2樞軸量法
2.6.3大樣本置信區(qū)間
批判性思考
習題2.6
2.7正態(tài)總體參數的置信區(qū)間
2.7.1正態(tài)總體參數的置信區(qū)間
2.7.2二維參數 (μ, σ2)的置信域
2.7.3樣本量的確定
批判性思考
習題2.7
2.8與本章相關的R語言操作
2.8.1隨機變量序列分布的演示
2.8.2最大似然估計
2.8.3 EM算法模擬實例
2.8.4區(qū)間估計的模擬結果
2.8.5均值、方差的區(qū)間估計
第3章假設檢驗
3.1假設檢驗的概念與步驟
3.1.1假設檢驗問題
3.1.2假設檢驗的步驟
批判性思考
習題3.1
3.2正態(tài)總體參數和比率的檢驗
3.2.1正態(tài)均值μ的檢驗
3.2.2其他正態(tài)總體參數的檢驗
3.2.3成對數據的t檢驗
3.2.4比率的推斷
3.2.5幾個說明
批判性思考
習題3.2
3.3分布的檢驗
3.3.1離散分布的X2擬合優(yōu)度檢驗
3.3.2連續(xù)分布的檢驗
批判性思考
習題3.3
3.4大規(guī)模假設檢驗與FDR
3.4.1大規(guī)模假設檢驗
3.4.2 FDR方法介紹
批判性思考
習題3.4
3.5與本章相關的R語言操作
3.5.1正態(tài)總體的參數檢驗
3.5.2比率檢驗
3.5.3假設檢驗的一個人為例子
3.5.4 X2擬合優(yōu)度檢驗
3.5.5夏皮洛—威爾克檢驗
3.5.6柯莫哥洛夫—斯米爾諾夫檢驗
3.5.7 FDR例子
第4章統(tǒng)計決策與貝葉斯方法
4.1統(tǒng)計決策的基本概念
4.1.1統(tǒng)計決策問題的三要素
4.1.2統(tǒng)計決策函數與風險函數
批判性思考
習題 4.1
4.2貝葉斯點估計
4.2.1先驗分布與貝葉斯公式
4.2.2先驗分布
4.2.3貝葉斯風險與貝葉斯點估計
4.2.4兩個注釋
批判性思考
習題 4.2
4.3貝葉斯區(qū)間估計
4.3.1可信區(qū)間
4.3.2最大后驗密度 (HPD)可信區(qū)間
批判性思考
習題 4.3
4.4貝葉斯假設檢驗
批判性思考
習題 4.4
4.5與本章相關的 R語言操作
4.5.1不同先驗的對比
4.5.2貝葉斯區(qū)間估計
第 5章再抽樣方法
5.1自助法參數估計
5.1.1標準誤差的自助法估計
5.1.2偏差的自助法估計
5.1.3自助法的區(qū)間估計
5.1.4討論
批判性思考
習題 5.1
5.2 Jackknife
5.2.1 Jackknife方法介紹
5.2.2 Jackknife和自助法的聯(lián)系
批判性思考
習題 5.2
5.3再抽樣假設檢驗
5.3.1置換檢驗
5.3.2自助法假設檢驗
批判性思考
習題 5.3
5.4交叉驗證
5.4.1交叉驗證簡介
5.4.2進一步討論
批判性思考
習題 5.4
5.5數據科學中的 PCS準則
5.5.1 DSLC中的 PCS準則
5.5.2通過擾動分析進行 PCS推斷
批判性思考
習題 5.5
5.6與本章相關的 R語言操作
5.6.1自助法
5.6.2 Jackknife
5.6.3假設檢驗
5.6.4交叉驗證
5.6.5數據科學中的 PCS準則
附錄 R語言簡介
A.1 R軟件簡介
A.1.1 R軟件的簡單介紹
A.1.2 R軟件的安裝
A.2數據的類型結構
A.2.1數據的類型
A.2.2數據的結構
A.2.3缺失數據的處理
A.3 R的基本操作
A.3.1數據的輸入和輸出
A.3.2控制結構
A.3.3自定義函數
A.3.4畫圖
A.4概率分布
參考文獻