Python數(shù)據(jù)處理與分析案例教程
定 價:49.8 元
- 作者:藺首晶
- 出版時間:2025/4/1
- ISBN:9787121500749
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP312.8
- 頁碼:244
- 紙張:
- 版次:01
- 開本:16開
本書以VSCode為主要開發(fā)工具,全面系統(tǒng)地介紹了Python數(shù)據(jù)應(yīng)用開發(fā)的相關(guān)知識。本書采用理論與案例相結(jié)合,多樣化的案例、通俗易懂的講解形式、詳細的演示步驟,幫助大家輕松地學習Python數(shù)據(jù)分析的相關(guān)知識。全書共6個項目,前兩個項目介紹了文件采集和MySQL與Python交互的應(yīng)用,后面四個項目介紹了Python數(shù)據(jù)分析的常用庫及其應(yīng)用,涵蓋了科學計算庫NumPy、數(shù)據(jù)分析庫Pandas、數(shù)據(jù)清洗和數(shù)據(jù)可視化庫Matplotlib和pyecharts。每個項目中都結(jié)合所學的技術(shù)開發(fā)了綜合實訓,演示如何在項目中運用所學的知識,通過動手操作和練習,幫助讀者更好地理解和掌握所學的知識。
藺首晶, 畢業(yè)于哈爾濱師范大學計算機科學與技術(shù)專業(yè)本科學歷,在東北財經(jīng)大學獲得碩士學位,"雙師型”教師,自2005年至今,從教于大連電子學校軟件及應(yīng)用教學部,現(xiàn)任高級講師,長期工作在職業(yè)院校計算機軟件專業(yè)教學管理一線,有著較強的教育教學管理能力和豐富的教學經(jīng)驗,多次參編教材,主持、參與科研課題多項,在各項教學比賽、課件比賽中榮獲國家級、省級、市級等多個獎項,多篇教學論文在國內(nèi)期刊教育專欄發(fā)表并獲獎。2021年被評為大連市職業(yè)院校骨干教師,具備很好的教學素質(zhì),并有一定的研究能力,可以帶動身邊的教師一起參與研究。
項目1 文件采集 001
1.1 第三方模塊 002
1.1.1 第三方模塊的概念 002
1.1.2 NumPy、Pandas模塊的下載與安裝 004
1.2 CSV格式化數(shù)據(jù)的讀寫 006
1.2.1 CSV文件和csv模塊 006
1.2.2 使用NumPy模塊讀寫CSV文件 013
1.2.3 Pandas讀取和寫入CSV文件 015
1.3 XML文件讀寫 017
1.3.1 XML文件結(jié)構(gòu) 017
1.3.2 解析XML文件 018
1.4 JSON格式化數(shù)據(jù)的讀寫 020
1.4.1 JSON數(shù)據(jù)格式 020
1.4.2 JSON文件讀取 020
1.5 Excel格式化數(shù)據(jù)的讀寫 024
1.5.1 使用xlrd和xlwt模塊讀寫Excel文件 024
1.5.2 使用Pandas讀寫Excel文件 030
任務(wù)拓展 031
實訓1:汽車數(shù)據(jù)寫入CSV文件 031
實訓2:網(wǎng)絡(luò)數(shù)據(jù)爬取 038
課后練習 047
項目2 Python訪問MySQL與MongoDB數(shù)據(jù)庫 049
2.1 數(shù)據(jù)庫基礎(chǔ) 050
2.1.1 概述 050
2.1.2 數(shù)據(jù)庫分類 051
2.2 MySQL與Python交互 052
2.2.1 pymysql庫 052
2.2.2 訪問及查詢MySQL數(shù)據(jù)庫 053
2.3 MongoDB與Python交互 064
2.3.1 pymongo庫概述 064
2.3.2 訪問MongoDB 數(shù)據(jù)庫 064
任務(wù)拓展 069
實訓3:構(gòu)建基于MySQL與Python交互的汽車數(shù)據(jù)管理系統(tǒng) 069
課后練習 075
項目3 NumPy庫 077
3.1 Ndarray對象 078
3.1.1 認識NumPy數(shù)組對象 078
3.1.2 創(chuàng)建NumPy數(shù)組 079
3.1.3 NumPy數(shù)組屬性 081
3.1.4 NumPy切片和索引 083
3.2 NumPy數(shù)組操作 088
3.2.1 修改數(shù)組形狀 089
3.2.2 連接數(shù)組 089
3.2.3 分割數(shù)組 093
3.2.4 數(shù)組元素的添加與刪除 095
3.3 NumPy函數(shù) 098
3.3.1 NumPy通用函數(shù) 099
3.3.2 NumPy統(tǒng)計函數(shù) 102
任務(wù)拓展 108
實訓4:管理手機卡用戶數(shù)據(jù) 108
課后練習 117
項目4 Pandas庫 119
4.1 Pandas數(shù)據(jù)結(jié)構(gòu) 120
4.1.1 Series的組成及創(chuàng)建 120
4.1.2 DataFrame的組成及創(chuàng)建 123
4.1.3 DataFrame的數(shù)據(jù)切片與合并 127
4.1.4 numpy.array與pandas.DataFrame的轉(zhuǎn)換 131
4.2 數(shù)據(jù)訪問 132
4.2.1 獲取DataFrame的字段信息 132
4.2.2 獲取指定的行和列 135
4.2.3 獲取數(shù)值型字段的統(tǒng)計信息 139
4.2.4 獲取文本型字段的取值信息 140
任務(wù)拓展 141
實訓5:藥店數(shù)據(jù)維護與銷售情況分析 141
課后練習 146
項目5 數(shù)據(jù)清洗 148
5.1 數(shù)據(jù)清洗 149
5.1.1 缺失值的處理 149
5.1.2 重復值的處理 155
5.1.3 異常值的處理 157
5.1.4 更改數(shù)據(jù)類型 161
5.2 數(shù)據(jù)轉(zhuǎn)換 164
5.2.1 重命名軸索引 165
5.2.2 離散化連續(xù)數(shù)據(jù) 167
5.2.3 啞變量處理類別型數(shù)據(jù) 168
任務(wù)拓展 170
實訓6:餐飲數(shù)據(jù)清洗 170
課后練習 177
項目6 數(shù)據(jù)可視化 179
6.1 數(shù)據(jù)可視化概述 180
6.1.1 什么是數(shù)據(jù)可視化 180
6.1.2 常見的圖表類型 180
6.1.3 數(shù)據(jù)可視化工具 184
6.2 使用Matplotlib繪制圖表 190
6.2.1 通過figure()函數(shù)創(chuàng)建畫布 190
6.2.2 通過subplot()函數(shù)創(chuàng)建單個子圖 194
6.2.3 通過subplots()函數(shù)創(chuàng)建多個子圖 197
6.2.4 通過add_subplot()方法添加和選中子圖 198
6.3 使用Matplotlib繪制其他簡單圖表 200
6.3.1 plot()函數(shù)繪制折線圖 200
6.3.2 通過scatter()繪制散點圖或氣泡圖 203
6.3.2 通過hist()函數(shù)繪制直方圖 206
6.3.3 通過pie()函數(shù)繪制餅圖或圓環(huán)圖 208
6.3.4 通過barth()方法繪制條形圖或堆積條形圖 210
任務(wù)拓展 215
實訓7:使用pyecharts 繪制常見圖表 215
課后練習 235