本書提出了以理解數(shù)據(jù)和處理數(shù)據(jù)為目標的計算生態(tài)的教學理念,全面系統(tǒng)地介紹了數(shù)據(jù)與計算科學基礎的基本理論與方法。本書主要內(nèi)容包括數(shù)據(jù)與計算概述、計算機系統(tǒng)、數(shù)據(jù)的表示、算法、計算機語言與程序、數(shù)據(jù)收集與預處理、數(shù)據(jù)計算、數(shù)據(jù)分析與可視化。本書內(nèi)容豐富,結(jié)構(gòu)清晰,在重點講解各種算法思想的基礎上,通過數(shù)據(jù)分析與可視化的各種應用案例,進行多維度的“數(shù)據(jù)思維”訓練,以滿足讀者對理解“信息技術跨學科賦能”的現(xiàn)實需求。同時本書附贈電子教學課件、案例源文件和結(jié)果文件,以方便教學。本書適合普通高等學校作為大學計算機通識教育教材使用,也適合對數(shù)據(jù)與計算感興趣的讀者閱讀。
陳展榮,男,副教授。1986.07,畢業(yè)于江西贛南師范大學數(shù)學系;1990.9~1993.7,就讀于重慶大學計算力學專業(yè)并獲得工學碩士學位;1986.07~1990.0,任教于江西省石城中學,承擔中學數(shù)學課程的教學工作;1993.07~1997.12,任教于廣州大學,主要從事計算機應用技術的教學與科研工作;1998~至今,任教于暨南大學信息科學技術學院,主要從事計算機應用技術的教學和科研工作。主要著作出版情況:《數(shù)據(jù)科學基礎實踐教程》,人民郵電出版社,2020.9。承擔的科研項目: ①主持省部級項目:2018第一批教育部高教司產(chǎn)學協(xié)同育人項目(項目編號:201801002039)。移動應用課程開發(fā)的課程改革與研究(教學內(nèi)容與課程體系改革類)。2018.12~2019.12.已結(jié)項;②主持省部級項目:2017第一批年教育部高教司產(chǎn)學協(xié)同育人項目(項目編號:201602029026)。MOOC建設與翻轉(zhuǎn)課堂教學研討班(第八期)(教學研究類),2017.1~2017.12。已結(jié)項;③2011-2014期間,作為項目第二主持人,承擔了國家社科基金項目:"現(xiàn)代漢語辭格語料庫建設研究”的系統(tǒng)設計與建設工作,項目編號為:11BYY090。所從事的主要科研與教學工作及獲獎情況:基于賦能式教學理念的外招生《資訊科技》課程沉浸式學習空間重構(gòu)與實踐研究項目獲得第十屆暨南大學教育教學成果二等獎。
目 錄
第1章 數(shù)據(jù)與計算概述 1
1.1 數(shù)據(jù)的概念 1
1.1.1 信號、消息、信息和數(shù)據(jù) 2
1.1.2 現(xiàn)實世界的數(shù)據(jù)模型 3
1.1.3 結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù) 4
1.2 計算的概念 6
1.2.1 數(shù)學計算 6
1.2.2 通用計算 6
1.2.3 現(xiàn)實世界的計算模型 6
1.3 計算機模型 7
1.3.1 圖靈機 8
1.3.2 現(xiàn)代計算模型 9
1.4 網(wǎng)絡、大數(shù)據(jù)和云計算 10
1.4.1 計算機網(wǎng)絡概述 10
1.4.2 計算機網(wǎng)絡圖模型和TCP/IP體系結(jié)構(gòu) 11
1.4.3 大數(shù)據(jù) 17
1.4.4 云計算 18
習題1 20
第2章 計算機系統(tǒng) 22
2.1 計算機結(jié)構(gòu) 22
2.1.1 主存儲器 22
2.1.2 中央處理器 25
2.1.3 輸入/輸出系統(tǒng) 27
2.2 軟件和操作系統(tǒng) 27
2.2.1 操作系統(tǒng)概述 28
2.2.2 操作系統(tǒng)核心功能 29
2.2.3 大數(shù)據(jù)分析和處理技術 35
習題2 37
第3章 數(shù)據(jù)的表示 40
3.1 計數(shù)系統(tǒng)與數(shù)制 40
3.1.1 進位計數(shù)制 40
3.1.2 二進制數(shù)的基本運算 41
3.1.3 數(shù)制的轉(zhuǎn)換 43
3.2 數(shù)值數(shù)據(jù)表示法 47
3.2.1 整數(shù)表示 48
3.2.2 實數(shù)表示 50
3.3 字符表示法 52
3.3.1 ASCII字符集 53
3.3.2 漢字字符集 54
3.3.3 通用字符集 55
3.4 現(xiàn)實數(shù)據(jù)的表示 56
3.4.1 統(tǒng)計數(shù)據(jù)的分類與表示 56
3.4.2 模擬量的數(shù)字化 58
3.4.3 結(jié)構(gòu)數(shù)據(jù)表示 61
3.5 數(shù)據(jù)的存儲 65
3.5.1 數(shù)據(jù)標識 65
3.5.2 數(shù)據(jù)存儲結(jié)構(gòu) 66
3.5.3 數(shù)據(jù)文件 66
3.5.4 數(shù)據(jù)壓縮 67
3.6 數(shù)據(jù)結(jié)構(gòu)基礎 68
3.6.1 數(shù)據(jù)結(jié)構(gòu) 68
3.6.2 抽象數(shù)據(jù)類型 70
習題3 70
第4章 算法 74
4.1 算法概述 74
4.1.1 算法的定義 74
4.1.2 算法示例——求最小值 75
4.1.3 求解策略和流程控制結(jié)構(gòu) 78
4.1.4 算法表示 80
4.1.5 算法效率表示 83
4.2 常用算法 84
4.2.1 迭代 84
4.2.2 窮舉 86
4.2.3 排序 89
4.2.4 查找 91
4.2.5 隨機模擬 93
4.3 遞歸 94
4.3.1 遞歸 94
4.3.2 分治法 96
習題4 100
第5章 計算機語言與程序 105
5.1 計算機語言概述 105
5.1.1 算法與程序 105
5.1.2 計算機語言 105
5.2 計算機語言基礎 108
5.2.1 標識符 108
5.2.2 數(shù)據(jù)類型 108
5.2.3 表達式與運算符 109
5.2.4 基本語句 110
5.2.5 子程序、函數(shù)和方法 111
5.3 Excel基礎 111
5.3.1 Excel在數(shù)據(jù)分析中的應用概述 112
5.3.2 Excel數(shù)據(jù)處理基礎 112
5.4 VBA語言 115
5.4.1 VBA語言基礎 115
5.4.2 VBA控制結(jié)構(gòu) 118
5.4.3 VBA常用對象與程序設計 121
習題5 129
第6章 數(shù)據(jù)收集與預處理 132
6.1 數(shù)據(jù)的來源、數(shù)據(jù)的分類與數(shù)據(jù)集 132
6.2 數(shù)據(jù)收集 134
6.2.1 數(shù)據(jù)收集的途徑與方法 134
6.2.2 Excel數(shù)據(jù)的錄入與管理規(guī)范 135
6.3 數(shù)據(jù)預處理 137
6.3.1 數(shù)據(jù)清洗 137
6.3.2 數(shù)據(jù)規(guī)約 140
習題6 142
第7章 數(shù)據(jù)計算 144
7.1 字段計算 144
7.1.1 幾種常用的數(shù)據(jù)運算 144
7.1.2 函數(shù)運算 145
7.1.3 常用的字段計算 145
7.2 利用“公式填充”實現(xiàn)簡單的遞推計算 149
7.2.1 數(shù)制轉(zhuǎn)換的遞推計算 149
7.2.2 將十進制整數(shù)轉(zhuǎn)換為R進制整數(shù)原碼、反碼和補碼的遞推計算 149
7.3 Excel中的算法推演 151
7.3.1 遞推計算 151
7.3.2 二分法 153
7.3.3 貪心算法 155
7.4 VBA在數(shù)據(jù)計算中的應用 155
7.4.1 排序算法演示 155
7.4.2 頻數(shù)計算 156
7.4.3 工作日計算 157
習題7 159
第8章 數(shù)據(jù)分析與可視化 162
8.1 數(shù)據(jù)分析與可視化概述 162
8.1.1 什么是數(shù)據(jù)分析 162
8.1.2 什么是數(shù)據(jù)可視化 162
8.2 基礎統(tǒng)計分析 163
8.2.1 借助直方圖進行數(shù)據(jù)特征分析 163
8.2.2 正態(tài)分布圖形分析 163
8.2.3 相關分析 167
8.2.4 回歸分析 169
8.3 數(shù)據(jù)挖掘 174
8.3.1 數(shù)據(jù)挖掘概述 174
8.3.2 Excel數(shù)據(jù)挖掘模塊 175
8.3.3 關聯(lián)分析 176
8.3.4 聚類分析 180
8.3.5 時間序列分析 184
8.4 數(shù)據(jù)可視化 186
8.4.1 條件格式 186
8.4.2 基礎圖表 187
8.3.3 組合圖表 189
8.3.4 動態(tài)圖表 190
8.3.5 數(shù)據(jù)透視表 191
習題8 194
附錄A Excel常用函數(shù) 196
附錄B 常用控制符的ASCII表 199