定 價:69 元
叢書名:普通高等教育智慧海洋技術(shù)系列教材
- 作者:蔡成濤,吳艷霞
- 出版時間:2024/12/1
- ISBN:9787030807236
- 出 版 社:科學(xué)出版社
- 中圖法分類:TP242.3
- 頁碼:227
- 紙張:
- 版次:1
- 開本:16
本書全面介紹智能計(jì)算架構(gòu)與軟件棧的基本原理和應(yīng)用。內(nèi)容涵蓋:智能計(jì)算系統(tǒng)的基礎(chǔ)知識,主要包括定義、發(fā)展歷程;計(jì)算機(jī)體系結(jié)構(gòu)基礎(chǔ),詳述了指令系統(tǒng)、存儲系統(tǒng)、流水線技術(shù)和并行計(jì)算;AI加速器原理,重點(diǎn)介紹了發(fā)展歷史、設(shè)計(jì)思路、優(yōu)化設(shè)計(jì)和性能評價;AI加速器架構(gòu),深入分析了單核和多核架構(gòu);AI編譯器的工作原理和設(shè)計(jì)方法;基于TVM的定制化AI編譯器的設(shè)計(jì);兩個海洋智能計(jì)算的實(shí)驗(yàn)案例。
更多科學(xué)出版社服務(wù),請掃碼獲取。
1. 1999.09—2003.07哈爾濱工程大學(xué)自動化學(xué)院、本科
2. 2003.09—2005.03哈爾濱工程大學(xué)自動化學(xué)院、碩士
3. 2004.09—2008.03哈爾濱工程大學(xué)自動化學(xué)院、博士1. 2005—2009哈爾濱工程大學(xué)自動化學(xué)院、助教
2. 2006—2007加拿大國家研究院、訪問學(xué)者
3. 2009—2011哈爾濱工程大學(xué)船舶與海洋工程學(xué)院、博士后
4. 2014—2015美國休斯敦大學(xué)、訪問學(xué)者
5. 2011—2018哈爾濱工程大學(xué)自動化學(xué)院、副教授
6. 2018—至今哈爾濱工程大學(xué)智能科學(xué)與工程學(xué)院、教授
7. 2019—2020哈爾濱工程大學(xué)智能科學(xué)與工程、副院長
8.2020—至今哈爾濱工程大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院、院長模式識別與智能系統(tǒng),環(huán)境感知與無人系統(tǒng)、圖像處理及機(jī)器視覺、控制科學(xué)與工程等領(lǐng)域
目錄
第1章 概述 1
1.1 智能計(jì)算系統(tǒng) 1
1.1.1 智能計(jì)算系統(tǒng)的概念 1
1.1.2 智能計(jì)算系統(tǒng)的發(fā)展 2
1.2 智能計(jì)算系統(tǒng)中的硬件與軟件 4
1.2.1 智能計(jì)算系統(tǒng)中硬件的角色 4
1.2.2 智能計(jì)算系統(tǒng)中軟件棧的角色 6
思考題 8
第2章 計(jì)算機(jī)體系結(jié)構(gòu)基礎(chǔ) 9
2.1 指令系統(tǒng) 9
2.1.1 指令系統(tǒng)概述 9
2.1.2 數(shù)據(jù)表示 12
2.1.3 尋址方式 15
2.1.4 指令類型與指令格式 17
2.2 存儲系統(tǒng) 20
2.2.1 存儲系統(tǒng)概述 20
2.2.2 存儲器技術(shù)與優(yōu)化 21
2.2.3 緩存性能與優(yōu)化 23
2.2.4 虛擬存儲器 26
2.3 流水線 28
2.3.1 流水線概述 28
2.3.2 流水線性能 31
2.3.3 流水線中的相關(guān) 35
2.4 并行 39
2.4.1 并行度與并行體系結(jié)構(gòu)分類 39
2.4.2 指令級并行 41
2.4.3 數(shù)據(jù)級并行 52
2.4.4 分布式并行訓(xùn)練系統(tǒng) 62
思考題 68
第3章 AI加速器原理 69
3.1 AI加速器概述 69
3.1.1 AI加速器的發(fā)展 69
3.1.2 AI加速器的設(shè)計(jì)思路 71
3.2 目標(biāo)算法分析 72
3.2.1 計(jì)算特征 72
3.2.2 訪存特征 75
3.3 AI加速器優(yōu)化設(shè)計(jì) 80
3.3.1 運(yùn)算部件設(shè)計(jì) 80
3.3.2 稀疏化設(shè)計(jì) 84
3.3.3 低位寬與混合精度設(shè)計(jì) 85
3.4 性能評價 86
3.4.1 性能指標(biāo) 87
3.4.2 測試基準(zhǔn)程序 87
3.4.3 影響性能的因素 88
思考題 89
第4章 AI加速器架構(gòu) 90
4.1 單核AI加速器架構(gòu) 90
4.1.1 總體架構(gòu) 90
4.1.2 運(yùn)算模塊 92
4.1.3 存儲與控制模塊 94
4.2 多核AI加速器架構(gòu) 97
4.2.1 總體架構(gòu) 98
4.2.2 Cluster 架構(gòu) 99
4.2.3 互聯(lián)架構(gòu) 103
4.3 AI加速器實(shí)例 105
4.3.1 Google TPU 105
4.3.2 TVM-VTA 106
4.3.3 NVDLA 108
4.3.4 華為昇騰AI處理器 109
思考題 111
第5章 AI編譯器基礎(chǔ) 112
5.1 傳統(tǒng)編譯器工作流程 112
5.1.1 LLVM編譯器前端 112
5.1.2 LLVM編譯器中間表示 114
5.1.3 LLVM編譯器后端 116
5.2 AI編譯器原理 119
5.2.1 AI編譯器的結(jié)構(gòu)與特征 119
5.2.2 AI編譯器前端技術(shù) 120
5.2.3 AI編譯器后端與運(yùn)行時 137
思考題 158
第6章 AI編譯器設(shè)計(jì) 159
6.1 TVM系統(tǒng)設(shè)計(jì) 159
6.1.1 TVM概述 159
6.1.2 TVM的計(jì)算圖優(yōu)化 161
6.1.3 TVM的計(jì)算與調(diào)度 165
6.1.4 TVM的自動調(diào)優(yōu)框架 166
6.2 華為MindSpore軟件棧設(shè)計(jì) 170
6.2.1 圖算融合 170
6.2.2 融合算子加速優(yōu)化框架AKG 173
思考題 175
第7章 基于TVM的定制化AI編譯器 176
7.1 TVM前端擴(kuò)展 176
7.1.1 數(shù)據(jù)表示實(shí)現(xiàn) 176
7.1.2 自定義算子實(shí)現(xiàn) 179
7.2 TVM后端及運(yùn)行時擴(kuò)展 183
7.2.1 代碼生成的定制化開發(fā) 183
7.2.2 運(yùn)行時的定制化開發(fā) 191
7.2.3 集成第三方硬件加速庫 196
思考題 213
第8章 海洋智能計(jì)算實(shí)驗(yàn) 214
8.1 海洋智能信號預(yù)處理算子開發(fā)實(shí)驗(yàn) 214
8.1.1 實(shí)驗(yàn)?zāi)康?214
8.1.2 背景介紹 214
8.1.3 實(shí)驗(yàn)內(nèi)容與步驟 218
8.2 海洋目標(biāo)檢測應(yīng)用開發(fā)實(shí)驗(yàn) 219
8.2.1 實(shí)驗(yàn)?zāi)康?219
8.2.2 背景介紹 219
8.2.3 實(shí)驗(yàn)內(nèi)容與步驟 223
參考文獻(xiàn) 226