DeepSeek實(shí)戰(zhàn):從提示詞到部署和實(shí)踐
定 價(jià):68 元
當(dāng)前圖書已被 1 所學(xué)校薦購(gòu)過(guò)!
查看明細(xì)
- 作者:張成文
- 出版時(shí)間:2025/4/1
- ISBN:9787121500312
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:TP18
- 頁(yè)碼:294
- 紙張:
- 版次:01
- 開本:16開
本書旨在提供一份全面、易懂的DeepSeek大模型實(shí)戰(zhàn)內(nèi)容,通過(guò)深入淺出的講解,幫助讀者快速掌握DeepSeek的核心技術(shù)和應(yīng)用場(chǎng)景。本書不僅涵蓋了DeepSeek的技術(shù)原理、架構(gòu)設(shè)計(jì)和訓(xùn)練方法,還詳細(xì)介紹了如何通過(guò)API調(diào)用、本地部署和云服務(wù)等方式將DeepSeek集成到實(shí)踐項(xiàng)目中。此外,本書通過(guò)大量實(shí)例和案例分析,展示了DeepSeek在不同領(lǐng)域的應(yīng)用實(shí)踐,幫助讀者更好地理解和應(yīng)用這一強(qiáng)大的工具。本書圖文并茂,理論翔實(shí),案例豐富,適合從事DeepSeek開發(fā)的科研人員以及廣大的開發(fā)者作為技術(shù)參考和培訓(xùn)資料,亦可作為高校本科生和研究生的教材。
張成文,北京郵電大學(xué)副教授,中國(guó)人工智能學(xué)會(huì)高級(jí)會(huì)員、中國(guó)教育發(fā)展戰(zhàn)略學(xué)會(huì)人工智能與機(jī)器人專委會(huì)理事、中國(guó)生物醫(yī)學(xué)工程學(xué)會(huì)醫(yī)學(xué)人工智能分會(huì)委員、中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟產(chǎn)學(xué)研工作組副組長(zhǎng)
目 錄
第1章 DeepSeek初探 1
1.1 大模型的定義 2
1.2 從GPT到DeepSeek 3
1.2.1 GPT模型的發(fā)展脈絡(luò) 4
1.2.2 DeepSeek模型的發(fā)展脈絡(luò) 7
1.2.3 技術(shù)突破:從全球競(jìng)速到本土創(chuàng)新 10
1.2.4 應(yīng)用生態(tài)的進(jìn)化:從工具到生態(tài)伙伴 11
1.3 DeepSeek的核心能力和獨(dú)特優(yōu)勢(shì) 12
1.3.1 核心能力 12
1.3.2 獨(dú)特優(yōu)勢(shì) 14
1.4 DeepSeek的應(yīng)用場(chǎng)景 16
1.4.1 智能客服 16
1.4.2 輔助辦公 18
1.4.3 智能家居 20
1.4.4 醫(yī)療診斷 21
1.4.5 教育學(xué)習(xí) 22
1.4.6 金融投資 24
1.4.7 智能政務(wù) 24
1.5 DeepSeek帶來(lái)的機(jī)遇 25
1.5.1 DeepSeek模型帶給個(gè)人的機(jī)遇 26
1.5.2 DeepSeek帶給中小企業(yè)的機(jī)遇 28
小結(jié) 30
第2章 DeepSeek的模型架構(gòu) 32
2.1 DeepSeek-V3/R1模型的架構(gòu) 33
2.2 混合專家 35
2.2.1 稠密MoE架構(gòu)和稀疏MoE架構(gòu) 36
2.2.2 DeepSeekMoE 37
2.2.3 無(wú)輔助損耗負(fù)載均衡 39
2.3 多頭潛在注意力 41
2.3.1 鍵值緩存簡(jiǎn)介 41
2.3.2 RoPE簡(jiǎn)介 43
2.3.3 傳統(tǒng)MHA的緩存機(jī)制的不足 46
2.3.4 低秩鍵值聯(lián)合壓縮的注意力機(jī)制 47
2.4 多Token預(yù)測(cè) 52
2.4.1 塊級(jí)并行解碼策略 53
2.4.2 Meta的MTP方法 53
2.4.3 DeepSeek的MTP方法 54
小結(jié) 56
第3章 DeepSeek的訓(xùn)練架構(gòu) 57
3.1 DeepSeek的訓(xùn)練 58
3.1.1 基礎(chǔ)技術(shù) 58
3.1.2 訓(xùn)練過(guò)程 61
3.2 DeepSeek在硬件層面的訓(xùn)練亮點(diǎn) 62
3.2.1 FP8混合精度訓(xùn)練 62
3.2.2 DualPipe算法 63
3.3 DeepSeek在算法層面的訓(xùn)練亮點(diǎn) 66
3.3.1 組相對(duì)策略優(yōu)化 67
3.3.2 知識(shí)蒸餾 69
3.4 DeepSeek的數(shù)據(jù)優(yōu)化手段 70
小結(jié) 72
第4章 高質(zhì)量提示詞 74
4.1 提示詞概述 75
4.1.1 提示詞的定義 75
4.1.2 提示詞的種類 76
4.2 新手常見(jiàn)誤區(qū)和陷阱 77
4.3 提示詞的設(shè)計(jì)技巧 79
4.3.1 STAR法則:讓問(wèn)題更有條理 79
4.3.2 5W2H法則:全面提問(wèn)的利器 80
4.3.3 CO-STAR框架:精準(zhǔn)表達(dá)需求 82
4.3.4 CRISPE框架:激發(fā)創(chuàng)意和拓展深度 85
4.3.5 BROKE框架:目標(biāo)導(dǎo)向和持續(xù)優(yōu)化 86
4.3.6 借助大模型優(yōu)化提示詞 88
4.4 企業(yè)層面的提示詞應(yīng)用場(chǎng)景 92
4.4.1 傳播策略制定 92
4.4.2 執(zhí)行發(fā)展制定 93
4.4.3 品牌故事生成 94
4.4.4 產(chǎn)品定位 96
小結(jié) 97
第5章 面向個(gè)人的DeepSeek部署 98
5.1 DeepSeek的模型 99
5.1.1 DeepSeek模型的常見(jiàn)版本 99
5.1.2 DeepSeek模型的版本說(shuō)明 100
5.1.3 DeepSeek模型的開源協(xié)議 101
5.2 硬件需求和配置建議 103
5.2.1 存儲(chǔ)精度 103
5.2.2 顯存占用估算 105
5.3 軟件環(huán)境安裝和配置 107
5.3.1 Ollama安裝 107
5.3.2 使用Ollama部署DeepSeek模型 111
5.3.3 Ollama常用API 113
5.4 DeepSeek模型下載和部署 121
5.4.1 Hugging Face社區(qū)簡(jiǎn)介 121
5.4.2 模型下載 121
5.4.3 常見(jiàn)大模型文件類型 125
5.5 使用Web UI構(gòu)建對(duì)話界面 126
5.5.1 Open-WebUI 126
5.5.2 Hollama 129
5.5.3 ChatBox 132
小結(jié) 133
第6章 面向企業(yè)的DeepSeek API調(diào)用 135
6.1 API調(diào)用的優(yōu)勢(shì) 136
6.2 常用DeepSeek API調(diào)用方式 137
6.2.1 DeepSeek官方開放平臺(tái) 137
6.2.2 DMXAPI 144
小結(jié) 148
第7章 面向企業(yè)的DeepSeek云服務(wù)部署 149
7.1 本地部署與云服務(wù)部署的對(duì)比 150
7.1.1 本地部署的特點(diǎn) 150
7.1.2 云服務(wù)部署的特點(diǎn) 151
7.2 模型推理加速框架 152
7.2.1 推理加速框架的必要性 153
7.2.2 BladeLLM 153
7.2.3 SGLang 156
7.2.4 vLLM 159
7.3 常用DeepSeek云服務(wù)部署方式 164
7.3.1 阿里云 164
7.3.2 騰訊云 171
7.3.3 華為云 176
7.3.4 火山引擎 181
7.3.5 AutoDL 187
小結(jié) 198
第8章 DeepSeek模型訓(xùn)練 199
8.1 常用訓(xùn)練框架 200
8.1.1 Unsloth 200
8.1.2 TRL 201
8.2 DeepSeek模型的SFT訓(xùn)練 202
8.2.1 算力租用 202
8.2.2 模型下載和部署 204
8.2.3 數(shù)據(jù)預(yù)處理 207
8.2.4 模型訓(xùn)練 208
8.2.5 模型推理 210
8.3 DeepSeek模型的GRPO訓(xùn)練 212
8.3.1 加載模型 212
8.3.2 配置PEFT模型 213
8.3.3 數(shù)據(jù)集準(zhǔn)備 213
8.3.4 模型訓(xùn)練 216
8.3.5 模型推理 217
小結(jié) 219
第9章 DeepSeek的RAG實(shí)戰(zhàn) 220
9.1 用LangChain構(gòu)建簡(jiǎn)單的RAG本地系統(tǒng) 221
9.1.1 RAG管道構(gòu)建 221
9.1.2 向量數(shù)據(jù)庫(kù)構(gòu)建 223
9.1.3 Web頁(yè)面啟動(dòng) 225
9.2 開源DeepSeek RAG應(yīng)用案例 227
9.2.1 Local PDF Chat RAG 227
9.2.2 RAG Flow 231
小結(jié) 239?
第10章 DeepSeek的Agent實(shí)戰(zhàn) 241
10.1 基于LlamaIndex項(xiàng)目構(gòu)建簡(jiǎn)單的智能體應(yīng)用 242
10.1.1 軟件安裝和模型下載 243
10.1.2 構(gòu)建本地知識(shí)庫(kù) 245
10.1.3 實(shí)現(xiàn)基于本地知識(shí)庫(kù)的智能體問(wèn)答 246
10.2 基于Swarm框架構(gòu)建智能體應(yīng)用 250
10.2.1 Swarm框架介紹 251
10.2.2 DeepSeek模型接入 253
10.2.3 調(diào)用外部工具 255
10.3 開源Agent應(yīng)用框架 260
10.3.1 Browser Use 260
10.3.2 Camel 268
小結(jié) 279
參考文獻(xiàn) 281