書單推薦
更多
新書推薦
更多

深度剖析DeepSeek大模型

深度剖析DeepSeek大模型

定  價:99.9 元

        

當(dāng)前圖書已被 6 所學(xué)校薦購過!
查看明細

  • 作者:丁小晶,崔遠編著
  • 出版時間:2025/3/1
  • ISBN:9787111779223
  • 出 版 社:機械工業(yè)出版社
  • 中圖法分類:TP18 
  • 頁碼:330頁
  • 紙張:
  • 版次:1
  • 開本:24cm
9
7
7
8
7
7
9
1
2
1
2
1
3
全書共分為12章,首先介紹大模型的基礎(chǔ)知識與發(fā)展歷程,從神經(jīng)網(wǎng)絡(luò)的起源到大規(guī)模預(yù)訓(xùn)練模型的演化,再到Transformer、BERT與GPT等模型架構(gòu)的深入剖析,幫助讀者理解大模型的技術(shù)基石。其次詳細解析了DeepSeek-R1及其Zero版本在強化學(xué)習(xí)與模型架構(gòu)上的核心技術(shù),包括混合專家模型、動態(tài)學(xué)習(xí)率調(diào)度、分布式訓(xùn)練及高效推理優(yōu)化策略等。再次聚焦于模型訓(xùn)練與開發(fā)實踐,介紹API調(diào)用、上下文拼接、模型微調(diào)、知識蒸餾等關(guān)鍵技術(shù),并結(jié)合DeepSeek實際案例展示其在數(shù)學(xué)推理、代碼生成等領(lǐng)域的應(yīng)用。最后著重探討了大模型在商業(yè)化落地場景中的高級應(yīng)用,如FIM補全、多輪對話、業(yè)務(wù)代碼自動化生成以及基于云部署的智能推薦搜索系統(tǒng)等。
 你還可能感興趣
 我要評論
您的姓名   驗證碼: 圖片看不清?點擊重新得到驗證碼
留言內(nèi)容