書單推薦
更多
新書推薦
更多

大模型訓(xùn)練與推理加速實(shí)戰(zhàn):基于CUDA計(jì)算平臺(tái)(Python版)

大模型訓(xùn)練與推理加速實(shí)戰(zhàn):基于CUDA計(jì)算平臺(tái)(Python版)

定  價(jià):129 元

        

  • 作者:溫浩
  • 出版時(shí)間:2025/7/1
  • ISBN:9787121505430
  • 出 版 社:電子工業(yè)出版社
  • 中圖法分類:TP181;TP312.8 
  • 頁碼:464
  • 紙張:
  • 版次:01
  • 開本:16開
9
7
5
8
0
7
5
1
4
2
3
1
0

讀者對象:本書兼具理論深度與工程實(shí)用性,適合從事深度學(xué)習(xí)系統(tǒng)優(yōu)化的研究人員、高性能計(jì)算工程師及希望掌握GPU加速部署的開發(fā)者參考使用,是一本面向大模型時(shí)代的CUDA并行計(jì)算加速實(shí)戰(zhàn)指南。

本書深入探討深度學(xué)習(xí)模型訓(xùn)練和推理加速的前沿技術(shù),尤其是在 NVIDIA CUDA(Compute Unified Device Architecture)平臺(tái)上的應(yīng)用與優(yōu)化。本書從大模型訓(xùn)練的挑戰(zhàn)和分布式訓(xùn)練,到 CUDA 加速推理技術(shù),再到端側(cè)推理的優(yōu)化部署,系統(tǒng)地介紹如何利用 CUDA 平臺(tái)加速大模型的訓(xùn)練與推理過程,并結(jié)合具體案例深入講解數(shù)據(jù)并行、模型并行、任務(wù)調(diào)度、負(fù)載均衡等技術(shù)。本書共 10 章,首先介紹大模型訓(xùn)練面臨的計(jì)算復(fù)雜性、內(nèi)存帶寬和數(shù)據(jù)傳輸瓶頸等問題,并講解基于NCCL(NVIDIA Collective Communications Library)的優(yōu)化方法;然后,通過深入淺出的講解,展示如何使用 TensorRT 進(jìn)行推理加速,并探討多模型并行推理架構(gòu)、混合精度訓(xùn)練與推理等優(yōu)化策略;最后,詳細(xì)闡述端側(cè)推理加速,特別是在移動(dòng)設(shè)備和邊緣設(shè)備中的應(yīng)用,強(qiáng)調(diào)模型量化、裁剪等技術(shù)在推理加速中的重要作用。
 你還可能感興趣
 我要評論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容