性视频亚洲资源在线,久久99这里只有是精品6

歡迎進入網(wǎng)上館配會薦購選采服務平臺圖書館單位會員注冊圖書館讀者/館員登錄

書單推薦

更多

·二十四節(jié)氣｜處暑

·二十四節(jié)氣｜立秋

·二十四節(jié)氣｜大暑

·二十四節(jié)氣｜夏至

·科學出版社精品典藏

·清華大學出版社—2024年度好

·二十四節(jié)氣 | 立春

·二十四節(jié)氣│大寒

新書推薦

更多

·《中國經(jīng)濟學(2025年第2輯總

·《行為博弈》

·《神經(jīng)網(wǎng)絡設計與應用》

·《精準落實》

·《新生物學本質(zhì)主義研究》

·《賞文物話中醫(yī)》

·《把熱愛變成事業(yè)》

大模型訓練與推理加速實戰(zhàn)：基于CUDA計算平臺（Python版）

定　　價：129 元

當前圖書已被 4 所學校薦購過！

查看明細

作者：溫浩
出版時間：2025/7/1
ISBN：9787121505430
出版社：電子工業(yè)出版社

中圖法分類：TP181；TP312.8
頁碼：464
紙張：
版次：01
開本：16開

9

7

5

8

0

7

5

1

4

2

3

1

0

讀者對象:本書兼具理論深度與工程實用性，適合從事深度學習系統(tǒng)優(yōu)化的研究人員、高性能計算工程師及希望掌握GPU加速部署的開發(fā)者參考使用，是一本面向大模型時代的CUDA并行計算加速實戰(zhàn)指南。

本書深入探討深度學習模型訓練和推理加速的前沿技術(shù)，尤其是在 NVIDIA CUDA（Compute Unified Device Architecture）平臺上的應用與優(yōu)化。本書從大模型訓練的挑戰(zhàn)和分布式訓練，到 CUDA 加速推理技術(shù)，再到端側(cè)推理的優(yōu)化部署，系統(tǒng)地介紹如何利用 CUDA 平臺加速大模型的訓練與推理過程，并結(jié)合具體案例深入講解數(shù)據(jù)并行、模型并行、任務調(diào)度、負載均衡等技術(shù)。本書共 10 章，首先介紹大模型訓練面臨的計算復雜性、內(nèi)存帶寬和數(shù)據(jù)傳輸瓶頸等問題，并講解基于NCCL（NVIDIA Collective Communications Library）的優(yōu)化方法；然后，通過深入淺出的講解，展示如何使用 TensorRT 進行推理加速，并探討多模型并行推理架構(gòu)、混合精度訓練與推理等優(yōu)化策略；最后，詳細闡述端側(cè)推理加速，特別是在移動設備和邊緣設備中的應用，強調(diào)模型量化、裁剪等技術(shù)在推理加速中的重要作用。

你還可能感興趣

大模型訓練與推理加速實戰(zhàn)：基于CUDA計算平臺（Python版）

我要評論

感谢您访问我们的网站，您可能还对以下资源感兴趣：

国产高清在线看a∨片

精品国产福利导航国产免费拔擦拔擦8X高清在线欧洲亚洲1卡二卡三卡2025 国产专区视频