99麻豆久久精品一区二区,在线观看麻豆视频

歡迎進(jìn)入網(wǎng)上館配會(huì)薦購選采服務(wù)平臺(tái) 圖書館單位會(huì)員注冊(cè) 圖書館讀者/館員登錄

書單推薦

·二十四節(jié)氣｜夏至

·科學(xué)出版社精品典藏

·清華大學(xué)出版社—2024年度好

·二十四節(jié)氣 | 立春

·二十四節(jié)氣│大寒

·二十四節(jié)氣│小寒

·二十四節(jié)氣 | 冬至

·二十四節(jié)氣 | 大雪

新書推薦

更多

·牛奶：從地方史走向全球史

·全球?qū)υ捴髁x（第二版）

·李清照的詩詞人生

·笑對(duì)健康

·以數(shù)學(xué)之美，啟數(shù)學(xué)之智——

·深入淺出人工智能

·文化與旅游

·全真道歷史新探

強(qiáng)化學(xué)習(xí)——從原理到實(shí)踐

強(qiáng)化學(xué)習(xí)——從原理到實(shí)踐

定　　價(jià)：69 元

叢書名：跟我一起學(xué)人工智能

當(dāng)前圖書已被 7 所學(xué)校薦購過！

查看明細(xì)

作者：李福林
出版時(shí)間：2025/3/1
ISBN：9787302682417
出版社：清華大學(xué)出版社

中圖法分類：TP181
頁碼：256
紙張：
版次：1
開本：24cm

9

7

6

8

8

7

2

3

4

0

1

2

7

讀者對(duì)象:本書適合人工智能方向的初學(xué)者閱讀, 也可作為高等院校相關(guān)專業(yè)的教材

內(nèi)容簡(jiǎn)介

"本書是對(duì)強(qiáng)化學(xué)習(xí)算法的綜合性講解書籍，內(nèi)容包括主要的強(qiáng)化學(xué)習(xí)算法的實(shí)現(xiàn)思路講解，以及主要的優(yōu)化方法的原理講解。本書介紹的每個(gè)算法都分為原理講解和代碼實(shí)現(xiàn)兩部分，代碼實(shí)現(xiàn)是為了通過實(shí)驗(yàn)驗(yàn)證原理部分的可行性。通過本書的學(xué)習(xí)，讀者可以快速地了解強(qiáng)化學(xué)習(xí)算法的設(shè)計(jì)原理，掌握強(qiáng)化學(xué)習(xí)算法的實(shí)現(xiàn)過程，并能研發(fā)屬于自己的強(qiáng)化學(xué)習(xí)算法，了解各個(gè)算法的優(yōu)缺點(diǎn)，以及各個(gè)算法適用的場(chǎng)景。
本書共18章，分為強(qiáng)化學(xué)習(xí)基礎(chǔ)篇（第1章和第2章）介紹了強(qiáng)化學(xué)習(xí)中的基本概念。強(qiáng)化學(xué)習(xí)基礎(chǔ)算法篇（第3~6章）介紹了QLearning算法、SARSA算法、DQN算法、Reniforce算法。強(qiáng)化學(xué)習(xí)高級(jí)算法篇（第7~12章）介紹了AC演員評(píng)委算法、A2C優(yōu)勢(shì)演員評(píng)委算法、PPO近端策略優(yōu)化算法、DDPG深度確定性策略梯度算法、TD3雙延遲深度確定性策略梯度算法、SAC柔性演員評(píng)委算法、模仿學(xué)習(xí)算法。多智能體篇（第13章和第14章），介紹了在一個(gè)系統(tǒng)中存在多智能體時(shí)，各個(gè)智能體之間的合作、對(duì)抗等關(guān)系，以及各個(gè)智能體之間的通信策略。擴(kuò)展算法篇（第15~17章）介紹了CQL離線學(xué)習(xí)算法、MPC環(huán)境學(xué)習(xí)算法、HER目標(biāo)導(dǎo)向算法。SB3強(qiáng)化學(xué)習(xí)框架篇（第18章），介紹了強(qiáng)化學(xué)習(xí)框架SB3的使用方法。
本書將使用最簡(jiǎn)單淺顯的語言，帶領(lǐng)讀者快速地了解各個(gè)主要的強(qiáng)化學(xué)習(xí)算法的設(shè)計(jì)思路，以及實(shí)現(xiàn)過程。通過本書各個(gè)章節(jié)的學(xué)習(xí)，讀者可以掌握主流的強(qiáng)化學(xué)習(xí)算法的原理和實(shí)現(xiàn)方法，能夠讓讀者知其然也知其所以然，做到融會(huì)貫通。
"

你還可能感興趣

我要評(píng)論

感谢您访问我们的网站，您可能还对以下资源感兴趣：

国产高清在线看a∨片

精品国产福利导航国产免费拔擦拔擦8X高清在线欧洲亚洲1卡二卡三卡2025 国产专区视频