書(shū)單推薦
更多
新書(shū)推薦
更多

控制系統(tǒng)與強(qiáng)化學(xué)習(xí) [美]肖恩·梅恩

 控制系統(tǒng)與強(qiáng)化學(xué)習(xí) [美]肖恩·梅恩

定  價(jià):149 元

叢書(shū)名:工業(yè)自動(dòng)化與智能化叢書(shū)

        

當(dāng)前圖書(shū)已被 1 所學(xué)校薦購(gòu)過(guò)!
查看明細(xì)

  • 作者:[美]肖恩·梅恩(Sean Meyn)
  • 出版時(shí)間:2025/5/1
  • ISBN:9787111775768
  • 出 版 社:機(jī)械工業(yè)出版社
  • 中圖法分類:TP271 
  • 頁(yè)碼:
  • 紙張:膠版紙
  • 版次:
  • 開(kāi)本:16開(kāi)
9
7
7
8
7
7
5
1
7
1
6
1
8
一個(gè)高中生可以創(chuàng)建深度的Q-learning代碼來(lái)控制她的機(jī)器人,卻不了解 "深度 "或 "Q "的含義,也不知道為什么代碼有時(shí)會(huì)失敗。本書(shū)旨在以具有微積分和矩陣代數(shù)背景的學(xué)生可以理解的方式,解釋強(qiáng)化學(xué)習(xí)和優(yōu)化控制背后的科學(xué)。本書(shū)的一個(gè)獨(dú)特重點(diǎn)是算法設(shè)計(jì),以獲得學(xué)習(xí)算法的快收斂速度,以及對(duì)強(qiáng)化學(xué)習(xí)有時(shí)失敗的原因的洞察。一開(kāi)始就避開(kāi)了高級(jí)隨機(jī)過(guò)程理論,用更直觀的確定性探測(cè)來(lái)代替學(xué)習(xí)的隨機(jī)探索。一旦理解了這些思想,掌握植根于隨機(jī)控制的技術(shù)就不難了。這些主題在本書(shū)的第二部分有所涉及,從馬爾科夫鏈理論開(kāi)始,以對(duì)強(qiáng)化學(xué)習(xí)的行為者批評(píng)方法的全新審視結(jié)束。
 你還可能感興趣
 我要評(píng)論
您的姓名   驗(yàn)證碼: 圖片看不清?點(diǎn)擊重新得到驗(yàn)證碼
留言內(nèi)容