![]() ![]() |
強化學習——從原理到實踐
"本書是對強化學習算法的綜合性講解書籍,內容包括主要的強化學習算法的實現思路講解,以及主要的優(yōu)化方法的原理講解。本書介紹的每個算法都分為原理講解和代碼實現兩部分,代碼實現是為了通過實驗驗證原理部分的可行性。通過本書的學習,讀者可以快速地了解強化學習算法的設計原理,掌握強化學習算法的實現過程,并能研發(fā)屬于自己的強化學習算法,了解各個算法的優(yōu)缺點,以及各個算法適用的場景。
本書共18章,分為強化學習基礎篇(第1章和第2章)介紹了強化學習中的基本概念。強化學習基礎算法篇(第3~6章)介紹了QLearning算法、SARSA算法、DQN算法、Reniforce算法。強化學習高級算法篇(第7~12章)介紹了AC演員評委算法、A2C優(yōu)勢演員評委算法、PPO近端策略優(yōu)化算法、DDPG深度確定性策略梯度算法、TD3雙延遲深度確定性策略梯度算法、SAC柔性演員評委算法、模仿學習算法。多智能體篇(第13章和第14章),介紹了在一個系統(tǒng)中存在多智能體時,各個智能體之間的合作、對抗等關系,以及各個智能體之間的通信策略。擴展算法篇(第15~17章)介紹了CQL離線學習算法、MPC環(huán)境學習算法、HER目標導向算法。SB3強化學習框架篇(第18章),介紹了強化學習框架SB3的使用方法。 本書將使用最簡單淺顯的語言,帶領讀者快速地了解各個主要的強化學習算法的設計思路,以及實現過程。通過本書各個章節(jié)的學習,讀者可以掌握主流的強化學習算法的原理和實現方法,能夠讓讀者知其然也知其所以然,做到融會貫通。 "
你還可能感興趣
我要評論
|