本書對增強學(xué)習(xí)與近似動態(tài)規(guī)劃的理論、算法及應(yīng)用進(jìn)行了深入研究和論述。主要內(nèi)容包括:求解Markov鏈學(xué)習(xí)預(yù)測問題的時域差值學(xué)習(xí)算法和理論,求解連續(xù)空間Markov決策問題的梯度增強學(xué)習(xí)算法以及進(jìn)化一梯度混合增強學(xué)習(xí)算法,基于核的近似動態(tài)規(guī)劃算法,增強學(xué)習(xí)在移動機器人導(dǎo)航與控制中的應(yīng)用等。本書是作者在多個國家自然科學(xué)基金
本書在哈爾濱工業(yè)大學(xué)“自動控制原理”課程歷屆教材的基礎(chǔ)上編寫,并進(jìn)行了四次修訂。內(nèi)容包括系統(tǒng)的數(shù)學(xué)模型、時域分析法、根軌跡法、頻率特性法、典型非線性環(huán)節(jié)、計算機控制系統(tǒng)、現(xiàn)代控制理論基礎(chǔ)。最后按照全書內(nèi)容逐章介紹MATLAB的應(yīng)用,包括系統(tǒng)分析、設(shè)計和仿真框圖等。