电子书 A Course in Reinforcement Learning《强化学习课程》第二版
web.mit.edu/dimitrib/www/RLCOURSECOMPLETE%202ndEDITION.pdf
作者Dimitri P. Bertsekas教授,美国工程院院士,麻省理工大学电子工程及计算机科学教授。本书着重探讨最优与次优控制问题以及离散优化,力求构建一个基于数学但又不拘泥于数学的结构化思维框架,帮助读者理解强化学习及其与决策和控制领域的紧密联系。书中强调强化学习作为解决复杂序贯决策问题的艺术与科学,并深入剖析动态规划在强化学习中的理论基石作用。