强化学习：原理与Python实现PDF电子书 [85MB]-盘天下资源网

书籍 信息

强化学习：原理与Python实现中文版怎么样?最新电子版百度云下载

本书理论完备，涵盖主流经典强化学习算法和深度强化学习算法；实战性强，基于Python、Gym、TensorFlow 2、AlphaZero等构建，配套代码与综合案例。全书共12章，主要内容如下。

第1章：介绍强化学习的基础知识与强化学习环境库Gym的使用，并给出完整的编程实例。

第2～9章：介绍强化学习的理论知识。以Markov 决策过程为基础模型，覆盖了所有主流强化学习理论和算法，包括资格迹等经典算法和深度确定性梯度策略等深度强化学习算法。所有章节都提供了与算法配套的Python程序，使读者完全掌握强化学习算法的原理与应用。

第10～12章：介绍了多个热门综合案例，包括电动游戏、棋盘游戏和自动驾驶。算法部分涵盖了在《自然》《科学》等权威期刊上发表的多个深度强化学习明星算法。

作者简介:
肖智清强化学习一线研发人员，清华大学工学博士，现就职于全球知名投资银行。擅长概率统计和机器学习，近5年发表SCI/EI论文十余篇，是多个顶级期刊和会议审稿人。在国内外多项程序设计和数据科学竞赛上获得冠军。

目录:
第1章　初识强化学习 1
第2章　Markov决策过程 16
第3章　有模型数值迭代 37
第4章　回合更新价值迭代 54
第5章　时序差分价值迭代 76
第6章　函数近似方法 101
第7章　回合更新策略梯度方法 125
第8章　执行者/ 评论者方法 139
第9章　连续动作空间的确定性策略 172
第10章　综合案例：电动游戏 188
第11章　综合案例：棋盘游戏 200
第12章　综合案例：自动驾驶 226