强化学习:原理与Python实现PDF电子书 [85MB]

编程开发 stadystarting 2026-05-13 115 0 // 自建的夸克api
强化学习:原理与Python实现PDF电子书 [85MB]下载

书籍 信息

《强化学习:原理与Python实现》pdf电子书百度网盘下载
《强化学习:原理与Python实现》pdf电子书百度网盘下载


强化 学习 :原理与Python实现中文版怎么样?最新电子版百度云 下载

本书理论完备,涵盖主流 经典化学算法 和深度强化学习算法;实战性强,基于Python、Gym、TensorFlow 2、AlphaZero等构建,配套代码与综合 案例 。全书共12章,主要内容如下。

第1章:介绍强化学习的基础知识与强化学习 环境 库Gym的使用,并给出完整的 编程 实例。

第2~9章:介绍强化学习的理论知识。以Markov 决策 过程为基础模型,覆盖了所有主流强化学习理论和算法,包括资格迹等经典算法和深度确定性梯度 策略 等深度强化学习算法。所有章节都提供了与算法配套的Python程序,使读者完全掌握强化学习算法的原理与应用。

第10~12章:介绍了多个热门综合案例,包括电动 游戏 、棋盘游戏和自动驾驶。算法部分涵盖了在《 自然 》《 科学 》等权威期刊上发表的多个深度强化学习明星算法。


作者简介:
肖智清强化学习一线研发人员,清华 大学 工学 博士,现就职于 全球 知名 投资 银行 。擅长 概率 统计机器学习 ,近5年发表SCI/EI论文十余篇,是多个顶级期刊和会议审稿人。在国内外多项程序 设计数据 科学竞赛上获得冠军。

目录:
第1章 初识强化学习 1
第2章 Markov决策过程 16
第3章 有模型数值迭代 37
第4章 回合更新 价值 迭代 54
第5章 时序差分价值迭代 76
第6章 函数近似 方法 101
第7章 回合更新策略梯度方法 125
第8章 执行者/ 评论 者方法 139
第9章 连续 动作 空间 的确定性策略 172
第10章 综合案例:电动游戏 188
第11章 综合案例:棋盘游戏 200
第12章 综合案例:自动驾驶 226

书籍下载

夸克网盘下载(文件解压密码 123456 )



百度网盘下载   提取码: 9491



迅雷网盘下载
网盘资源链接限时分享

夸克资源精选合集