
《深度强化学习实践(原书第2版)》的主题是强化学习(Reinforcement Learning,RL),它是机器学习(Machine Learning,ML)的一个分支,强调如何解决在复杂 环境 中选择最优 动作 时产生的通用且极具挑战的问题。学习过程仅由奖励值和从环境中获得的观察驱动。该模型非常通用,能应用于多个真实场景,从玩 游戏 到优化复杂制造过程都能涵盖。
马克西姆·拉潘(Maxim Lapan)是一位深度学习爱好者和独立研究者。作为一名 软件开发 人员和系统架构师,他拥有15年的工作经验,涉及从底层Linux内核驱动程序开发到性能优化以及在数千台服务器上工作的分布式应用 程序设计 的方方面面。他在 大数据 、机器学习以及大型并行分布式HPC和非HPC系统方面也拥有丰富的经验,能够用简单的词汇和生动的示例来解释复杂的事物。他目前感兴趣的领域涉及深度学习的实际应用,例如深度 自然语言处理 和深度强化学习。
马克西姆与家人一起住在俄罗斯莫斯科。
评论列表
发表评论