王琦 共有1条记录 共耗时[0.000]秒
页码:1/1    每页显示:10 记录 跳转:
作者:"王琦, 杨毅远, 江季"
  • 正在加载图片,请稍后......

    Easy RL: 强化学习教程:王琦, 杨毅远, 江季

    作者:王琦, 杨毅远, 江季 出版社:人民邮电出版社 出版时间:20220101 ISBN:978-7-115-58470-0
    索书号:TP181/448 分类号:TP181 页数:245页 价格:CNY99.90
    复本数: 在馆数:
    累借天数: 累借次数:
    本书结合了李宏毅老师的“深度强化学习”、周博磊老师的“强化学习纲要”、李科浇老师的“世界冠军带你从零实践强化学习”公开课的精华内容, 在理论严谨的基础上深入浅出地介绍马尔可夫决策过程、蒙特卡洛方法、时序差分方法、Sarsa、Q学习等传统强化学习算法, 以及策略梯度、近端策略优化、深度Q网络、深度确定性策略梯度等常见深度强化学习算法的基本概念和方法, 并以大量生动有趣的例子帮助读者理解强化学习问题的建模过程以及核心算法的细节。
    详细信息
    索书号 展开
缩小检索范围
王琦 共有1条记录 共耗时[0.000]秒
页码:1/1    每页显示:10 记录 跳转: