王伟 共有1条记录 共耗时[0.000]秒
页码:1/1    每页显示:10 记录 跳转:
作者:"(英) 菲尔·温德尔, Phil Winder, 邹伟, 康俊鹏, 王伟"
  • 正在加载图片,请稍后......

    强化学习:(英) 菲尔·温德尔, Phil Winder, 邹伟, 康俊鹏, 王伟

    作者:(英) 菲尔·温德尔, Phil Winder, 邹伟, 康俊鹏, 王伟 出版社:中国电力出版社 出版时间:20230101 ISBN:978-7-5198-6961-8
    索书号:TP181/557 分类号:TP181 页数:20, 427页 价格:CNY128.00
    复本数: 在馆数:
    累借天数: 累借次数:
    本书共11章, 内容包括:强化学习概述、马尔可夫决策过程, 动态规划, 蒙特卡洛方法、时序差分学习, Q学习和n步算法、深度Q网络、梯度策略等。
    详细信息
    索书号 展开
缩小检索范围
王伟 共有1条记录 共耗时[0.000]秒
页码:1/1    每页显示:10 记录 跳转: