正在加载图片,请稍后......

强化学习/(英) 菲尔·温德尔, Phil Winder, 邹伟, 康俊鹏, 王伟

  • 附件:
  • 附注提要
    本书共11章, 内容包括:强化学习概述、马尔可夫决策过程, 动态规划, 蒙特卡洛方法、时序差分学习, Q学习和n步算法、深度Q网络、梯度策略等。
    (0)|| (0)

    手机二维条形码

    馆藏信息
    序号 索书号 条码号 订户 馆藏地点 馆藏状态 借出日期 还回日期 流通类型 预约处理 卷册说明 登录号
    1 TP181/557 A1730439 HDFT 嘉鱼分馆 入藏 外借图书 0
    2 TP181/557 A1730438 HDFT 中区分馆 入藏 外借图书 0