每页显示
排序选项
排序方式
-
强化学习:(英) 菲尔·温德尔, Phil Winder, 邹伟, 康俊鹏, 王伟
作者:(英) 菲尔·温德尔, Phil Winder, 邹伟, 康俊鹏, 王伟
出版社:中国电力出版社
出版时间:20230101
ISBN:978-7-5198-6961-8
索书号:TP181/557
分类号:TP181
页数:20, 427页
价格:CNY128.00
复本数:
在馆数:
累借天数:
累借次数:
本书共11章, 内容包括:强化学习概述、马尔可夫决策过程, 动态规划, 蒙特卡洛方法、时序差分学习, Q学习和n步算法、深度Q网络、梯度策略等。