返回检索首页

正在加载图片，请稍后......

强化学习/(英) 菲尔·温德尔, Phil Winder, 邹伟, 康俊鹏, 王伟

作者(英)菲尔·温德尔,Phil Winder,邹伟,康俊鹏,王伟
价格CNY128.00
出版者中国电力出版社
索书号TP181/557
ISBN978-7-5198-6961-8
分类号TP181
页数20, 427页
出版日期20230101
出版地北京

附件:

附注提要

本书共11章, 内容包括：强化学习概述、马尔可夫决策过程, 动态规划, 蒙特卡洛方法、时序差分学习, Q学习和n步算法、深度Q网络、梯度策略等。

(0)|| (0)

手机二维条形码

二维条形码使用说明

馆藏信息

序号	索书号	条码号	订户	馆藏地点	馆藏状态	借出日期	还回日期	流通类型	预约处理	卷册说明	登录号
1	TP181/557	A1730439	HDFT	嘉鱼分馆	入藏			外借图书			0
2	TP181/557	A1730438	HDFT	中区分馆	入藏			外借图书			0