- 1、本内容来自版权合作机构,您在本站购买的阅读使用权仅限于您本人阅读使用,您不得/不能给任何第三方使用,由此造成的一切相关后果本平台保留向您追偿索赔的权利!版权所有,后果自负!
- 2、本文档为正版电子图书,虚拟物品付费之后概不接收任何理由退款。
查看更多
第12章高级深度学习279虑了当前的状态和下一步行动,然后针对状态-行动组合,返回局部奖励值。另外,在更复杂的情况下,Q-函数会结合更多状态来预测下一步状态。例
文档评论(0)