- 1、本内容来自版权合作机构,您在本站购买的阅读使用权仅限于您本人阅读使用,您不得/不能给任何第三方使用,由此造成的一切相关后果本平台保留向您追偿索赔的权利!版权所有,后果自负!
- 2、本文档为正版电子图书,虚拟物品付费之后概不接收任何理由退款。
查看更多
第12章强化学习|尽管策略迭代算法可以收敛到最优策略,但其中的策略评估步骤也包含迭代,因而增大了计算量。我们可以在不影响收敛性的情况下减少策略评估步骤的迭代次
文档评论(0)