- 4
- 0
- 约1.68千字
- 约 11页
- 2016-12-29 发布于北京
- 举报
Initialize matrix Q as zero matrix For each episode: Select random initial state Do while not reach goal state Select one among all possible actions for the current state Using this possible action, consider to go to the next state Get maximum Q value of this next state based on all possible actions Compute Set the next state as the current state End Do End For * Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. Evaluatio
您可能关注的文档
- 车架纵梁和副梁之间垫木的模型建立.ppt
- 车模型.ppt
- 软件作业解答.ppt
- 软件工程 第3章 ppt.ppt
- 车讯网五一嘉年华.ppt
- 跨世纪超级节能发动机.ppt
- 运动镜头.ppt
- 运输决策与优化.ppt
- 软件设计与体系结构 秦航.ppt
- 运动生物力学多媒体教学2(第二章).ppt
- 2026住宅小区消防改造建筑方案(执行版,含总平面布置/疏散流线/消防节点).docx
- 2026制造工厂人力资源规划与排班配置方案(执行版,含排班模型/岗位编制/缺口清单).docx
- 2026人工智能企业内训实施计划(执行版,含培训安排/案例任务/考核清单).docx
- 2026仓储物流园总平面布置建筑方案(执行版,含车流组织/仓位分区/消防间距).docx
- 2026老旧办公楼节能改造建筑方案(执行版,含围护结构/节能设备/施工节点).docx
- 2026Python文件批量重命名与归档脚本方案(执行版,含文件样例/处理脚本/归档规则).docx
- 2026企业会计准则长期股权投资核算指南(执行版,含成本法分录/权益法分录/减值检查表).docx
- 2026社区养老服务中心项目可行性研究报告(执行版,含服务需求/建设内容/运营预算).docx
- 2026物流园冷链仓储项目可行性研究报告(执行版,含选址分析/设备配置/财务测算).docx
- 2026企业会计准则现金流量表编制口径手册(执行版,含分类口径/填报模板/勾稽检查表).docx
原创力文档

文档评论(0)