- 9
- 0
- 约1.4万字
- 约 11页
- 2016-11-24 发布于贵州
- 举报
Robocod坦克大战源码
山东师创实训文件:
Robocode 是 IBM 开发的 Java 战斗机器人平台,游戏者可以在平台上设计一个 Java 坦克。每个坦克有个从战场上收集信息的感应器,并且它们还有一个执行动作的传动器。其规则和原理类似于现实中的坦克战斗。其融合了机器学习、物理、数学等知识,是研究人工智能的很好工具。
在 Robocode 坦克程序中,很多爱好者喜欢设计一些策略与移动模式,让自己的坦克机器人能更好的赢得战斗。但是由于 Robocode 环境时刻在变化,手写的代码只能对已知的环境做一些预测,机器人不能根据环境的变化而自我学习和改善。本文中,将用强化学习实现一个机器人。使用强化学习能创建一个自适应的战斗机器人。这个机器人能在战斗中根据环境取得最好的策略,并尽力使战斗行为最佳。并在此过程中不断学习以完善自身不足。
强化学习
强化学习(reinforcement learning)是人工智能中策略学习的一种, 是一种重要的机器学习方法,又称再励学习、评价学习. 是从动物学习、参数扰动自适应控制等理论发展而来.
强化学习一词来自于行为心理学,这一理论把行为学习看成是反复试验的过程,从而把动态环境状态映射成相应的动作。它通过不断尝试错误,从环境中得到奖惩的方法来自主学习到不同状态下哪些动作具有最大的价值,从而发现或逼近能够得到最大奖励的策略。它类似于传统经验中的“吃一堑长一智”。
原理与模
您可能关注的文档
最近下载
- 包头市城市配电网“十二五”规划设计方案-baotou city power distribution network.docx VIP
- 体育场馆照明设计及检测标准.docx VIP
- 第九届哈佛大学-麻省理工数学竞赛代数题及解答.pdf
- FANUC刀纹调试案例.pptx
- 2025年上海市16区语文中考一模汇编 专题03文言文对比阅读(纯文言篇,模考真题22篇)含详解.docx VIP
- 合肥城市配电网“十二五”规划j.doc VIP
- 数控技术期末考试试题.pdf VIP
- 初中历史新课程标准(2025年修订版) .pdf VIP
- 《压缩机电气控制内部培训稿》.ppt VIP
- 农村订单定向免费医学生资格申报表.doc VIP
原创力文档

文档评论(0)