- 8
- 0
- 约1.81万字
- 约 31页
- 2021-06-07 发布于山西
- 举报
PAGE
PAGE III
PAGE I
摘 要
强化学习可以算作是这几年来在人工智能和机器学习研究领域内非常热门的项目,而在强化学习与监督学习中有着许多不同之处。强化学习不需要教师信号,但是它也不等同于只能够完成有限功能的无监督学习,而这种无监督学习在学习过程中无法得到提示。强化学习强调能够获得评价性反馈信号,并且使用评价信息来达到行为决策上的优化。显而易见,强化学习具有广阔的前景。
复杂系统控制中有许多经典的问题,倒立摆就是其中之一。倒立摆系统是一种绝对不稳定的,具有非线性、多变量等多种性质的系统。而在控制过程中,倒立摆系统也是一个验证各种控制理论的很理想的模型之一。它可以反映例如可镇定性、鲁棒性和随动性等等问题。近代以来,倒立摆系统广泛应用于我们的生活当中。卫星的运行、机器人的行走等都是运用了类似倒立摆系统稳定控制的例子。显而易见倒立摆的研究具有其深刻的理论意义和重要的工程意义。
在本次的课题中,我们会以大学四年相关的学习内容作为基础,把强化学习作为研究对象,将倒立摆系统作为实验模型,进行系统科学的实验研究。我们会通过对一级单臂倒立摆的平衡控制进行研究,使系统具备学习能力,并且可以在运行的过程中获得新的内容和信息,具有类似生物的运动控制技能。本课题在强化学习和Python语言的基础上,提出了基于Q学习的的强化学习系统。我们用Pycharm进行实验仿真,证明提出的强化学习系统具有认知倒立摆系统的平衡控制技能的能力。
关键词 强化学习,Q学习算法,倒立摆系统
ABSTRACT
There are many classic problems in complex system control, the inverted pendulum is one of them. The inverted pendulum system is an absolutely unstable system with nonlinear and multivariable properties. In the control process, the inverted pendulum system is also one of the ideal models to verify various control theories. It can reflect such problems as stability, robustness and follow - up. Since modern times, the inverted pendulum system has been widely used in our life. Satellite operation, robot walking and so on are the use of the inverted pendulum system stability control examples. Obviously, the research of inverted pendulum has profound theoretical significance and important engineering significance.
In this project, we will take the relevant learning content in the four years of college as the basis, take reinforcement learning as the research object, and take the inverted pendulum system as the experimental model to conduct systematic scientific experimental research. We will study the balance control of a one-arm inverted pendulum to make the system capable of learning and acquire new contents and information in the process of operation, with the movement control skills similar to those of living creatures. Based on reinforcement learning and Python language, this paper proposes a reinforcement learning s
您可能关注的文档
- 海尔集团发展战略研究.docx
- 化工反应釜领域专利布局分析毕业论文资料材料.docx
- 会计海马汽车偿债能力现状资料材料.docx
- 机便捷式家用风力发电机设计.docx
- 机械制造及其自动化专业 机电一体化技术在煤矿机械中的应用.doc
- 基于分子动力学的石墨烯摩擦学规律分析.doc
- 基于机器学习的H型钢力学性能与成分优化研究资料材料.doc
- 基于模型检验的需求不一致与冲突消解的研究 资料材料.docx
- 金融衍生工具分析研究 会计学专业.doc
- 金融证券行业IT项目管理应用和行业发展策略研究 证券学专业开题报告.doc
- 2025-2026学年科普版七年级下册英语Unit7 Being a Smart Shopper素养测评卷(含答案).docx
- 2025-2026学年科普版七年级下册英语Unit10 Lending a Helping Hand素养测评卷(含答案).docx
- 2025-2026学年科普版七年级下册英语Unit11 Rules Matter素养测评卷(含答案).docx
- 2025-2026学年科普版七年级下册英语Unit12 Better Together素养测评卷(含答案).docx
- 2026年中考英语语法选择专题训练(含答案).docx
- 2026中考语文二轮学思并重,涵养君子之德论语十二章、虽有佳肴、大道之行也.docx
- 中考文言文常见文化常识梳理.docx
- 中考语文二轮:内修君子德外尽忠臣心诚子书出师表修身立德主题学习.docx
- 中考语文二轮:不一样的求学路一样的成长梦送东阳马生序劝学主题学习.docx
- 中考语文二轮:《陋室铭》《爱莲说》托物寓意主题学习.docx
最近下载
- 质量检验员培训课件.ppt VIP
- 一种预制装配式风机基础、风机及施工方法.pdf VIP
- 2023年岳阳市初中学业水平考试数学试卷参考答案 .pdf VIP
- 2026年大庆医学高等专科学校单招职业技能考试题库及答案详解(全优).docx VIP
- 《养老机构智慧运营与管理》教学设计——项目8 养老机构的风险管理与安全管理.docx VIP
- 2025年国际注册内部审计师(CIA)资格考试(内部审计基础)历年参考题库含答案详解.docx VIP
- 北师大版高一下学期数学(必修二)《1.2 任意角》同步练习题及答案.docx VIP
- 健美操教学计划与教案.docx VIP
- 新闻学西方媒介理论.pptx VIP
- 公消(2016)113号-关于加强超大城市综合体消防安全工作的指导意见标准.pdf VIP
原创力文档

文档评论(0)