- 1、本文档共70页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Abstract
disturbance are zero—sumand
obtained.Thereafter,the
inputsignal two-playergame
ADP
continuous·timeCGAREaresolvedmeansofanovelonline
by approach.The
ofthenovel iteration isalsoestablished.At
convergence policy algorithm last,
simulationresultshaveverifiedthe ofthenewonline
applicability algorithm.
5.Conclusionsare in 5.Andsome ontheresearch
givenChapter suggestions
totheIRL—based controller for
worksrelated optimal designproblems
Markov alsoare inthis
continuous/discrete-time
jumpsystem given chapter.
Keywords:Markovianjumpingsystems;Reinforcement
Method;Online.
Transformation;LeastSquare
DynamicProgramming;Subsystems
V
目录
目录
摘要…………………………………………...………………………...……………一I
Abstract.………………………………………………………………………………………………………..III
目勇乏………………………:……………………………………………………………………………………。VI
第一章绪论…………………………………………………………………………..1
1.1随机Markovian跳变系统及最优控制研究现状……….■………………1
1.2基于强化学习求解优化控制问题的研究现状…………………………….2
、
1.3本文的创作动机及创新点………………………………………………….3
1.4本文的结构安排…………………………………………………………….4
第二章连续时间线性随机Markovian跳变系统的最优化控制器在线设计算法
研究…………………………………………………………………………………….5
2.1问题描述……………-………………………………………………………5
2.2并行算法离线求解耦合代数Riccati方程…………………………………8
2.3子系统转换…………………………………………………………………一9
2.4一种新的策略迭代算法……………………………………………………
您可能关注的文档
最近下载
- 2025年江西工业贸易职业技术学院单招职业适应性测试题库参考答案.docx VIP
- DLT866-2015 电流互感器和电压互感器选择及计算规程.docx
- 文化娱乐产业市场调查及内容创新方案.doc VIP
- 粤人社发【2012】70号关于事业单位岗位设置和聘用后工资及退休等问题处理办法的通知.pdf VIP
- 2025年检验检测机构资质认定内审员考试复习资料 .pdf VIP
- 调色师:达芬奇视频剪辑调色从入门到精通第1章 认识达芬奇软件.pptx VIP
- 发展老年助浴助洁服务实施方案.docx
- 1094.11-2022 电力变压器 第11部分:干式变压器.pdf
- 林业资产评估合同范本.docx VIP
- “燕园元培杯”2023-2024 学年全国中学生地球科学奥林匹克竞赛预赛试题.pdf VIP
文档评论(0)