最优控制求解停车问题.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
最优控制求解停车问题

停车问题1问题描述如下图所示,考虑一个10m*7m大小的停车场,将车从如下初始位置停到停车场中任意位置,如图停车位置1—4所示。图1 问题描述示意图2数学模型车的模型示意图如下所示,则可以得到如下数学模型方程式:(1)图2 车的模型示意图3 问题求解3.1 变分法求解最优控制定义如下性能指标函数:(2)通过构建Hamiltonian求解,并采用数值法求解两点边值问题。(1)停车位置1:图3变分法求解结果(停车位置1)(2)停车位置3图4变分法求解结果(停车位置3)3.2 动态规划法求解最优控制定义如下性能指标函数:(3)采用离散动态规划求解,分别将时间、状态量、控制量、状态方程和性能指标函数离散化。分别尝试不同的离散化程度。(1)第一次离散化求解:运行时间(1120s)离散化后的维度为:时间(150);状态(4*10*2*3*6);控制(6*6)图5动态规划求解结果(第一次离散化)(2)第二次离散化求解:运行时间(70291s)离散化后的维度为:时间(30);状态(10*25*12*16*15);控制(15*15)图6 动态规划求解结果(第二次离散化)3.3 直接打靶法求解最优控制定义如下性能指标函数:(4)采用SQP方法求解,结果如下:(1)停车位置1图7 直接打靶法求解结果(停车位置1)(2)停车位置3图8直接打靶法求解结果(停车位置3)3.4 模型预测控制求解最优控制定义如下性能指标函数:(5)预测步长,控制步长。(1)停车位置1图9模型预测控制求解结果(停车位置1)(2)停车位置3图10模型预测控制求解结果(停车位置3)3.5自适应动态规划求解最优控制(尝试)首先采用经典的HDP92方法进行尝试,但多次试验的效果都不好;之后尝试每次用数值法求解最优的控制量,但效果依旧很差;然后采用值迭代的方法,并尝试用二次型近似值函数和神经网络近似值函数两种方式,但是最后的效果依旧很差(包括一般值迭代和广义值迭代)。(上述方法对PPT上的例子,效果还不错)4 结果分析变分法求解最优控制:针对本问题这样一个相对复杂的模型,变分法无法很好地处理控制量和状态量的约束。而且在求解过程中,由于无法得到解析解,因而需要采用数值法求解一个两点边值问题。而在采用BVP4C求解时,需要经过多次初值选择试凑,才能保证可解,否则BVP4C无法求解。因此只能采用自己编写打靶法程序求解,致使最后的求解结果不是特别好(速度在刚开始一下增加到很大,即加速度过大;针对停车位置3,路径曲线不是很光滑)。另外,所得结果是一个开环控制。离散动态规划求解最优控制:如果对时间、状态、控制的离散化程度太低,则求解结果很差;当增加离散化程度,求解结果有一定的改善,但还远远不够,需要继续提高离散化程度。然而,由于本问题状态量的维数较大,此时将导致维数灾难问题。第二次离散化求解的运行时间为70291s(19个多小时),如果继续增加离散化程度,虽然求解结果会更加好,但求解时间会更长。而针对本问题,如此长的求解时间是没有太多价值的。直接打靶法求解最优控制:相比变分法,求解结果更加好。而且可以比较好地处理控制量和状态量的约束。但是,最后时刻的控制并不是0,而在实际停车过程中最后时刻控制应该为0。另外,所得结果是一个开环控制。模型预测控制求解最优控制:同样可以比较好地处理控制量和状态量的约束。而且相比直接打靶法求解,最后时刻的控制能缓慢变为0。另外,所得结果是一个近似闭环控制,这在实际停车过程中是很有必要的,因为车的每一步运动都会有误差。自适应动态规划求解最优控制:我们尝试了几种自适应动态规划的方法,但效果都不是很好。针对PPT上的例子,这些方法的效果还可以。在这些例子中,系统最后的稳定状态都是0,而且控制的目标是要使状态尽可能快得到0。然后,停车问题和这些例子不太相同,并不是使车一下停到终点,状态应该缓慢变化。所以,可能这些方法不能直接应用于本问题,需要将问题和方法都进行一定的修改,但限于时间因素和自身水平有限,我们没能尝试成功。

文档评论(0)

335415 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档