最优控制求解停车问题.docxVIP

下载本文档

112
0
约1.66千字
约 11页
2016-08-24 发布于湖北
举报
版权申诉

最优控制求解停车问题.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

最优控制求解停车问题

停车问题1问题描述如下图所示，考虑一个10m*7m大小的停车场，将车从如下初始位置停到停车场中任意位置，如图停车位置1—4所示。图1 问题描述示意图2数学模型车的模型示意图如下所示，则可以得到如下数学模型方程式：（1）图2 车的模型示意图3 问题求解3.1 变分法求解最优控制定义如下性能指标函数：（2）通过构建Hamiltonian求解，并采用数值法求解两点边值问题。（1）停车位置1：图3变分法求解结果（停车位置1）（2）停车位置3图4变分法求解结果（停车位置3）3.2 动态规划法求解最优控制定义如下性能指标函数：（3）采用离散动态规划求解，分别将时间、状态量、控制量、状态方程和性能指标函数离散化。分别尝试不同的离散化程度。（1）第一次离散化求解：运行时间（1120s）离散化后的维度为：时间（150）；状态（4*10*2*3*6）；控制（6*6）图5动态规划求解结果（第一次离散化）（2）第二次离散化求解：运行时间（70291s）离散化后的维度为：时间（30）；状态（10*25*12*16*15）；控制（15*15）图6 动态规划求解结果（第二次离散化）3.3 直接打靶法求解最优控制定义如下性能指标函数：（4）采用SQP方法求解，结果如下：（1）停车位置1图7 直接打靶法求解结果（停车位置1）（2）停车位置3图8直接打靶法求解结果（停车位置3）3.4 模型预测控制求解最优控制定义如下性能指标函数：（5）预测步长，控制步长。（1）停车位置1图9模型预测控制求解结果（停车位置1）（2）停车位置3图10模型预测控制求解结果（停车位置3）3.5自适应动态规划求解最优控制（尝试）首先采用经典的HDP92方法进行尝试，但多次试验的效果都不好；之后尝试每次用数值法求解最优的控制量，但效果依旧很差；然后采用值迭代的方法，并尝试用二次型近似值函数和神经网络近似值函数两种方式，但是最后的效果依旧很差（包括一般值迭代和广义值迭代）。（上述方法对PPT上的例子，效果还不错）4 结果分析变分法求解最优控制：针对本问题这样一个相对复杂的模型，变分法无法很好地处理控制量和状态量的约束。而且在求解过程中，由于无法得到解析解，因而需要采用数值法求解一个两点边值问题。而在采用BVP4C求解时，需要经过多次初值选择试凑，才能保证可解，否则BVP4C无法求解。因此只能采用自己编写打靶法程序求解，致使最后的求解结果不是特别好（速度在刚开始一下增加到很大，即加速度过大；针对停车位置3，路径曲线不是很光滑）。另外，所得结果是一个开环控制。离散动态规划求解最优控制：如果对时间、状态、控制的离散化程度太低，则求解结果很差；当增加离散化程度，求解结果有一定的改善，但还远远不够，需要继续提高离散化程度。然而，由于本问题状态量的维数较大，此时将导致维数灾难问题。第二次离散化求解的运行时间为70291s（19个多小时），如果继续增加离散化程度，虽然求解结果会更加好，但求解时间会更长。而针对本问题，如此长的求解时间是没有太多价值的。直接打靶法求解最优控制：相比变分法，求解结果更加好。而且可以比较好地处理控制量和状态量的约束。但是，最后时刻的控制并不是0，而在实际停车过程中最后时刻控制应该为0。另外，所得结果是一个开环控制。模型预测控制求解最优控制：同样可以比较好地处理控制量和状态量的约束。而且相比直接打靶法求解，最后时刻的控制能缓慢变为0。另外，所得结果是一个近似闭环控制，这在实际停车过程中是很有必要的，因为车的每一步运动都会有误差。自适应动态规划求解最优控制：我们尝试了几种自适应动态规划的方法，但效果都不是很好。针对PPT上的例子，这些方法的效果还可以。在这些例子中，系统最后的稳定状态都是0，而且控制的目标是要使状态尽可能快得到0。然后，停车问题和这些例子不太相同，并不是使车一下停到终点，状态应该缓慢变化。所以，可能这些方法不能直接应用于本问题，需要将问题和方法都进行一定的修改，但限于时间因素和自身水平有限，我们没能尝试成功。