场景自适应式车辆交互行为决策与预测方法及装置与流程.docxVIP

下载本文档

45
0
约1.56万字
约 31页
2021-11-11 发布于内蒙古
举报
版权申诉

场景自适应式车辆交互行为决策与预测方法及装置与流程.docx

1、本文档共31页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

PAGE PAGE 1 场景自适应式车辆交互行为决策与预测方法及装置与流程 1.本发明涉及自动驾驶技术领域，特殊涉及一种场景自适应式车辆交互行为决策与预测办法及装置。背景技术：2.因为机器学习等人工智能领域的技术飞快进展，智能车辆是汽车行业重要进展方向之一，也是将来才智交通和才智城市建设中的核心元素。而提高智能车辆的决策能力对提升其智能化水平起着关键的作用。3.但是在现实复杂的驾驶场景中，交通参加者的行为是不确定的，时变的，且互相影响的，即存在较强的随机性、动态性和交互性。尤其在混合交通场景下，智能车辆和人类驾驶车辆并存，为了保障智能车辆的行驶平安性和稳定性，智能车辆在基于感知系统提供的信息举行行为决策时，需要同时考虑周围车辆的驾驶行为对自己行为决策的影响，以及自己的驾驶行为对周围车辆的影响。4.因此，考虑车辆间行为的交互性对提高智能车辆的决策平安性至关重要。技术实现要素：5.本发明旨在起码在一定程度上解决相关技术中的技术问题之一。6.为此，本发明的一个目的在于提出一种场景自适应式车辆交互行为决策与预测办法，能够提高智能车辆对实际交通场景的推断和预测能力，使其能够举行平安、牢靠、高效的驾驶行为决策。7.本发明的另一个目的在于提出一种场景自适应式车辆交互行为决策与预测装置。8.为达到上述目的，本发明一方面实施例提出了一种场景自适应式车辆交互行为决策与预测办法，包括以下步骤：采集本车当前时刻的驾驶环境信息，并按照所述驾驶环境信息确定本车与目标车辆当前所处的交互阶段；按照所述交互阶段确定当前时刻下车辆之间的映射模型和交互模型，并按照所述映射模型确定所述本车与所述目标车辆在当前时刻下回报函数中的最优权重因子；按照最优权重因子和所述交互模型分离确定所述本车与所述目标车辆的回报函数，并结合所述交互阶段对应的动作空间预测所述本车与所述目标车辆下一时刻的行车动作，以确定所述本车当前时刻下的最佳交互动作，并基于所述最佳交互动作控制本车自动驾驶。9.本发明实施例的场景自适应式车辆交互行为决策与预测办法，基于博弈论和逆强化学习的场景自适应式车辆交互行为决策与预测，可以用于智能车辆在动态驾驶场景中做出更合理牢靠的行为决策，同时对其他目标车辆做出相应的行为预测，具备较好的场景适应性和实时性，提升自动驾驶的牢靠性及平安性。10.另外，按照本发明上述实施例的场景自适应式车辆交互行为决策与预测办法还可以具有以下附加的技术特征：11.在本发明的一个实施例中，所述驾驶环境信息包括车辆状态信息和交通规章信息，在采集本车当前时刻的驾驶环境信息之前，还包括：定义车辆驾驶行为所对应的回报函数ui：ui＝αifuncsafety+βifuncefficiency，其中，i＝0，1，0代表本车，1代表目标车辆，funcsafety代表行驶平安函数，funcefficiency代表行驶效率函数，αi为行驶平安函数的权重因子，βi为行驶效率函数的权重因子；按照车辆所处的运动状态、车辆状态信息和交通规章信息对所述回报函数举行修正，并利用非合作静态博弈理论构建所述交互模型，其中，所述交互模型包括交互对象集合p、动作空间a、回报函数u、混合策略解σ。12.在本发明的一个实施例中，按照车辆所处的运动状态、车辆状态信息和交通规章信息对所述回报函数举行修正，包括：当车辆处于横向偏移运动状态时，按照本车与正前方车辆、目标车道前方车辆、目标车道后方车辆的碰撞风险对所述行驶平安函数举行修正，按照本车速度、正前方车辆速度和目标车道前车辆速度中的最大值对所述行驶效率函数举行修正，并结合所述交通规章信息和地形限制信息对所述回报函数举行修正，以得到偏离交互阶段的回报函数：其中，v22代表本车的纵向速度，v23代表自本车前方车辆的纵向速度，v13代表目标车道前方车辆的纵向速度，d13_22代表自车与目标车道前方车辆的相对纵向距离，d11_22代表自车与目标车道后方车辆的相对纵向距离，v′33代表进入本车道车辆的横向速度，d′33_22代表本车与进入本车道车辆的相对横向距离；当车辆处于直行运动状态时，按照本车与正前方车辆、进入本车道车辆的碰撞风险对所述行驶平安函数举行修正，按照本车速度对所述行驶效率函数举行修正，并结合所述交通规章信息对所述回报函数举行修正，以得到直行交互阶段的回报函数：其中，v23代表本车前方车辆的纵向速度，v13代表目标车道前方车辆的纵向速度。13.在本发明的一个实施例中，在采集本车当前时刻的驾驶环境信息之前，还包括：按照预设时刻下的驾驶环境信息得到车辆hi和与其交互的其他车辆hi′的驾驶状态信息，同时得到车辆hi和与其交互的其他