适用于智能汽车的自主决策方法及系统、装置、终端.pdfVIP

下载本文档

2
0
约1.09万字
约 10页
2023-07-05 发布于四川
举报

适用于智能汽车的自主决策方法及系统、装置、终端.pdf

本发明提供了一种适用于智能汽车的自主决策方法，包括根据状态选择动作集合A中的动作，得到下一个状态，然后计算出回报R，在DoubleDQN框架下，给当前Q网络与目标Q网络构建相同的CNN网络用于训练；利用贪婪策略选择动作获得待训练的样本，动作从步骤S1中的动作集合A中选择，样本构成reply池；待样本达到设定数量后，从reply池中根据设定阈值选择样本，随后进行训练，根据梯度下降法，由当前Q网络与目标Q网络之间误差进行反向传播优化当前Q网络参数；样本训练之后应用至载体进行自主决策。本发明对不同信

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113807503 A (43)申请公布日 2021.12.17 (21)申请号 202111142980.5 (22)申请日 2021.09.28 (71)申请人中国科学技术大学先进技术研究院

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

适用于智能汽车的自主决策方法及系统、装置、终端.pdfVIP

适用于智能汽车的自主决策方法及系统、装置、终端.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档