适用于智能汽车的自主决策方法及系统、装置、终端.pdfVIP

  • 2
  • 0
  • 约1.09万字
  • 约 10页
  • 2023-07-05 发布于四川
  • 举报

适用于智能汽车的自主决策方法及系统、装置、终端.pdf

本发明提供了一种适用于智能汽车的自主决策方法,包括根据状态选择动作集合A中的动作,得到下一个状态,然后计算出回报R,在DoubleDQN框架下,给当前Q网络与目标Q网络构建相同的CNN网络用于训练;利用贪婪策略选择动作获得待训练的样本,动作从步骤S1中的动作集合A中选择,样本构成reply池;待样本达到设定数量后,从reply池中根据设定阈值选择样本,随后进行训练,根据梯度下降法,由当前Q网络与目标Q网络之间误差进行反向传播优化当前Q网络参数;样本训练之后应用至载体进行自主决策。本发明对不同信

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113807503 A (43)申请公布日 2021.12.17 (21)申请号 202111142980.5 (22)申请日 2021.09.28 (71)申请人 中国科学技术大学先进技术研究院

文档评论(0)

1亿VIP精品文档

相关文档