一种基于自适应超参数的深度强化学习改进方法.pdfVIP

  • 23
  • 0
  • 约1.13万字
  • 约 10页
  • 2023-06-17 发布于四川
  • 举报

一种基于自适应超参数的深度强化学习改进方法.pdf

本发明提供了一种基于自适应超参数的深度强化学习改进方法。其采用现成的通用深度强化学习算法作为基础算法,创新点在于加入了自适应超参数。自适应超参数包括探索率和学习率,上述参数将根据训练进度自动调整,从而优化基础算法的性能。探索率,即算法选择随机探索的概率,这一概率由奖励值决定,当奖励值变大,探索率变大,智能体将加大随机探索的力度,反之亦然;学习率将根据损失函数的梯度调整神经网络的参数,其由损失值决定,损失值变大,学习率增大,神经网络将加大学习的力度,反之亦然。自适应超参数能够加快算法的训练速度,使

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113269322 A (43)申请公布日 2021.08.17 (21)申请号 202110564587.9 (22)申请日 2021.05.24 (71)申请人 东南大学 地址 21

文档评论(0)

1亿VIP精品文档

相关文档