一种基于自适应超参数的深度强化学习改进方法.pdfVIP

下载本文档

23
0
约1.13万字
约 10页
2023-06-17 发布于四川
举报

一种基于自适应超参数的深度强化学习改进方法.pdf

本发明提供了一种基于自适应超参数的深度强化学习改进方法。其采用现成的通用深度强化学习算法作为基础算法，创新点在于加入了自适应超参数。自适应超参数包括探索率和学习率，上述参数将根据训练进度自动调整，从而优化基础算法的性能。探索率，即算法选择随机探索的概率，这一概率由奖励值决定，当奖励值变大，探索率变大，智能体将加大随机探索的力度，反之亦然；学习率将根据损失函数的梯度调整神经网络的参数，其由损失值决定，损失值变大，学习率增大，神经网络将加大学习的力度，反之亦然。自适应超参数能够加快算法的训练速度，使

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 113269322 A (43)申请公布日 2021.08.17 (21)申请号 202110564587.9 (22)申请日 2021.05.24 (71)申请人东南大学地址 21

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

一种基于自适应超参数的深度强化学习改进方法.pdfVIP

一种基于自适应超参数的深度强化学习改进方法.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档