- 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
- 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
本公开提出了基于置信上界思想的经验回放采样强化学习方法级系统,包括:采集智能体与环境交互获得的经验,并将所述经验数据存储至经验回放池中;在更新当前训练策略时,从所述经验回放池中根据优先概率随机选取经验,生成候选训练样本集;根据每个候选训练样本的置信上界值,选择训练样本集;根据所述训练样本数据对用于函数逼近的神经网络进行参数更新。本公开技术方案可以与任意的离线RL算法相结合,在一定程度上解决相关技术中的样本利用不充分,更新算法学习效率低的问题,有效提高采样效率,进一步提升算法更新的泛化能力。
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 112734014 A
(43)申请公布日 2021.04.30
(21)申请号 202110038613.4
(22)申请日 2021.01.12
(71)申请人 山东大学
地址 25
您可能关注的文档
- 基于判别样本元挖掘器的亲属关系验证方法和装置.pdf
- 基于区块链的可搜索加密方法和电子设备.pdf
- 基于区块链的加密搜索方法、电子设备和计算机存储介质.pdf
- 基于区块链的异构数据存储方法和电子设备.pdf
- 一种低怠速发动机转速控制方法.pdf
- 一种配电站智能散热方法及系统.pdf
- 磁场可调式磁性液体密封装置.pdf
- 一种双循环排汽式高压蒸汽灭菌器及其排汽方法.pdf
- 车道保持功能的启动方法、装置及计算机存储介质.pdf
- 一种全光纤电流互感器的阶跃响应仿真方法和仿真系统.pdf
- 2025年智能电网柔性直流输电技术在我国西部地区应用前景.docx
- 7.2 弹力-人教版八年级物理下册.pptx
- 2025年智能电网柔性直流输电技术在智能变电站中的应用研究.docx
- 2025年智能电网柔性直流输电技术在智能电网智能化存储中的应用.docx
- 2025年智能电网柔性直流输电技术在新能源并网中的应用研究.docx
- 2025年智能电网柔性直流输电技术在智能电网智能化控制中的应用.docx
- 2025年智能电网柔性直流输电技术在智能电网智能化预测中的应用.docx
- 2025年智能电网柔性直流输电技术在智能电网智能化服务中的应用.docx
- 2025年智能电网柔性直流输电技术在智能电网智能化运维中的应用.docx
- 2025年智能电网柔性直流输电技术智能化保护系统研究.docx
原创力文档


文档评论(0)