强化学习高效训练及推理加速研究.pdf

摘要

强化学习高效训练及推理加速研究

电子信息专业

研究生陈振宇指导教师张红杰

摘要目前,强化学习在智能制造、工业控制、低空经济、智能驾驶等多个领

域展现出巨大的潜力。强化学习作为人工智能领域的重要方法,与监督学习的区别

在于,强化学习通过试错机制与环境交互,采集经验数据用于策略训练。强化学习

的核心思想是通过奖励信号来引导智能体在环境中探索学习,最终实现最大化累

积奖励。

在强化学习的训练

文档评论(0)

1亿VIP精品文档

相关文档