- 0
- 0
- 约小于1千字
- 约 63页
- 2026-03-09 发布于广东
- 举报
强化学习基础概念与实践应用案例;目录;强化学习的发展历程;早期起源;重要发展阶段;近期研究热点;未来发展趋势;强化学习的基础概念;基本定义;智能体与环境;状态与动作;奖励机制;策略函数;价值函数;贝尔曼方程;策略梯度;探索与利用;马尔可夫决策过程;部分可观测马尔可夫决策过程;深度强化学习概念;无模型与基于模型强化学习;离线与在线强化学习;多智能体强化学习;强化学习的算法原理;Q-learning算法;SARSA算法;深度Q网络(DQN);双深度Q网络(DDQ
原创力文档

文档评论(0)