- 1
- 0
- 约6.02千字
- 约 9页
- 2026-03-04 发布于福建
- 举报
基于强化学习的试题
一、选择题(每题2分,共20分)
1.强化学习(ReinforcementLearning,RL)是一种机器学习
范式,其核心目标是什么?
A.从标注数据中学习映射关系
B.通过与环境交互,学习最优行为策略以最大化累积奖励
C.发现数据中的隐藏模式
D.减少模型预测误差
2.在强化学习框架中,哪个组件代表学习代理,负责做出决
策?
A.状态(State)
B.动作(Action)
C.奖励(Reward)
D.环境(Environment)
3.强化学习中的“奖励信号”主要起到什么作用?
A.定义环境的状态转移规则
B.指导代理学习,评估行为的好坏
C.决定代理在特定状态下可以执行的动作
D.表示代理与环境交互的频率
4.以下哪种算法属于基于值的强化学习(Value-basedRL)?
A.Q-learning
B.SARSA
C.PolicyGradient
原创力文档

文档评论(0)