基于强化学习的试题.pdfVIP

  • 1
  • 0
  • 约6.02千字
  • 约 9页
  • 2026-03-04 发布于福建
  • 举报

基于强化学习的试题

一、选择题(每题2分,共20分)

1.强化学习(ReinforcementLearning,RL)是一种机器学习

范式,其核心目标是什么?

A.从标注数据中学习映射关系

B.通过与环境交互,学习最优行为策略以最大化累积奖励

C.发现数据中的隐藏模式

D.减少模型预测误差

2.在强化学习框架中,哪个组件代表学习代理,负责做出决

策?

A.状态(State)

B.动作(Action)

C.奖励(Reward)

D.环境(Environment)

3.强化学习中的“奖励信号”主要起到什么作用?

A.定义环境的状态转移规则

B.指导代理学习,评估行为的好坏

C.决定代理在特定状态下可以执行的动作

D.表示代理与环境交互的频率

4.以下哪种算法属于基于值的强化学习(Value-basedRL)?

A.Q-learning

B.SARSA

C.PolicyGradient

文档评论(0)

1亿VIP精品文档

相关文档