华侨大学《机器学习B》2023-2024学年第二学期期末试卷.docVIP

  • 4
  • 0
  • 约5.24千字
  • 约 7页
  • 2026-06-18 发布于重庆
  • 举报

华侨大学《机器学习B》2023-2024学年第二学期期末试卷.doc

学校________________班级____________姓名____________考场____________准考证号

学校________________班级____________姓名____________考场____________准考证号

…………密…………封…………线…………内…………不…………要…………答…………题…………

第PAGE1页,共NUMPAGES3页

华侨大学《机器学习B》

2023-2024学年第二学期期末试卷

题号

总分

得分

一、单选题(本大题共25个小题,每小题1分,共25分.在每小题给出的四个选项中,只有一项是符合题目要求的.)

1、在机器学习中,强化学习是一种通过与环境交互来学习最优策略的方法。假设一个机器人要通过强化学习来学习如何在复杂的环境中行走。以下关于强化学习的描述,哪一项是不正确的?()

A.强化学习中的智能体根据环境的反馈(奖励或惩罚)来调整自己的行为策略

B.Q-learning是一种基于值函数的强化学习算法,通过估计状态-动作值来选择最优动作

C.策略梯度算法直接优化策略函数,通过计算策略的梯度来更新策略参数

D.强化学习不需要对环境进行建模,只需要不断尝试不同的动作就能找到最优策略

2、在机器学习中,交叉验证是一种常

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档