- 0
- 0
- 约4.86千字
- 约 6页
- 2026-07-02 发布于湖北
- 举报
强化学习工程师
一、单项选择题(共10题,每题1分,共10分)
强化学习属于以下哪种机器学习方法?A.监督学习B.无监督学习C.半监督学习D.强化学习答案:D解析:强化学习是独立于监督学习、无监督学习等分类的机器学习方法,具有明确的定义和特征。
Q-learning的核心思想是什么?A.通过梯度下降最小化损失函数B.通过探索和利用平衡学习C.通过生成对抗网络进行策略学习D.通过贝叶斯估计更新参数答案:B解析:Q-learning通过选择最大化Q值(预期回报)的动作来学习最优策略,本质是探索与利用的平衡。
在马尔可夫决策过程中,哪个是状态转移的不确定性来源
您可能关注的文档
最近下载
- 2023年中国传媒大学信息管理与信息系统专业《计算机网络基础》科目期末试卷B(有答案).docx VIP
- SysKeeper-3000电力专用横向安全隔离装置(正向型)操作手册V4.1-20230328(2).pdf
- 蛟川书院入学考试语文试卷(宁波卷).doc VIP
- (高清版)B-T 3836.1-2021 爆炸性环境 第1部分:设备 通用要求.pdf VIP
- 2025年蛟川书院入学考试语文试卷宁波卷.docx VIP
- VDA5测量过程能力Excel表格模板.xlsx
- 2019—2020学年度北京市朝阳区第二学期高一期末考试高中化学.docx VIP
- 盛宗亮大提琴无伴奏曲《七首中国曲调》的音乐特征与表演实践.pdf
- 自然资源三维立体“一张图”系统建设方案.docx VIP
- 10.0.4kv变电所设计说明书.doc VIP
原创力文档

文档评论(0)