- 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
- 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2025年强化学习探索与利用(含答案与解析)
一、单选题(共15题)
1.以下哪项技术不属于强化学习中的探索策略?
A.ε-greedy策略
B.蒙特卡洛树搜索
C.线性预测器
D.Q-learning
2.在分布式训练框架中,以下哪种方法可以减少通信开销?
A.数据并行
B.模型并行
C.算子并行
D.独立训练
3.参数高效微调(LoRA)通常用于以下哪个场景?
A.模型压缩
B.模型初始化
C.模型预训练
D.模型评估
4.持续预训练策略中,以下哪个不是常见的预训练任务?
A.机器翻译
B.问答系统
C.图像分类
D.语音识别
5.对抗性攻击防
您可能关注的文档
最近下载
- 4.7.1 传染病及其预防 课件 2025-2026学年度人教版生物八年级上册(共29张PPT).pptx VIP
- 大唐移动5G设备介绍.ppt VIP
- 2024《九阳小家电企业存货管理问题探讨》9500字.docx
- 高电压技术复习资料.doc VIP
- 中石油油气田地面建设工程(项目)竣工验收手册(修订版).doc VIP
- 聚合物基复合材料界面.ppt VIP
- 外研版(2025) 必修第一册 Unit 2 Exploring English Understanding ideas课件(共29张PPT)(含音频+视频).pptx VIP
- 高电压技术复习资料.doc VIP
- 人教版(2024)八年级上册英语Unit 1 Happy Holiday 教案(共6课时).docx
- 《-主动拒绝烟酒与毒品-》教学设计.doc VIP
文档评论(0)