- 1、本文档内容版权归属内容提供方,所产生的收益全部归内容提供方所有。如果您对本文有版权争议,可选择认领,认领后既往收益都归您。。
- 2、本文档由用户上传,本站不保证质量和数量令人满意,可能有诸多瑕疵,付费之前,请仔细先通过免费阅读内容等途径辨别内容交易风险。如存在严重挂羊头卖狗肉之情形,可联系本站下载客服投诉处理。
- 3、文档侵权举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2025年强化学习探索与利用平衡(含答案与解析)
一、单选题(共15题)
1.以下哪项技术通常用于在强化学习环境中提高决策的鲁棒性?
A.梯度消失问题解决
B.对抗性攻击防御
C.知识蒸馏
D.联邦学习隐私保护
2.在分布式训练框架中,以下哪种技术可以显著提升训练效率?
A.模型并行策略
B.云边端协同部署
C.分布式存储系统
D.低代码平台应用
3.以下哪种技术可以用于在模型训练过程中实现参数的高效微调?
A.结构剪枝
B.模型量化(INT8/FP16)
C.参数高效微调(LoRA/QLoRA)
D.稀疏激活网络设计
4.在持续预训练策略中,以下哪种方法可
文档评论(0)