2025年大模型微调学习率调度(含答案与解析).docx

2025年大模型微调学习率调度(含答案与解析).docx

2025年大模型微调学习率调度(含答案与解析)

一、单选题(共15题)

1.在大模型微调过程中,以下哪种调度策略能有效提高模型收敛速度?

A.固定学习率调度

B.线性学习率衰减

C.余弦退火学习率衰减

D.自适应学习率衰减

答案:C

解析:余弦退火学习率衰减在预训练模型微调阶段常被采用,它能模拟人类学习过程中的耐心与坚持,通过周期性降低学习率,有助于提高模型的收敛速度和最终性能,参考《深度学习微调技术指南》2025版3.4节。

2.以下哪个不是用于评估预训练大模型性能的关键指标?

A.感知熵

B.准确率

C.F1分数

D.生成能力

答案:D

解析:感知熵、准确率和

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档