- 1
- 0
- 约3.86千字
- 约 8页
- 2026-05-27 发布于四川
- 举报
2026年大模型评估指标体系专项试题及答案
1.单项选择题(每题2分,共20分)
1.1在BERTScore中,对参考文本与生成文本进行上下文嵌入后,计算相似度的核心度量是
A.Jaccard系数?B.余弦相似度?C.欧氏距离?D.KL散度
答案:B
1.2大模型在“知识截止”测试中的FactualAccuracy通常采用下列哪一指标
A.ROUGE-L?B.BLEURT?C.Exact-Match?D.BERT-F1
答案:C
1.3当使用人类偏好排序训练奖励模型时,下列损失函数中最常被采用的是
A.MSE?B.Cross-Entropy?C.Bradley-Terry负对数似然?D.HingeLoss
答案:C
1.4衡量模型输出平均token长度的指标是
A.CompressionRatio?B.LengthRatio?C.RepetitionRate?D.Burstiness
答案:B
1.5在Long-Context评估中,若输入长度n=32k,模型需定位关键信息的位置误差用何指标
A.MeanReciprocalRank?B.TokenEditDistance?C.PassageRetrievalF1?D.Sliding-windowPerplexity
答案:A
1.6用于检测模型输出是否包
您可能关注的文档
- 《儿童注意缺陷多动障碍共病学习障碍学校支持策略指南(2024年版)》.docx
- 《无症状高尿酸血症干预阈值与生活方式管理指南(2024年版)》.docx
- 《中国阻塞性睡眠呼吸暂停基层筛查与管理指南(2025年版)》.docx
- 2026辐射安全与防护培训考试题及参考答案.docx
- 2026年安全生产事故应急处理能力实战考核试卷及答案.docx
- 2026年春季防毒面罩气密性负压测试考核试卷及解析.docx
- 2026年工程测量三维建模核心技能冲刺押题培训试卷及答案.docx
- 2026年货梯轿厢门光幕感应调整技能实训试卷及答案.docx
- 2026年交通应急物资储备工作自检自查报告范文.docx
- 2026年气体管道五项测试题目及答案.docx
- 2026-2028年AI时代下智能财务新势力前瞻性发展报告——企业大支出管理方向.pdf
- 统一电力市场中综合能源多方主体市场交易.pptx
- 2026年艾草行业品质消费趋势白皮书.pptx
- 产品白皮书V7.0标签洞察TagInsight.pptx
- 2026年重磅芝士上新.pptx
- 袋鼠云数栈V7.0正式发布:打造企业级多模态数据智能中台.pptx
- 2026-2028年AI时代下智能财务新势力前瞻性发展报告——企业大支出管理方向.pptx
- “Data+AI智能飞轮战略”发布.pptx
- 中华人民共和国绿色主权债券2025年度信息披露报告.docx
- 2026年全球CEO研究报告:重塑高管团队加速迈向(英文版).pptx
原创力文档

文档评论(0)