2025年大模型长文本记忆失效模式识别卷答案及解析.docxVIP

  • 1
  • 0
  • 约4.38千字
  • 约 10页
  • 2026-05-09 发布于四川
  • 举报

2025年大模型长文本记忆失效模式识别卷答案及解析.docx

2025年大模型长文本记忆失效模式识别卷答案及解析

一、单项选择题(每题3分,共15分)

1.大模型在处理1.2万字的医学病例时,漏报了第3段中“患者10年前曾有青霉素过敏史”的关键信息,其余段落关于近期症状的描述被完整提取。此现象最可能对应哪种长文本记忆失效模式?

A.上下文遗忘

B.关键信息稀释

C.时序错位

D.逻辑链断裂

答案:B

解析:关键信息稀释模式的典型特征是模型对长文本中低频出现、位置靠前或与高频内容(如近期症状)重叠度低的关键信息分配的注意力权重不足。案例中“青霉素过敏史”位于第3段(非末尾),且属于长期病史(低频信息),而近期症状(高频信息)被完整提取,符合关键信息因“权重竞争失败”被稀释的特征。上下文遗忘(A)通常表现为对前文整体信息的模糊化而非特定关键项遗漏;时序错位(C)涉及时间顺序的混淆;逻辑链断裂(D)需存在推理链条的中断,均不符合本例。

2.某大模型在提供2万字的会议纪要时,将第5节“技术方案表决结果(赞成12票,反对3票)”错误写为“赞成3票,反对12票”,但第15节“最终决议:通过技术方案”被正确保留。此失效模式的核心诱因是?

A.注意力衰减导致跨段依赖丢失

B.位置编码非线性引发的时序混淆

C.模型参数容量与序列长度不匹配

D.词元化过程中的信息离散化误差

答案:A

解析:跨段依赖

文档评论(0)

1亿VIP精品文档

相关文档