- 0
- 0
- 约2.04万字
- 约 7页
- 2026-03-06 发布于北京
- 举报
思考链仍然快速思考:APriCoT有助于进行深思熟虑
KyleMoore†JesseRoberts†
VanderbiltUniversityTennesseeTechnologicalUniversity
kyle.a.moore@VanderbiltUniversity
jtroberts@
ThaoPhamDouglasFisher
BereaCollegeVanderbiltUniversity
Abstract答案分布相同,并且准确性优于CF或CoT,表明APri-
CoT有助于模型更缓慢地地思考。
本语言模型已知会从训练数据中吸收偏见,导致预测由统计在本文中我们做出了3项主要贡献:1)我们扩展了
译规律而非语义相关性驱动。我们调查了这些偏见对大规模CF提示,以适应CoT推理,从而能够更全面地分析BRP
多任务语言理解(MMLU)任务中的答案选择偏好影响。效应。2)我们证明了当采用CF提示策略时,CoT推理
中我们的研究结果显示,这些偏见可以预测模型的偏好,并会加剧BRP对显性行为的影响,挑战了广泛接受的CoT
3且即使在使用链式思考(CoT)推理时也反映了人类答题效用。3)我们引入了一种名为APriCoT的CoT提示扩
v策略。为了解决这个问题,我们引入了带有不知情引导的展,该方法能够减少BRP效应并提高准确性。我们认为
1反事实提示(APriCoT)。我们证明单独使用带CoT的反APriCoT可能作为一种有效的策略来评估模型行为和执
5事实提示不足以缓解偏见,而APriCoT有效减少了基础
行复杂的推理任务。
6率概率的影响并提高了整体准确性。我们的结果表明,减
8轻偏见需要一个慢思考过程,仅靠CoT可能无法提供这
0.一过程,因为它在某些提示方法下往往会强化快速思考模先前工作
8型偏见。APriCoT是开发更强大和公平的语言模型的一在本节中,我们简要回顾了现有的文献,这些文献
0步,这些模型能够思考缓慢。围绕基础率概率(BRP)效应的缓解以及连同其他启发
4
2关键词:大型语言模型;基础率;模型偏差;链式思维推法和偏见一起使用CoT的情况。BRP效应将在专门的
:理;MMLU;定量行为分析部分详细定义和描述,但可以简单理解为执行无关任务
v时单词偏好对显性行为的影响。Mooreetal.(2024)、S.-
i
xL.Weietal.(2024)和Zhengetal.(2023)在非CoT背
r介绍景下对BRP效应及其缓解方法进行了深入评估。两篇研
a
模型涉及人类认知推理的两种不同思维方式,该模究都发现,在MCQA任务的背景下,大语言模型容易受
型在Kahneman的开创性著作快速与慢速思考(Kahne-到BRP效应的影响。Mooreetal.(2024)提出了一种重
man,2011)中提出。快速思考或启发式思考由系统
您可能关注的文档
- 从互动多主题协作中预测筛查访谈中的抑郁症状.pdf
- 前端扩散: 赋能研究人员和设计师的自我表达的多智能体系统.pdf
- LayerTracer: 认知对齐的分层 SVG 合成通过扩散变换器.pdf
- 面向社会公益的推荐系统:问责制和可持续性的作用.pdf
- TAR3D: 通过下一部件预测创建高质量的 3D 资产.pdf
- 零样本语音转换通过内容感知音色集成和条件流匹配.pdf
- 高效 EQA: 一种有效的方法用于开放词汇的身体化问题回答.pdf
- 和谐:一个具备人类意识、响应迅速且模块 化的助手,采用本地部署的大语言模型.pdf
- 计算机视觉中的伦理挑战:确保公开数据集的隐私并减轻偏见.pdf
- 您的扩散推荐模型公平吗?.pdf
最近下载
- 雪地胎的选用与更换-2024年世界职业院校技能大赛一等奖展示PPT.pptx VIP
- 一种提高线性聚乙烯膜料耐候性及拉伸性能的复合助剂及其制备方法.pdf VIP
- 【新教材】人教版(2024)七年级下册英语教学计划.docx
- 2026年中国厨房剪市场调查研究报告.docx
- 第一单元第二课《山水合璧》教案 湘美版2025美术七年级下册.pdf
- 2026年月日历表 (每月一张 A4可打印).pdf VIP
- 智能体应用发展报告(2025).pdf VIP
- 企业微信使用管理规范及注意事项.docx VIP
- 基于ANSYS的感应加热数值模拟分析-机械制造及其自动化专业论文.docx VIP
- 2025年交通运输部所属事业单位招聘真题.docx VIP
原创力文档

文档评论(0)