- 0
- 0
- 约2.65万字
- 约 12页
- 2026-02-26 发布于北京
- 举报
通过LEAN中的上下文证明学习发现新定理
APREPRINT
KazumiKasauraNaotoOndaYutaOriike
OMRONSINICXCorporationOMRONSINICXCorporationCyberAgent
AutoResNexaScienceAutoRes
kazumi.kasaura@AutoResoriike_yuta_xa@cyberagent.co.jp
naoto.onda@
MasayaTaniguchiAkiyoshiSannaiShoSonoda
RIKENAIPKyotoUniversityRIKENAIP
本AutoResRIKENAGISCyberAgent
译masaya.taniguchi@riken.jpShigaUniversityAutoRes
中NIIsho.sonoda@riken.jp
NISTEP
1
vAutoRes
4sannai.akiyoshi.7z@kyoto-u.ac.jp
7
2
4
1
.
9ABSTRACT
0
5大型语言模型在形式化定理证明中表现出显著的潜力。然而,之前的工作主要集中在解决现
2有问题上。本文重点研究了LLMs发现新定理的能力。我们提出了一个自动生成数学猜想并
:
v以Lean4格式进行证明的猜想-证明循环管道。我们的方法的一个特点是,在包括先前生成
i
x的定理及其证明在内的上下文中生成和证明进一步的猜想,这使得通过上下文学习证明策略
r
a而不改变LLMs参数的情况下能够生成更难的证明。我们展示了我们的框架通过验证重新发
现了过去的数学论文中发表且尚未形式化的定理。此外,其中至少一个定理即使在自然语言
中也无法被不使用上下文学习的LLM证明,这意味着上下文学习对神经网络定理证明是有
效的。
源代码可在/auto-res/ConjecturingProvingLoop获得。
1介绍
大型语言模型(LLMs)在定理证明方面展示了巨大的潜力。由于LLMs可能会产生幻觉,且难以在自然语言
中检测到这种现象,因此使用LLM生成形式证明并利用交互式定理证明器(ITP),如Lean1,进行验证的研
究受到了关注。然而,先前的工作主要集中在解决现有问题上。本文则侧重于研究LLMs发现新定理的能力。
我们提出了猜想-证明循环,一个用于自动生成数学猜想并在Lean4格式下证明它们的管道。通过将猜想和
证明阶段分开,我们避免了生成定理的收敛,并鼓励证明更难的定理。
1/
您可能关注的文档
- 利用 物理信息背景定向薛定谔断层成像技术进行室内气流成像.pdf
- 在大型语言模型中模拟偏见缓解场景.pdf
- 因果反事实 RAG:将因果反事实推理整合到 RAG 中.pdf
- 多通道差分 ASR 在智能眼镜上对佩戴者语音识别的鲁棒性.pdf
- 哈希基线:在预训练模型时代重新思考.pdf
- 通过在 3D 高斯图表示中使用解析的碰撞锥屏障函数实现感知集成的安全关键控制.pdf
- GestOS:通过大型语言模型进行高级手势解析以控制任何类型的机器人.pdf
- 大型语言模型系统中提示缺陷的分类法.pdf
- Q-ROAR:量化长上下文大语言模型中 RoPE 位置插值的异常感知重新缩放.pdf
- 用于相同库默方程的神经网络:架构考虑与性能评估.pdf
- 散文题型03 理解分析词句(题型专练)(全国通用)(解析版)-2026年高考语文二轮复习讲练.docx
- 考前押题10 阅读理解之应用文——关注生活 学以致用(原卷版)(押题训练)2026年高考英语阅读理解突破策略及押题(全国通用).docx
- 清单04 综合性学习之语言表达(仿写邀请转述劝说) 活动策划(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 清单09 古诗文对比阅读之内容 情感 写法对比 语言 炼字 拓展探究(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 小说易错02 重点情节理解偏差(选择题)(易错专练)(全国通用)(原卷版)-2026年高考语文二轮复习讲练.docx
- 专题01 声现象(题型专练)(全国通用)(原卷版)2026年中考物理二轮复习讲练.docx
- 清单08 文言文(议论类 书信应用类)阅读之论点把握 文体特点(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 清单11 记叙文阅读之朗读设计 表达技巧 主旨情感 开放探究(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 语言清单05 语法填空中的词类(五)无提示词--连词(全国通用)(原卷版)2026年高考英语二轮复习讲练.docx
- 第04讲 想象探索与科学精神(《西游记》《海底两万里》《昆虫记》全国通用(讲义)(解析版)2026年中考语文一轮复习讲练.docx
最近下载
- 三下语文阅读理解与答题模板 .pdf VIP
- 人教版二年级下册数学全册新素养教学课件(配2026年春改版教材).pptx
- 智能座舱系统调试与测试课件 2人机交互系统.pptx VIP
- 2025年初中数学教师基本功大赛试题.docx VIP
- 无人机基础理论培训课件.pptx
- 符号建构与身份表演:符号互动论框架下趣缘群体社交机制研究--基于豆瓣MBTI小组的数字民族志.pdf
- T∕ZZB 1653-2020 一次性细胞冻存管(聚丙烯).pdf VIP
- 无障碍设施建设图集.pdf VIP
- 大学英语自我介绍课件.pptx VIP
- (正式版)S-H-T 1844-2024 工业用乙烯、丙烯中痕量氢气、一氧化碳、二氧化碳的测定 气相色谱-氦离子化检测法.docx VIP
原创力文档

文档评论(0)