- 1
- 0
- 约2.46万字
- 约 11页
- 2026-03-09 发布于北京
- 举报
BAR猜想:具有真实性和推理能力的预算约束大型语
言模型服务的可能性
JinanZhouRajatGhosh
NutanixNutanix
jinan.zhou@rajat.ghosh@
VaishnaviBhargavaDebojyotiDutta
NutanixNutanix
vaishnavi.bhargava@debojyoti.dutta@
AryanSinghal
Nutanix
本aryan.singhal@
译
中
Abstract
2
v
0在设计大语言模型服务时,从业者关心三个关键属性:推理时间预算、事实
7
1真实性以及推理能力。然而,我们的分析表明没有一个模型可以同时优化
3这三个方面。我们正式证明了这一权衡关系,并提出了一种名为“BAR定
2.理”的原则性框架用于大语言模型应用设计。
7
0
5
21介绍
:
v
i大型语言模型(LLMs)使用Transformer架构(Vaswanietal.,2017),通过大量标记进行预
x
r训练以成为自动回归的下一个标记预测器,。一个LLM参数空间被以下
a
方式分割:。大语言模型在后期训练阶段使用基于
PETEATTNFFOUTPUT
RL的技术如RLHF(Ouyangetal.,2022)、GRPO(DeepSeek-AIetal.,2025);偏好优化技术
如DPO(Rafailovetal.,2024)、KTO(Ethayarajhetal.,2024);以及监督技术如LoRA(Hu
etal.,2021)来学习指令跟随。指令遵循,,意味着模型,,学习根据
指令提示,,来引导其生成轨迹。
大型语言模型(LLM)的两个关键基准属性是:第一,真实性或忠实性——其保持事实信
息根基的能力(Linetal.,2022;Yangetal.,2018),避免幻觉(Lietal.,2023a;Joshietal.,
2017)和抵抗阿谀奉承(Sharmaetal.,2025);第二,推理——其执行逻辑任务的能力,如
数学推理(Cobbeetal.,2021;etal.,2021;2025;2024a;c;b)、逻辑推理(Wangetal.,2024
您可能关注的文档
- SketchAgent:从手绘草图生成结构化图表.pdf
- 具有风险保证的故障检测中的校准预测集通过显著性检验.pdf
- 展示了联网和自动驾驶车辆在网络安全、安全性和隐私问题方面的标准和方法.pdf
- WIP:通过 AI 驱动的同伴代理增强基于游戏的学习.pdf
- 基于图的交互增强网络用于稳健的多模态情感分析.pdf
- RoboLinker: 一种基于扩散模型的人类与陪伴机器人之间的匹配服装生成器.pdf
- CSIRO-LT 在 SemEval-2025 任务 11 中:适应多语言情感识别的大型语言模型.pdf
- Q8bot 的设计:一款采用零电线构建的微型低成本动态四足机器人.pdf
- 跨设备运动交互通过苹果的原生系统框架.pdf
- 利用上下文感知机器学习框架监测压力以保护学生心理健康.pdf
- 散文题型03 理解分析词句(题型专练)(全国通用)(解析版)-2026年高考语文二轮复习讲练.docx
- 考前押题10 阅读理解之应用文——关注生活 学以致用(原卷版)(押题训练)2026年高考英语阅读理解突破策略及押题(全国通用).docx
- 清单04 综合性学习之语言表达(仿写邀请转述劝说) 活动策划(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 清单09 古诗文对比阅读之内容 情感 写法对比 语言 炼字 拓展探究(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 小说易错02 重点情节理解偏差(选择题)(易错专练)(全国通用)(原卷版)-2026年高考语文二轮复习讲练.docx
- 专题01 声现象(题型专练)(全国通用)(原卷版)2026年中考物理二轮复习讲练.docx
- 清单08 文言文(议论类 书信应用类)阅读之论点把握 文体特点(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 清单11 记叙文阅读之朗读设计 表达技巧 主旨情感 开放探究(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 语言清单05 语法填空中的词类(五)无提示词--连词(全国通用)(原卷版)2026年高考英语二轮复习讲练.docx
- 第04讲 想象探索与科学精神(《西游记》《海底两万里》《昆虫记》全国通用(讲义)(解析版)2026年中考语文一轮复习讲练.docx
原创力文档

文档评论(0)