- 0
- 0
- 约3.92万字
- 约 11页
- 2026-02-26 发布于北京
- 举报
大型语言模型系统中提示缺陷的分类法
HAOYETIAN,SchoolofComputerScienceandEngineering,NanyangTechnologicalUniversity,Singapore
CHONGWANG,SchoolofComputerScienceandEngineering,NanyangTechnologicalUniversity,
Singapore
BOYANGYANG,JisuanInstituteofTechnology,BeijingJudaoYoudaNetworkTechnologyCo.Ltd.,
China
LYUYEZHANG,SchoolofComputerScienceandEngineering,NanyangTechnologicalUniversity,
Singapore
本YANGLIU,SchoolofComputerScienceandEngineering,NanyangTechnologicalUniversity,Singapore
译大型语言模型(LLMs)已成为现代软件的关键组件,提示语句实际上充当了它们的编程接口。然而,
中提示设计仍然主要依赖经验,并且小错误可能会导致不可靠、不安全或低效的行为。本文首次系统地
调查并归类了提示缺陷,揭示了提示无法激发其预期行为的反复出现的方式。我们从六个维度组织这
1些缺陷:(1)规格与意图,(2)输入与内容,(3)结构与格式,(4)上下文与记忆,(5)性能与效率,
v
4以及(6)可维护性与工程。每个维度被细分为具体的子类型,并通过具体实例和根本原因分析进行
0说明。基于软件工程原则,我们展示了这些缺陷如何在实际开发工作流程中出现并检查它们的下游影
4响。对于每种子类型,我们都提炼了缓解策略,涵盖了新兴的提示工程模式、自动化防护措施、测试
4
1框架和评估框架。然后,我们将这些策略总结在一个主分类法中,该分类法链接了缺陷、影响和补救
.
9措施。最后,我们总结了开放的研究挑战,并呼吁制定严格的面向提示工程的方法论,以确保由LLM
0驱动的系统是设计可靠性的。
5
2
:1介绍
v
i
x大型语言模型(LLMs)已成为现代软件应用程序的重要组成部分,作为从自然语言查
r
a询回答到代码生成和修复等各种任务的强大组件[1,9,44,45]。在这些基于LLM的系统
中,提示(一种以自然语言输入的形式指导模型的行为)实际上充当了决定模型行为的
源代码[6,40]。这种范式有时被称为由提示驱动的软件或promptware[6],它允许开发
人员使用普通语言指令而不是传统的编程来执行复杂任务。然而,与传统代码不同的
是,提示是以一种模糊、非结构化且依赖于上下文(自然语言)的形式编写的,并在一
个非确定性和概率性的引擎(LLM)上执行[38,48]。这些基本差异给确保提示开发的
Authors’ContactInformation:HaoyeTian,SchoolofComputerScienceandEngineering,NanyangTechnologicalUniversity,
Singapore,tianhaoyemail@;ChongWang,SchoolofComputerScienceandEngineering,NanyangTechnological
University,Singapore,XXX;BoYangYang,JisuanInstituteofTechnology,BeijingJudaoYoudaNetworkTechnologyCo.Ltd.,China,
yby@;LyuyeZhang,SchoolofComputerScienceandEngineering,NanyangTechnologicalUniversity,Singapore,XXX;
YangLiu,SchoolofComputerScienceandEngineering,NanyangTechnologicalUniversity,Singapore,yangliu@.sg.
2025.ACMXXXX-XXXX/2025/9-ART
/10.
您可能关注的文档
- 测量说话人去识别系统中的软生物特征泄漏.pdf
- 联邦自适应表决优化技术: 通过掩码最优传输在联邦学习中的精确分布对齐.pdf
- 利用 物理信息背景定向薛定谔断层成像技术进行室内气流成像.pdf
- 在大型语言模型中模拟偏见缓解场景.pdf
- 因果反事实 RAG:将因果反事实推理整合到 RAG 中.pdf
- 多通道差分 ASR 在智能眼镜上对佩戴者语音识别的鲁棒性.pdf
- 哈希基线:在预训练模型时代重新思考.pdf
- 通过在 3D 高斯图表示中使用解析的碰撞锥屏障函数实现感知集成的安全关键控制.pdf
- GestOS:通过大型语言模型进行高级手势解析以控制任何类型的机器人.pdf
- Q-ROAR:量化长上下文大语言模型中 RoPE 位置插值的异常感知重新缩放.pdf
- 安徽省安庆市潜山市部分学校2025-2026学年七年级下学期阶段学情自测数学试题-普通用卷.docx
- 2026《微型无人机的设计基础综述》2600字.docx
- 安徽六安市金安区2025-2026学年八年级上学期2月期末物理试题-普通用卷.docx
- 2026《五菱汽车公司经营者股权激励实施成效及其启示》9700字.doc
- 北京市第一零九中学2026届高三下学期开学考试数学试题-普通用卷.docx
- 北京海淀实验中学2026届高三下学期数学开学检测试题-普通用卷.docx
- 2026《五菱汽车公司融资模式及融资风险分析》8700字.doc
- 2026《五菱汽车公司物流成本控制研究》文献综述开题报告(含提纲)3800字.doc
- 2026《五菱汽车公司薪酬改革问题研究》开题报告(文献综述)4200字.doc
- 2026《物流企业反内卷的战略转型研究—以顺丰控股为例》13000字.doc
最近下载
- 儿科学(第10版)儿童心肺复苏.pptx VIP
- 《第1课 身边的算法》说课稿教学反思-2023-2024学年小学信息技术浙教版2023五年级上册.docx VIP
- 2025-2026学年浙美版(新教材)小学美术三年级下册(全册)教学设计.docx
- 2025-2026年演出经纪人之演出市场政策与法律法规模拟题库及答案下载.pdf VIP
- 幼儿园教师春季卫生保健知识培训.pptx VIP
- 高速公路旧沥青路面铣刨料再生利用:技术、效益与前景.docx VIP
- 2025-2026学年浙美版(新教材)小学美术三年级下册《运动会奖杯设计》教学设计.docx VIP
- 2024 - 2025人教版(PEP)英语小学二年级下册教学计划 .docx VIP
- 2026年XX施工安全免责协议书.docx VIP
- DLT5300-2013 1000kV 架空输电线路工程施工质量检验及评定规程.docx VIP
原创力文档

文档评论(0)