- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
动量辅助的自然语言梯度下降用于提示优化
AnthonyCui*PranavNandyalamAndrewRufailEthanCheung
AidenLeiKevinZhuSeanO’Brien
AlgoverseAIResearch
anthonycui@,kevin@algoverse.us
Abstract出错,并受人类局限性的制约(Linetal.,2024)。
这突显了对一个无需人工干预即可提高提示质
提示优化对于提高大型语言模型(LLMs)的
量的自动化系统日益增长的需求。
本输出质量至关重要,但许多现有方法效率
译低下,需要大量的计算和手动调整。我们提
中出了Momentum-AidedPromptOptimization
(MAPO),它在ProTeGi(Pryzantetal.,2023)
3
v的基础上通过加入正面的自然语言“梯
9度”和基于动量的记忆机制来优化提示,
9
4同时避免陷入局部最小值和振荡。它还
9使用了束搜索和上置信界(UCB)算法来
1
.进行平衡候选扩展和选择。MAPO实现
0
1了更快的收敛时间、较少的API调用次
4数以及比ProTeGi更高的性能,证明其作
2
:为LLMs中自动化提示优化的健壮且可
v
i扩展解决方案的有效性。我们的代码在
x
r线可用,网址为/Anthony-
a
Cui7/momentum-aided-prompt-optimization。
1介绍
大型语言模型(LLMs)自ChatGPT(Ope-
nAI,2022)发布以来获得了显著的关注,促成了
新的提示技术的发展,这些技术极大地提高了
LLM的性能(Schulhoffetal.,2024)。虽然已经表
明给予LLM的提示对其性能有很大影响(Paw-图1:MAPO的高级概述
lik,2025),但提示仍然可能不清楚、有偏见或不
完整,限制了LLM的能力(Sahooetal.,2024)。最近的研究探讨了将传统机器学习算法以
由于这些原因,提示工程已成为充分利用LLM自然语言格式实现的方法,其中第一个便是
能力的关键方面。目前的提示工程技术通常需ProTeGi的“使用‘梯度下降’和束搜索自动
要用户进行手动调整,这使得它们耗时、容易提示优化”(Pryzantetal.,2023)。虽然ProTeGi
*LeadAuthor引入了一个创新框架,但它也存在一些限制,
包括由于过度调用API而导致计算成本高和资相似的问题。
源消耗大,这使得大规模提示优化变得不切实
3方法
际。此外,ProTeGi没有跟踪之前的改进措施,
导致了振荡行为和收敛速度缓慢。最终,提示3.1动量辅助提示优化
的优势未能得到充分利用。
首先,当前提示基于一组训练数据的最
我们引入了动量辅助提示优化(MAPO)方
您可能关注的文档
最近下载
- 办公耗材类保证服务的措施.docx VIP
- 网招团队日常管理.pptx
- 阿兹海默症护理.pptx VIP
- 罐区设备设施风险分级管控清单.pdf VIP
- DB32T 4582-2023 宗教活动场所安全管理规范 .pdf VIP
- 专题03 2025年西城区高三一模作文“用功与有功” “如你所愿”导写(原题呈现 审题立意 素材积累 高分范文 类题迁移).docx VIP
- BATCH RELEASE CERTIFICATE(外贸出口BRC两个模板).doc
- (投标书范本)政府采购投标书.pdf VIP
- 专题02 2025年东城区高三一模作文“适合的与热爱的” “先声”导写(原题呈现 审题立意 素材积累 高分范文 类题迁移).docx VIP
- 沪教版九上化学 2.1 性质活泼的氧气第2课时 氧气的实验室制法与性质实验 课件(共17张PPT)(含音频+视频).ppt VIP
文档评论(0)