各得其所:探索 RAG 中的最优嵌入-计算机科学-机器学习-大语言模型.pdfVIP

各得其所:探索 RAG 中的最优嵌入-计算机科学-机器学习-大语言模型.pdf

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

各得其所:探索RAG中的最优嵌入

ShitingChen,ZijianZhao,JinsongChen

FacultyofEducation,UniversityofHongKong,HongKong,China

DepartmentofCivilandEnvironmentalEngineering,

TheHongKongUniversityofScienceandTechnology,HongKong,China

Abstract交通(Lyuetal.,2025)、艺术(Zhaoetal.,2025)

和教育(Gaoetal.,2024)等多个领域加速了变

最近,随着大型语言模型(LLMs)在各革的步伐。

个领域产生了根本性的影响,将最新信

然而,与LLMs相关的幻觉问题(Henkel

息整合到LLMs中或添加外部知识以构

etal.,2024)长期以来一直困扰着人们,这一

建特定领域的模型的方法受到了广泛关

注。检索增强生成(RAG),作为一种推问题源自多种因素,如给定提示(Huangetal.,

本理时的扩展方法,因其低成本和参数调2025b)的知识不足以及有偏训练过程(Zhao,

译优所需的极小努力而引人注目。然而,由2025)。

中于训练数据和模型架构的不同,RAG中作为高效解决方案,检索增强生成(RAG)

1使用的变体嵌入模型在各个领域表现出已被广泛应用于构建基础模型(Chenetal.,

v不同的优势,这常常导致相似性计算结

22024)和实用代理(Arslanetal.,2024)。与微调

4果不同,进而使得LLMs的回答质量有和提示调整等训练方法相比,其即插即用功能

4所差异。为了解决这个问题,我们提出

7并研究了两种结合多个嵌入模型优点以使RAG成为一种高效、简单且成本效益高的

1

7.增强RAG的方法,命名为混合嵌入RAG方法。RAG的主要范式包括首先计算问题与外

0和置信度RAG。混合嵌入RAG简单地根部知识语料库中的片段之间的相似性,然后将

5

2据标准化的相似性对来自多个嵌入模型前个相关片段合并到提示中以引导大型语

:

v的检索结果进行排序和选择;然而,它言模型(LLM)(Lewisetal.,2020)。

i

x并未超越传统的RAG。相比之下,置信尽管RAG具有优势,选择合适的嵌入模

r

a度RAG使用不同的嵌入模型多次生成回

型仍然是一个关键问题,因为检索到的参考文

答,然后选出置信度最高的回

您可能关注的文档

文档评论(0)

zikele + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档