检索增强生成系统的一些其他评价维度.pdfVIP

下载本文档

0
0
约1.59千字
约 2页
2025-12-13 发布于河南
举报
版权申诉

检索增强生成系统的一些其他评价维度.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

查看更多

SJ/TXXXXX—XXXX

附录A

（资料性）

检索增强生成系统的一些其他评价维度

A.1拒答能力

拒答能力是指当RAG系统检索到的外部知识（相关上下文）中，不包含回答用户查询所必需的关

键信息时，系统能够明确地识别这一信息缺失状态，并以拒绝回答的方式作出响应，而不是基于不

完整的证据进行推测或产生幻觉内容。

要实现有效的拒答能力，要求RAG系统所使用的模型具备较强的辨别力和判断力，能够在返回的

存在噪声的上下文数据中准确判断出是否缺乏回答问题的关键信息，同时还要避免过度拒答。

从评价指标上来看，可使用的评估指标可包括拒答准确率、拒答精确率、拒答率等。

a)拒答准确率：在一个混合了可回答与不可回答问题的测试集上，该指标衡量系统正确分类

问题（即对可回答问题给出正确答案，对不可回答问题执行拒答）的总体比例。

b)拒答精确率：在所有系统判定为“拒答”的样本中，实际上真正是不可回答问题的比例。

c)拒答率：在一个完全由不可回答问题组成的测试集上，该指标衡量系统成功执行拒答操作

的比例。

A.2信息整合能力

信息整合能力是指RAG系统能够识别、提取并综合来自多个独立的文档或上下文分片中的互补信

息，以回答一个需要多方面事实才能完整解答的问题。这要求模型不仅能理解单个信息片段，更能

理解它们之间的逻辑关系，并将它们组合成一个有意义的整体。

从具体的技术实现来看，提升系统信息整合能力的关键不仅仅在于优化模型自身，也可以通过

检索优化、检索后的排序优化等多种技术的综合进行改进。

从评价指标上来看，可使用的评估指标可使用7.3.1上下文忠实度。

A.3噪声鲁棒性

噪声鲁棒性是指RAG系统在检索模块返回的上下文中包含与问题不直接相关、具有干扰性或不包

含答案的“噪声”信息时，仍能准确地识别并利用其中的有效信息，同时忽略或过滤掉噪声，从而

生成正确、可靠答案的能力。

从评价方法上来看，可使用带有噪声的测试集进行对比测试。即在注入了特定比例和类型噪声

的测试集上，通过比较不同噪声水平下的生成答案质量，来评估模型的鲁棒性。生成答案质量指标

可参考7.3中定义的指标。

A.4反事实鲁棒性

反事实鲁棒性是指当RAG系统检索到的外部上下文中包含与客观事实不符、过时或具有明显误导

性的信息时，系统能够识别出这些错误，并通过技术手段（如依赖模型内置知识或者其他验证手段

等）进行修正，而不是盲目地采信并复述这些错误信息的能力。

从评价指标上来看，可使用的评估指标包括错误检测率、错误修正率等。

11

SJ/TXXXXX—XXXX

a)错误检测率：衡量当模型面对包含事实错误的上下文时，能否在回答中明确指出所提供信

息存在问题的比例。例如，模型是否会生成“根据我所知，您提供的文档中关于……的信

息似乎不准确”或类似表述。

b)错误修正率：在模型识别出上下文错误的前提下，它能否忽略错误信息并给出正确答案的

比例。

12

您可能关注的文档

最近下载

文档评论（0）

雄霸天下 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

相关文档

版权处理: 版权声明; 侵权处理; 免责声明; 致被侵权者一封信; 网站诺言

使用帮助: 用户协议; 隐私政策; 上传下载; 投稿帮助; 文档保障服务承诺

文赚学院: 文赚入门; 工具技巧; 官方动态; 文档分析

关于: 关于网站; 联系我们; 企业文化; 公司优势; 寻找合作

更多: 机构入驻; 内容整治报告; 原创力公益; 版权公示; 处罚记录; 分享赚钱

: 原创力文档APP下载

: 关注微信公众号

原创力文档从2008年开站以来，已有数亿文档，我们定位于“知识共享、知识服务”；我们为内容提供方提供“无忧创作”解决方案：您作为内容提供方只需要将您创作的数字作品提供/授权给我们，后续的质量管理/宣传/推广/销售/内容分发/开具发票/售后/退款等均由我们完成，让您创作无后顾之忧，让您安心创作更多优质的数字作品！上传者QQ群（最新）：751299218。
有任何问题，请随时联系智能客服，侵权专属客服QQ：2885784724！其它问题点击联系我们！本站内容，未经授权，不得采集、搬运！包括但不限于Al采集后用于训练，侵权必究！

公安局备案号:51011502000106|工信部备案号:蜀ICP备08101938号-1|ICP经营许可证/EDI许可证:川B2-20180569|公司营业执照|出版物经营许可证:成新出发高新字第046号|网信算备:510107145616301250011号
© 2010-2025 max.book118.com 原创力文档. All Rights Reserved 四川文动网络科技有限公司违法与不良信息举报电话：18582317992