网站大量收购独家精品文档,联系QQ:2885784924

大模型面试题-21-RAG(Retrieval-Augmented Generation)评测面.pdf

大模型面试题-21-RAG(Retrieval-Augmented Generation)评测面.pdf

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

RAG(Retrieval-AugmentedGeneration)评测面

来自:AiGC面试宝典

宁静致远2024年01月28日10:12

•RAG(Retrieval-AugmentedGeneration)评测面

•一、为什么需要对RAG进行评测?

•二、如何合成RAG测试集?

•三、RAG有哪些评估方法?

•3.1独立评估

•3.1.1介绍一下独立评估?

•3.1.2介绍一下独立评估模块?

•3.2端到端评估

•3.2.1介绍一下端到端评估

•3.2.2介绍一下端到端评估模块?

•四、RAG有哪些关键指标和能力?

•五、RAG有哪些评估框架?

•4.1RAGAS

•4.2ARES

•致谢

一、为什么需要对RAG进行评测?

在探索和优化RAG(检索增强生成器)的过程中,如何有效评估其性能已经成为关键问题。

二、如何合成RAG测试集?

假设你已经成功构建了一个RAG系统,并且现在想要评估它的性能。为了这个目的,你需要一个

评估数据集,该数据集包含以下列:

•question(问题):想要评估的RAG的问题

•ground_truths(真实答案):问题的真实答案

•answer(答案):RAG预测的答案

•contexts(上下文):RAG用于生成答案的相关信息列表

前两列代表真实数据,最后两列代表RAG预测数据。

要创建这样的数据集,我们首先需要生成问题和答案的元组。

接下来,在RAG上运行这些问题以获得预测结果。

•生成问题和基准答案(实践中可能会出现偏差)

要生成(问题、答案)元组,我们首先需要准备RAG数据,我们将其拆分为块,并将其嵌入向量

数据库中。完成这些步骤后,我们会指示LLM从指定主题中生成num_questions个问题,从而得

到问题和答案元组。

为了从给定的上下文中生成问题和答案,我们需要按照以下步骤操作:

1.选择一个随机块并将其作为根上下文

2.从向量数据库中检索K个相似的上下文

3.将根上下文和其K个相邻上下文的文本连接起来以构建一个更大的上下文

4.使用这个大的上下文和num_questions在以下的提示模板中生成问题和答案

\\

Yourtaskistoformulateexactly{num_questions}questionsfromgivencontextand

providetheanswertoeachone.

Endeachquestionwitha?characterandtheninanewlinewritetheanswerto

thatquestionusingonly

thecontextprovided.

Separateeachquestion/answerpairbyXXX

Eachquestionmuststartwithquestion:.

Eachanswermuststartwithanswer:.

Thequestionmustsatisfytherulesgivenbelow:

1.Thequestionshouldmakesensetohumansevenwhenreadwithoutthegiven

context.

2.Thequestionshouldbefullyansweredfromthegivencontext.

3.Thequestionshouldbeframedfromapartofcontextthatcontainsimportant

information.Itcana

文档评论(0)

189****7098 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档