- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
RAG(Retrieval-AugmentedGeneration)评测面
来自:AiGC面试宝典
宁静致远2024年01月28日10:12
•RAG(Retrieval-AugmentedGeneration)评测面
•一、为什么需要对RAG进行评测?
•二、如何合成RAG测试集?
•三、RAG有哪些评估方法?
•3.1独立评估
•3.1.1介绍一下独立评估?
•3.1.2介绍一下独立评估模块?
•3.2端到端评估
•3.2.1介绍一下端到端评估
•3.2.2介绍一下端到端评估模块?
•四、RAG有哪些关键指标和能力?
•五、RAG有哪些评估框架?
•4.1RAGAS
•4.2ARES
•致谢
一、为什么需要对RAG进行评测?
在探索和优化RAG(检索增强生成器)的过程中,如何有效评估其性能已经成为关键问题。
二、如何合成RAG测试集?
假设你已经成功构建了一个RAG系统,并且现在想要评估它的性能。为了这个目的,你需要一个
评估数据集,该数据集包含以下列:
•question(问题):想要评估的RAG的问题
•ground_truths(真实答案):问题的真实答案
•answer(答案):RAG预测的答案
•contexts(上下文):RAG用于生成答案的相关信息列表
前两列代表真实数据,最后两列代表RAG预测数据。
要创建这样的数据集,我们首先需要生成问题和答案的元组。
接下来,在RAG上运行这些问题以获得预测结果。
•生成问题和基准答案(实践中可能会出现偏差)
要生成(问题、答案)元组,我们首先需要准备RAG数据,我们将其拆分为块,并将其嵌入向量
数据库中。完成这些步骤后,我们会指示LLM从指定主题中生成num_questions个问题,从而得
到问题和答案元组。
为了从给定的上下文中生成问题和答案,我们需要按照以下步骤操作:
1.选择一个随机块并将其作为根上下文
2.从向量数据库中检索K个相似的上下文
3.将根上下文和其K个相邻上下文的文本连接起来以构建一个更大的上下文
4.使用这个大的上下文和num_questions在以下的提示模板中生成问题和答案
\\
Yourtaskistoformulateexactly{num_questions}questionsfromgivencontextand
providetheanswertoeachone.
Endeachquestionwitha?characterandtheninanewlinewritetheanswerto
thatquestionusingonly
thecontextprovided.
Separateeachquestion/answerpairbyXXX
Eachquestionmuststartwithquestion:.
Eachanswermuststartwithanswer:.
Thequestionmustsatisfytherulesgivenbelow:
1.Thequestionshouldmakesensetohumansevenwhenreadwithoutthegiven
context.
2.Thequestionshouldbefullyansweredfromthegivencontext.
3.Thequestionshouldbeframedfromapartofcontextthatcontainsimportant
information.Itcana
您可能关注的文档
- 大模型面试题-5-transformers 操作篇.pdf
- 大模型面试题-4-Attention 升级面.pdf
- 大模型面试题-3-LLMs 激活函数篇.pdf
- 大模型面试题-2-Layer normalization 篇.pdf
- 大模型面试题-1-大模型(LLMs)基础面.pdf
- 大模型面试题-43-显存优化策略篇.pdf
- 大模型面试题-42-大模型(LLMs)显存问题面.pdf
- 大模型面试题-41-大模型(LLMs)LLM生成SFT数据方法面.pdf
- 大模型面试题-40-大模型(LLMs)训练集面.pdf
- 大模型面试题-39-强化学习在自然语言处理下的应用篇.pdf
- 2025年福建省图书馆招聘考试试卷带解析含答案(夺分金卷).docx
- 2025年福建省图书馆招聘考试试卷带解析【夺冠】.docx
- 2025年河南省图书馆招聘考试试卷带解析附参考答案(培优B卷).docx
- 2025年河南省辅警招聘考试试题带解析汇编.docx
- 2025年浙江省图书馆招聘考试试卷带解析必背【B卷】.docx
- 2025年福建省图书馆招聘考试试卷带解析含答案【A卷】.docx
- 2025年福建省图书馆招聘考试试卷带解析及参考答案(满分必刷).docx
- 2025年山西临汾市翼城县高三一模数学试卷及答案.docx
- 2025年福建省图书馆招聘考试试卷带解析含答案(实用).docx
- 2025年浙江省图书馆招聘考试试卷带解析及参考答案【基础题】通用题库.docx
文档评论(0)