- 0
- 0
- 约7.51千字
- 约 10页
- 2026-03-11 发布于广东
- 举报
第五章大模型检索增强
目录
10.1概述
10.2非结构化检索增强
10.3结构化检索增强
10.4讨论
10.1概述:什么是RAG
检索增强生成(Retrieval-AugmentedGeneration,RAG)是一种人工智能框架,它结合了传统信息检索系统(如搜索引擎和数据库)的优势与生成式大型语言模型(LLM)的能力。
RAGSystemArchitecture
02
Userquery
LLM的局限性
●在没有答案时提供虚假信息。
●在用户期望具体且最新的回应时,提供过时或泛化的信息。
●基于非权威来源生成回复。
·由于术语混淆而生成不准确的回复,不同的训练来源可能使用相同的术语来指代不同的事物。
10.1概述:为什么要RAG?
10.1概述:为什么要RAG?
尽管也可以通过微调增强模型的能力,但是RAG具备独特的优势。
·成本更低
·能力更可控(微调经常会破坏模型的其他能力)
·能访问实时信息
·企业隐私数据不加入训练
MessageDeepSeek
DeepThink(R1)
Whatdoyouwanttoknow?
⑤DeepSearch
以联网搜索为代表的RAG是大模型应用的主流
MessageChatGPT
10.1概述:结构化与非结构化数据
狭义的RAG依赖向量数据库,本书则根据外部知识的数据特征,大致分为非结构化检索增强和结构化检索增强。
常见结构化数据
常见非结构化数据
关系数据库
知识图谱
目录
10.1概述
10.2非结构化检索增强
10.3结构化检索增强
10.4讨论
10.2非结构化检索增强
非结构化的大模型检索增强是指将大语言模型技术与传统的检索技术相结合,对海量非结构化数据(如文本、音频、视频等)进行智能化搜索和信息提取,并将检索到的信息融合到大模型生成结果中的一种方法。
10.2.1文档检索增强
尽管可以通过关键词匹配的方式检索文档,但目前主流的方式是
通过向量的语义检索。
三个关键问题?
·什么是向量化表示?
·如何度量语义相似?
·如何搜索?
向量数据库
大语言模型
检索
用户
10.2.1文档检索增强:什么是向量化表示
数据向量化(Vectorization)是使用机器学习技术,将各类非结构化数据转化为固定长度的数字向量的过程。
UnstructureddataDeeplearningmodelsEmbedingvectors
比如“西南财经大学”经过OpenAI的text-embedding-3-small编码后,会变成一个长度为1536的向量:
[-0.034270092844963074,-0.01136163529008627,…]
10.2.1文档检索增强:如何度量语义相似
向量化的好处是能够通过数字表征语义,并且语义相似的信息在空间上距离更近。
Gave
research
WordEmbeddings
Seattle
xy
talk
10.2.1文档检索增强:如何度量语义相似
因此,常用向量的距离表示其语义相似度,常用的距离函数有余弦相似度、点积、欧式距离等。
经过text-embedding-3-small编码后,“狗”和“猫”的余弦相似度约为0.66,而“狗”和“苹果”的相似度约为0.39。
如果数据规模不大(如数万级别),简单的暴力搜索即可。为了更高效的搜索,需要使用索引技术,执行k近邻查询。
10.2.1文档检索增强:如何搜索
milvus|米zilliz
LanceDBPinecone
chunk1
chunk2
chunk3
n
n
n
如果直接对长文档进行计算向量(也称嵌入)会丢失大量信息。更重要的是,长文档中大部分内容可能与搜索并不相关,这会干扰大模型的回复。因此,常见的策略是对文档进行分块(chunk)。
常见分块策略
·基于分隔符(比如句号、换行符)
·基于字数
·基于语义
10.2.1文档检索增强
10.2.2网络检索增强
网络检索增强与文档检索增强基本原理相同,都是从外部来源检索信息来增强模型的能力,但二者的检索来源有所不同。
网络检索增强的核心优势
·动态知识源:实时抓取网页/论坛/新闻等开放数据
·时效性突破:获取最新信息(对比静态文档库)
·开放领域覆盖:适应跨行业、跨学科的综合查询
·长尾需求支持:响应突发新闻/技术趋势
UserRetriever
10.2.2网
您可能关注的文档
- 麦肯锡业务流程体系优化规划方法论.pptx
- (苏教版)数学五年级上册寒假“天天练”作业设计,含30份题组,附参考答案.docx
- 2025年河南省中考数学试卷真题及答案详解(精校打印版).docx
- EN 1090认证FPC手册模板(英文 )FPC-Manual.docx
- 环境影响评价报告公示:热塑性聚氨酯材料生物膜开发线和生物膜开发线和TPU革生线环评报告.docx
- 武汉大学博士学位英语期末考试复习资料.docx
- 洗瓶机结构设计.docx
- 智慧医疗分级评价方法及标准(2025版)(zq意见g).docx
- 《碳金融》 课件 彭红军 第8--10章 碳金融市场体系、运行机制与效应---中国碳金融市场发展.pptx
- 《幼儿园玩教具制作和环境创设》 项目六 发现自然材料玩教具.pptx
- 散文题型03 理解分析词句(题型专练)(全国通用)(解析版)-2026年高考语文二轮复习讲练.docx
- 考前押题10 阅读理解之应用文——关注生活 学以致用(原卷版)(押题训练)2026年高考英语阅读理解突破策略及押题(全国通用).docx
- 清单04 综合性学习之语言表达(仿写邀请转述劝说) 活动策划(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 清单09 古诗文对比阅读之内容 情感 写法对比 语言 炼字 拓展探究(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 小说易错02 重点情节理解偏差(选择题)(易错专练)(全国通用)(原卷版)-2026年高考语文二轮复习讲练.docx
- 专题01 声现象(题型专练)(全国通用)(原卷版)2026年中考物理二轮复习讲练.docx
- 清单08 文言文(议论类 书信应用类)阅读之论点把握 文体特点(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 清单11 记叙文阅读之朗读设计 表达技巧 主旨情感 开放探究(知识 方法 能力清单)(解析版)-2026年中考语文二轮复习讲练(全国通用).docx
- 语言清单05 语法填空中的词类(五)无提示词--连词(全国通用)(原卷版)2026年高考英语二轮复习讲练.docx
- 第04讲 想象探索与科学精神(《西游记》《海底两万里》《昆虫记》全国通用(讲义)(解析版)2026年中考语文一轮复习讲练.docx
原创力文档

文档评论(0)