第10章:进阶 RAG 策略:重排、分块与查询改写.pptxVIP

  • 0
  • 0
  • 约6.35千字
  • 约 18页
  • 2026-04-29 发布于河北
  • 举报

第10章:进阶 RAG 策略:重排、分块与查询改写.pptx

进阶RAG策略重排·分块·查询改写大模型全栈工程师系列课程CHAPTER10/第10章

课程目录01重排(Reranking)从“大海捞针”到“精准定位”,通过二次排序大幅提升检索结果的相关性与准确率。02分块(Chunking)让信息单元更“智能”,优化文本切分策略,解决上下文碎片化与信息丢失的痛点。03查询改写(QueryRewriting)让系统更懂你,处理用户模糊或口语化的输入,生成高质量的检索关键词以召回目标。04实战与总结构建完整的高级RAG系统,串联全流程技术点,并总结开发中常见的问题与解决方案。

01.重排(Reranking):从“大海捞针”到“精准定位”为什么需要重排?基础RAG的瓶颈检索精度不足Bi-Encoder向量检索虽快,但易忽略深层语义关联,常出现“搜到不相关”或“漏搜关键信息”的情况。信息碎片化严重固定大小的文本分块策略容易切断上下文逻辑,导致大模型无法理解信息的完整语义,生成效果打折。用户查询表达不佳原始查询往往模糊、简短,与知识库的专业表达方式存在天然鸿沟,导致系统难以准确匹配意图。进阶重排策略的核心价值显著提升检索精准度引入Cross-Encoder重排技术,对初步检索结果进行二次深度语义筛选,精准定位最相关的Top-K信息。优化信息单元完整性采用语义感知的动态分块策略,确保送入大模型的上下文是完整且逻辑连贯的

文档评论(0)

1亿VIP精品文档

相关文档