- 0
- 0
- 约3.88千字
- 约 14页
- 2026-04-29 发布于河北
- 举报
第8章RAG全链路架构与复杂文档解析技术从基础到高级,构建企业级知识问答系统08CHAPTER大模型全栈工程师核心课程系列·模块二(核心技术栈:微调Fine-tuning+RAG检索增强+模型部署Serving)
本章内容概览RAG演进路线深入解析从NaiveRAG到AgenticRAG的完整技术演进路径,掌握不同阶段的核心架构差异。复杂文档解析技术系统学习Unstructured、Marker等主流解析工具的底层原理,并通过实战案例掌握复杂文档的处理方法。上手演示与问题排查通过核心代码示例进行手把手教学,结合实际开发中遇到的典型报错,提供详细的问题排查与优化方案。总结与课后任务回顾本章RAG进阶的核心知识点,通过设计针对性的实操任务,帮助大家巩固所学,实现从理论到实践的闭环。
PART01RAG演进路线:从Naive到Agentic一个典型的RAG系统包含四个关键阶段,形成一个完整的闭环:知识准备阶段(Offline)文档加载对接多源异构数据源,如PDF、TXT、数据库等,读取并解析原始文档内容。文档处理与分块清洗噪声数据,将长文本切分为语义完整的小文本块(Chunk),适配模型窗口。向量化与存储使用Embedding模型将文本块转为高维向量,存入向量数据库构建知识索引。查询处理阶段(Online)查询处理与检索将用户问题向量化,
原创力文档

文档评论(0)