- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
金融工程专题报告
内容目录
一、RAG:大模型应用中的重要架构6
1.1RAGor微调?RAG架构为何如此重要6
1.2知识库+LLM?RAG如何辅助大模型落地6
1.3检索增强+逻辑推理!解锁RAG应用场景7
二、RAG广阔前景下隐藏的痛点问题8
2.1索引入库:如何存入高质量文档信息?8
2.2检索输出:如何获取强匹配搜索结果?9
2.3中枢结点:如何得到高效数据库支持?9
三、注重质量的RAGFlow开源解决方案9
3.1高质量要求:“Qualityin,Qualityout”9
3.2RAGFlow方案对痛点解决的努力与实现10
四、高质量的RAG知识库需要什么?11
4.1好的开始:文本识别与分块11
4.1.1DeepDoc功能与效果对比11
4.1.2DeepDoc解析分块策略分析12
4.2好的兼容:结构化数据支持13
4.2.1RAGFow解析结构化数据表格13
4.2.2结构化数据提升知识库能力14
4.3好的处理:Raptor策略与知识图谱策略14
4.3.1Raptor策略实现召回增强14
4.3.2知识图谱捕获增强查询15
4.4好的转换:Embedding模型选择17
4.5好的检索:混合搜索与多路召回18
4.6好的匹配:重排序与Rerank模型选择19
4.6.1RAGFlow的重排序策略实现19
4.6.2重排序模型(Reranker)模型选择21
4.7.好的输出:LLM模型相关处理21
4.7.1Prompt+{knowledge}结构输入21
4.7.2引入DeepResearch推理过程22
4.8好的存储:向量数据库支持22
4.8.1Elasticsearch数据库,初步实现22
4.8.2文本向量化入库流程23
4.8.3Infinity向量数据库,未来选择23
敬请参阅最后一页特别声明2
金融工程专题报告
4.9RAGFlow解决方案概览24
五、RAGFlow效果评估检验24
5.1基础评估检验方案设计24
5.1.1样本选择与问题设置24
5.1.2效果衡量与评估指标设置26
5.1.3最终评估指标选择27
5.2.RAGFlow解析效果检验28
5.2.1文本文档解析效果检验28
5.2.2表格数据解析效果检验29
5.3模型选型与参数寻优30
5.3.1Embedding与重排序模型的最佳组合30
5.3.2RAGFlow最佳解析与检索参数选择31
5.4RAGFlow评估结果与最佳方案32
六、RAGFlow金融投研应用32
6.1RAGFlow的众多能力扩展应用前景32
6.2金融领域的RAGFlow应用场景实例33
七、总结34
风险提示34
图表目录
图表1:RAG架构工作流6
图表2:非结构化数据示例7
图表3:结构化数据示例7
图表4:RAG痛点分析流程图8
图表5:常见RAG解决方案对比9
图表6:RAGFlow系统架构10
图表7:常用文本分析组件功能对比11
图表8:MinerU效果图12
图
文档评论(0)