大模型赋能投研之七:如何结合结构化数据搭建本地智能投研系统?-RAGFlow原理篇.pdf

大模型赋能投研之七:如何结合结构化数据搭建本地智能投研系统?-RAGFlow原理篇.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

金融工程专题报告

内容目录

一、RAG:大模型应用中的重要架构6

1.1RAGor微调?RAG架构为何如此重要6

1.2知识库+LLM?RAG如何辅助大模型落地6

1.3检索增强+逻辑推理!解锁RAG应用场景7

二、RAG广阔前景下隐藏的痛点问题8

2.1索引入库:如何存入高质量文档信息?8

2.2检索输出:如何获取强匹配搜索结果?9

2.3中枢结点:如何得到高效数据库支持?9

三、注重质量的RAGFlow开源解决方案9

3.1高质量要求:“Qualityin,Qualityout”9

3.2RAGFlow方案对痛点解决的努力与实现10

四、高质量的RAG知识库需要什么?11

4.1好的开始:文本识别与分块11

4.1.1DeepDoc功能与效果对比11

4.1.2DeepDoc解析分块策略分析12

4.2好的兼容:结构化数据支持13

4.2.1RAGFow解析结构化数据表格13

4.2.2结构化数据提升知识库能力14

4.3好的处理:Raptor策略与知识图谱策略14

4.3.1Raptor策略实现召回增强14

4.3.2知识图谱捕获增强查询15

4.4好的转换:Embedding模型选择17

4.5好的检索:混合搜索与多路召回18

4.6好的匹配:重排序与Rerank模型选择19

4.6.1RAGFlow的重排序策略实现19

4.6.2重排序模型(Reranker)模型选择21

4.7.好的输出:LLM模型相关处理21

4.7.1Prompt+{knowledge}结构输入21

4.7.2引入DeepResearch推理过程22

4.8好的存储:向量数据库支持22

4.8.1Elasticsearch数据库,初步实现22

4.8.2文本向量化入库流程23

4.8.3Infinity向量数据库,未来选择23

敬请参阅最后一页特别声明2

金融工程专题报告

4.9RAGFlow解决方案概览24

五、RAGFlow效果评估检验24

5.1基础评估检验方案设计24

5.1.1样本选择与问题设置24

5.1.2效果衡量与评估指标设置26

5.1.3最终评估指标选择27

5.2.RAGFlow解析效果检验28

5.2.1文本文档解析效果检验28

5.2.2表格数据解析效果检验29

5.3模型选型与参数寻优30

5.3.1Embedding与重排序模型的最佳组合30

5.3.2RAGFlow最佳解析与检索参数选择31

5.4RAGFlow评估结果与最佳方案32

六、RAGFlow金融投研应用32

6.1RAGFlow的众多能力扩展应用前景32

6.2金融领域的RAGFlow应用场景实例33

七、总结34

风险提示34

图表目录

图表1:RAG架构工作流6

图表2:非结构化数据示例7

图表3:结构化数据示例7

图表4:RAG痛点分析流程图8

图表5:常见RAG解决方案对比9

图表6:RAGFlow系统架构10

图表7:常用文本分析组件功能对比11

图表8:MinerU效果图12

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档