- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
内容目录
内容目录 2
图表目录 2
一、RAG:What,Why,How? 4
为什么需要RAG? 4
为什么必须要RAG?RAGvs长上下文 5
RAG的架构流程与优化路径 7
如何选择适当的检索算法? 8
二、产业链与概念股梳理全流程升级 11
多源知识库搭建 11
混合检索与时间加权 12
文本处理与大模型选择 13
模型效果提升——产业链梳理 13
模型效果提升——概念股梳理 15
三、概念领涨股特征识别与领涨组合构造 17
热点行情复盘 18
领涨股具备什么特征? 18
领涨股组合增强方案 20
四、总结 23
参考文献 23
风险提示 24
图表目录
图表1:RAG通用架构 4
图表2:GPT-4128k“大海捞针”测试结果 5
图表3:Claude-2.1200k“大海捞针”测试结果 6
图表4:各个大模型在中文版大海捞针SC-200K上的表现 6
图表5:Query-basedRAG流程示意图 7
图表6:RAG效果改进路径 8
图表7:混合检索(HybridRetrieval)流程示意图 10
图表8:“产业链Agent”运行流程图 11
图表9:多源知识库融合流程 12
图表10:知识库检索时间加权 12
图表11:“华为产业链”图谱结果 13
图表12:“低空经济”图谱结果 14
图表13:“人形机器人”图谱结果 14
图表14:“智能驾驶”图谱结果 15
图表15:“华为产业链”概念股结果 15
图表16:“AI手机”概念净值对比 17
图表17:“人形机器人”概念净值对比 17
图表18:“合成生物学”概念净值对比 17
图表19:“低空经济”概念净值对比 17
图表20:各概念启动时间点 18
图表21:“AI手机”概念行情 18
图表22:“人形机器人”概念行情 18
图表23:“合成生物学”概念行情 18
图表24:“低空经济”概念行情 18
图表25:“AI手机”动量Top10组合累计收益 19
图表26:“人形机器人”动量Top10组合累计收益 19
图表27:“合成生物学”动量Top10组合累计收益 19
图表28:“低空经济”动量Top10组合累计收益 19
图表29:“AI手机”非流动性Top10组合累计收益 20
图表30:“人形机器人”非流动性Top10组合累计收益 20
图表31:“合成生物学”非流动性Top10组合累计收益 20
图表32:“低空经济”非流动性Top10组合累计收益 20
图表33:“AI手机”领涨因子Top5组合累计收益 20
图表34:“人形机器人”领涨因子Top5组合累计收益 20
图表35:“合成生物学”领涨因子Top5组合累计收益 21
图表36:“低空经济”领涨因子Top5组合累计收益 21
图表37:领涨组合构造方法 21
图表38:“AI手机”领涨组合累计收益展示 21
图表39:“人形机器人”领涨组合累计收益展示 22
图表40:“合成生物学”领涨组合累计收益展示 22
图表41:“低空经济”领涨组合累计收益展示 22
图表42:各概念领涨组合持仓与收益表现 23
一、RAG:What,Why,How?
为什么需要RAG?
目前大模型展现出很强的生成能力,基本能够满足大部分日常问答,但在进行特定领域的问答时依旧容易出现脱离实际的不正确回答,我们称之为“幻觉”(Hallucination)现象。这一现象在某些对准确性要求较高的应用领域是令人难以接受的。“幻觉”的产生原因之一在于大模型的预训练数据中并不包含相关知识文本,或大模型对其中概念出现了混淆,在没有得到补充信息指引的情况下只能“强行”回答,也因此容易出错。对此,一个很朴素的想法是:如果将需要的知识告诉大模型,能否提升其表现?
RAG(RetrievalAugmentedGeneration,检索增强生成)便基于这一想法诞生了。简单来说,RAG是一种优化大语言模型(LLM)生成质量的技术,在知识库中检索与用户输入高相关的信息,输入文本进行补充,并提升模型回答的质量。RAG能在应用端带来效果的快速提升,相比于微调等方式,它便于快速部署、无需大量的时间与算力资源投入,是一种更经济高效的改进方法。
图表1:RAG通用架构
来源:《Retrieval-AugmentedGenerationforAI-GeneratedCon
您可能关注的文档
- 2024年二季度货币政策执行报告理解:央行的三个关切.docx
- 2024年宏观经济中期展望报告:修复式增长框架下的温和再通胀.docx
- 2024年秋季宏观经济与资本市场展望:把握新一轮改革投资机遇.docx
- 2024年市场流动性中期策略:破冰之后,细水长流.docx
- 2024年信用风险与评级调整回顾:信用环境整体向好,城投产业表现分化.docx
- 2024年主体评级调整有哪些特征?.docx
- 2024上半年土地市场表现如何?.docx
- 202407锂电行业产业链月报:2024年7月我国新能源汽车销量99.1万辆,同比%2b27%25.docx
- AI算力行业跟踪报告:英伟达新推B200AGPU,台股服务器7月营收增长提速.docx
- AI行业跟踪34期:Google优化AI赋能新工具,Figure发布新一代机器人.docx
文档评论(0)