Beta猎手系列之十二:RAG-ChatGPT提前布局热点概念领涨股.docx

Beta猎手系列之十二:RAG-ChatGPT提前布局热点概念领涨股.docx

  1. 1、本文档共24页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

内容目录

内容目录 2

图表目录 2

一、RAG:What,Why,How? 4

为什么需要RAG? 4

为什么必须要RAG?RAGvs长上下文 5

RAG的架构流程与优化路径 7

如何选择适当的检索算法? 8

二、产业链与概念股梳理全流程升级 11

多源知识库搭建 11

混合检索与时间加权 12

文本处理与大模型选择 13

模型效果提升——产业链梳理 13

模型效果提升——概念股梳理 15

三、概念领涨股特征识别与领涨组合构造 17

热点行情复盘 18

领涨股具备什么特征? 18

领涨股组合增强方案 20

四、总结 23

参考文献 23

风险提示 24

图表目录

图表1:RAG通用架构 4

图表2:GPT-4128k“大海捞针”测试结果 5

图表3:Claude-2.1200k“大海捞针”测试结果 6

图表4:各个大模型在中文版大海捞针SC-200K上的表现 6

图表5:Query-basedRAG流程示意图 7

图表6:RAG效果改进路径 8

图表7:混合检索(HybridRetrieval)流程示意图 10

图表8:“产业链Agent”运行流程图 11

图表9:多源知识库融合流程 12

图表10:知识库检索时间加权 12

图表11:“华为产业链”图谱结果 13

图表12:“低空经济”图谱结果 14

图表13:“人形机器人”图谱结果 14

图表14:“智能驾驶”图谱结果 15

图表15:“华为产业链”概念股结果 15

图表16:“AI手机”概念净值对比 17

图表17:“人形机器人”概念净值对比 17

图表18:“合成生物学”概念净值对比 17

图表19:“低空经济”概念净值对比 17

图表20:各概念启动时间点 18

图表21:“AI手机”概念行情 18

图表22:“人形机器人”概念行情 18

图表23:“合成生物学”概念行情 18

图表24:“低空经济”概念行情 18

图表25:“AI手机”动量Top10组合累计收益 19

图表26:“人形机器人”动量Top10组合累计收益 19

图表27:“合成生物学”动量Top10组合累计收益 19

图表28:“低空经济”动量Top10组合累计收益 19

图表29:“AI手机”非流动性Top10组合累计收益 20

图表30:“人形机器人”非流动性Top10组合累计收益 20

图表31:“合成生物学”非流动性Top10组合累计收益 20

图表32:“低空经济”非流动性Top10组合累计收益 20

图表33:“AI手机”领涨因子Top5组合累计收益 20

图表34:“人形机器人”领涨因子Top5组合累计收益 20

图表35:“合成生物学”领涨因子Top5组合累计收益 21

图表36:“低空经济”领涨因子Top5组合累计收益 21

图表37:领涨组合构造方法 21

图表38:“AI手机”领涨组合累计收益展示 21

图表39:“人形机器人”领涨组合累计收益展示 22

图表40:“合成生物学”领涨组合累计收益展示 22

图表41:“低空经济”领涨组合累计收益展示 22

图表42:各概念领涨组合持仓与收益表现 23

一、RAG:What,Why,How?

为什么需要RAG?

目前大模型展现出很强的生成能力,基本能够满足大部分日常问答,但在进行特定领域的问答时依旧容易出现脱离实际的不正确回答,我们称之为“幻觉”(Hallucination)现象。这一现象在某些对准确性要求较高的应用领域是令人难以接受的。“幻觉”的产生原因之一在于大模型的预训练数据中并不包含相关知识文本,或大模型对其中概念出现了混淆,在没有得到补充信息指引的情况下只能“强行”回答,也因此容易出错。对此,一个很朴素的想法是:如果将需要的知识告诉大模型,能否提升其表现?

RAG(RetrievalAugmentedGeneration,检索增强生成)便基于这一想法诞生了。简单来说,RAG是一种优化大语言模型(LLM)生成质量的技术,在知识库中检索与用户输入高相关的信息,输入文本进行补充,并提升模型回答的质量。RAG能在应用端带来效果的快速提升,相比于微调等方式,它便于快速部署、无需大量的时间与算力资源投入,是一种更经济高效的改进方法。

图表1:RAG通用架构

来源:《Retrieval-AugmentedGenerationforAI-GeneratedCon

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档