Beta猎手系列之十二：RAG-ChatGPT提前布局热点概念领涨股.docx

下载文档

17
0
约2.23万字
约 24页
2024-09-06 发布于北京
举报
版权申诉
保障服务

Beta猎手系列之十二：RAG-ChatGPT提前布局热点概念领涨股.docx

1、本文档共24页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

内容目录

内容目录 2

图表目录 2

一、RAG:What,Why,How? 4

为什么需要RAG？ 4

为什么必须要RAG？RAGvs长上下文 5

RAG的架构流程与优化路径 7

如何选择适当的检索算法？ 8

二、产业链与概念股梳理全流程升级 11

多源知识库搭建 11

混合检索与时间加权 12

文本处理与大模型选择 13

模型效果提升——产业链梳理 13

模型效果提升——概念股梳理 15

三、概念领涨股特征识别与领涨组合构造 17

热点行情复盘 18

领涨股具备什么特征？ 18

领涨股组合增强方案 20

四、总结 23

参考文献 23

风险提示 24

图表目录

图表1：RAG通用架构 4

图表2：GPT-4128k“大海捞针”测试结果 5

图表3：Claude-2.1200k“大海捞针”测试结果 6

图表4：各个大模型在中文版大海捞针SC-200K上的表现 6

图表5：Query-basedRAG流程示意图 7

图表6：RAG效果改进路径 8

图表7：混合检索(HybridRetrieval)流程示意图 10

图表8：“产业链Agent”运行流程图 11

图表9：多源知识库融合流程 12

图表10：知识库检索时间加权 12

图表11：“华为产业链”图谱结果 13

图表12：“低空经济”图谱结果 14

图表13：“人形机器人”图谱结果 14

图表14：“智能驾驶”图谱结果 15

图表15：“华为产业链”概念股结果 15

图表16：“AI手机”概念净值对比 17

图表17：“人形机器人”概念净值对比 17

图表18：“合成生物学”概念净值对比 17

图表19：“低空经济”概念净值对比 17

图表20：各概念启动时间点 18

图表21：“AI手机”概念行情 18

图表22：“人形机器人”概念行情 18

图表23：“合成生物学”概念行情 18

图表24：“低空经济”概念行情 18

图表25：“AI手机”动量Top10组合累计收益 19

图表26：“人形机器人”动量Top10组合累计收益 19

图表27：“合成生物学”动量Top10组合累计收益 19

图表28：“低空经济”动量Top10组合累计收益 19

图表29：“AI手机”非流动性Top10组合累计收益 20

图表30：“人形机器人”非流动性Top10组合累计收益 20

图表31：“合成生物学”非流动性Top10组合累计收益 20

图表32：“低空经济”非流动性Top10组合累计收益 20

图表33：“AI手机”领涨因子Top5组合累计收益 20

图表34：“人形机器人”领涨因子Top5组合累计收益 20

图表35：“合成生物学”领涨因子Top5组合累计收益 21

图表36：“低空经济”领涨因子Top5组合累计收益 21

图表37：领涨组合构造方法 21

图表38：“AI手机”领涨组合累计收益展示 21

图表39：“人形机器人”领涨组合累计收益展示 22

图表40：“合成生物学”领涨组合累计收益展示 22

图表41：“低空经济”领涨组合累计收益展示 22

图表42：各概念领涨组合持仓与收益表现 23

一、RAG:What,Why,How?

为什么需要RAG？

目前大模型展现出很强的生成能力，基本能够满足大部分日常问答，但在进行特定领域的问答时依旧容易出现脱离实际的不正确回答，我们称之为“幻觉”（Hallucination）现象。这一现象在某些对准确性要求较高的应用领域是令人难以接受的。“幻觉”的产生原因之一在于大模型的预训练数据中并不包含相关知识文本，或大模型对其中概念出现了混淆，在没有得到补充信息指引的情况下只能“强行”回答，也因此容易出错。对此，一个很朴素的想法是：如果将需要的知识告诉大模型，能否提升其表现？

RAG（RetrievalAugmentedGeneration，检索增强生成）便基于这一想法诞生了。简单来说，RAG是一种优化大语言模型（LLM）生成质量的技术，在知识库中检索与用户输入高相关的信息，输入文本进行补充，并提升模型回答的质量。RAG能在应用端带来效果的快速提升，相比于微调等方式，它便于快速部署、无需大量的时间与算力资源投入，是一种更经济高效的改进方法。

图表1：RAG通用架构

来源：《Retrieval-AugmentedGenerationforAI-GeneratedCon