- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
000
本篇报告继续探讨大语言模型在热点投资上的应用,是在《Beta猎手系列之七:追上投资热点——基于LLM的产业链
图谱智能化生成》提出的“产业链Agent”模型的基础上做了进一步拓展,进一步提升了产业链与概念股梳理效果,
并增加了识别概念领涨股的功能,帮助投资者更准确地把握行情。
RAG:What,Why,How?
RAG是一种优化大语言模型输出质量的技术,通过在指定数据库中检索高相关信息来提升模型回答质量,适用于垂直
领域知识增强、最新知识更新、扩展上下文长度等多种应用场景。通过“海底捞针”实验我们证明,尽管大模型支持
输入更长上下文,但在处理较长文本时可能出现能力下降,这也是我们必须用RAG提炼信息,实现降本增效的原因。
基于查询的RAG是当前较主流的RAG框架:检索出高相关文本后通过Prompt与查询一起输入大模型,提升回答的质
量。我们可以从初始查询、检索器、生成器等方面对RAG框架进行优化,其中检索器是决定RAG效果的关键。检索器
包括检索算法、Embedding模型以及向量数据库的选择等,能实现对检索结果的质量以及大数据下检索效率的提升,
需要使用者根据应用的特征专门挑选检索方式。
产业链与概念股梳理全流程升级
我们推出“产业链Agent”模型v2.0版本,全流程提升梳理结果质量。首先,我们搭建了涵盖新闻、研报、公司公告
等多个来源的知识库,并针对产业链梳理与概念股梳理两种不同的任务分别进行处理;考虑到中文金融文本的特性,
我们选择混合检索的算法,并创新地提出了时间加权的概念,将信息的时效性纳入考虑;此外,我们也实现对文本做
进一步浓缩,以及判断可能存在的概念股映射不准的问题,并最大化发挥不同大模型的优势。
产业链梳理结果上来看,提升检索文本质量之后,我们能直接生成任意概念的产业链图谱,也能给到更加完善的图谱
结果;概念股梳理结果更加准确,且我们给出的概念股组合等权指数与Wind人工梳理构造的指数走势基本一致,表
明我们给到的概念股范围有较高准确度。
概念领涨股特征识别与领涨组合构造
模型梳理得到的概念股数量较多,我们试图通过量价特征从中找出领涨股,帮助投资者更好把握热点行情。我们以AI
手机、人形机器人、合成生物学与低空经济四个概念为例,通过复盘确认了各概念的行情启动时间点。通过检验,我
们发现动量因子与非流动性因子在热点行情来临时具有一定选股效果。我们将两个因子做等权合成,同时叠加“尖峰
右偏”特征做第二层筛选,并在市值大于50亿的个股上做筛选,构造领涨组合。从回测结果上来看,领涨组合在概
念启动后的短期内相对概念指数以及Wind全A均有明显的超额收益。
风险提示
大语言模型输出结果具有一定随机性的风险;模型迭代升级、新功能开发可能会导致结论不同的风险;人工智能模型
得出的结论仅供参考,可能出现错误答案的风险。
敬请参阅最后一页特别声明1
扫码获取更多服务
金融工程专题报告
内容目录
内容目录2
图表目录2
一、RAG:What,Why,How?4
1.1为什么需要RAG?4
1.2为什么必须要RAG?RAGvs长上下文5
1.3RAG的架构流程与优化路径7
1.4如何选择适当的检索算法?8
二、产业链与概念股梳理全流程升级11
2.1多源知识库搭建11
2.2混合检索与时间加权12
2.3文本处理与大模型选择13
2.4模型效果提升——产业链梳理13
2.5模型效果提升——概念股梳理15
三、概念领涨股特征识别与领涨组合构造17
3.1热点行情复盘18
3.2领涨股具备什么特征?18
3.3领涨股组合增强方案20
四、总结23
参考文献23
风险提示24
图表目录
图表1:RAG通用架构
您可能关注的文档
- “打新定期跟踪”系列之一百八十三:科创板打新增加600万市值要求,预计中签率小幅提升-240819.pdf
- “固收%2b”策略与应用-240822.pdf
- “数”看期货:期指主力合约贴水均加深,IC主动对冲策略表现优异-240821.pdf
- 【宏观专题】2024美国大选系列三:24个领域的左与右,哈里斯VS特朗普-240820.pdf
- 【宏观专题】2024年Q1跨境资本季度跟踪:跨境资本净流出显著放缓-240822.pdf
- 【宏观专题】经济微观察系列一:消失的“其他”,地产之外的最大拖累-240819.pdf
- 【华福固收】煤炭行业偏弱运行怎么看-240818.pdf
- 【信用债观察】134号文或部分替代14号文-240818.pdf
- 【债券分析】7月海外月度观察:美联储为降息敞开大门,美债收益率下破4%25-240820.pdf
- 【专题报告】宏观因子FMP组合-240816.pdf
- 中国国家标准 GB/T 4214.17-2024家用和类似用途电器噪声测试方法 干式清洁机器人的特殊要求.pdf
- GB/T 4214.17-2024家用和类似用途电器噪声测试方法 干式清洁机器人的特殊要求.pdf
- 《GB/Z 43202.1-2024机器人 GB/T 36530的应用 第1部分:安全相关试验方法》.pdf
- GB/Z 43202.1-2024机器人 GB/T 36530的应用 第1部分:安全相关试验方法.pdf
- 中国国家标准 GB/Z 43202.1-2024机器人 GB/T 36530的应用 第1部分:安全相关试验方法.pdf
- 中国国家标准 GB/T 32455-2024航天术语 运输系统.pdf
- GB/T 32455-2024航天术语 运输系统.pdf
- 《GB/T 32455-2024航天术语 运输系统》.pdf
- GB/T 44369-2024用于技术设计的人体运动生物力学测量基础项目.pdf
- 中国国家标准 GB/T 44369-2024用于技术设计的人体运动生物力学测量基础项目.pdf
文档评论(0)