AI大模型在投资研究中应用及未来趋势.docx

下载文档

0
0
约2.25万字
约 28页
2025-02-28 发布于北京
举报
版权申诉
保障服务

AI大模型在投资研究中应用及未来趋势.docx

1、本文档共28页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

正文目录

一、大语言模型的发展回顾 4

大语言模型的技术发展路线 4

能力提升和训练成本降低加速AI应用普及 5

二、大语言模型在金融领域中的应用 8

大语言模型的官方API调用与本地部署 8

大模型在投研场景中的应用 11

面向金融领域的大模型 12

思维链与检索增强 15

基于LLM的AIAgent系统 21

三、投研场景下的AIAgent应用案例 22

案例1：金融文本情感分析 22

案例2：基于LLM的多智能体投资决策框架 24

案例3：基于人机交互的因子挖掘框架 26

四、展望 28

图表目录

图1：语言模型技术演进图 4

图2：主流大模型基准得分走势 6

图3：主流大模型能力象限 6

图4：2024年最值得关注的中文大模型全景图 6

图5：MMLU测试超过特定得分的最便宜模型价格 7

图6：LMSys测试中不同模型成本曲线 7

图7：当前不同大模型输出质量指数vs价格（美元/百万token） 7

图8：OpenAI主要模型与国内主要大模型能力圈对比 9

图9：OpenAI主要模型与国内主要大模型价格对比 9

图10：deepseek-r1:1.5b模型的文言文翻译输出结果 11

图11：deepseek-r1:32b模型的文言文翻译输出结果 11

图12：人类与AI协同的主流方式 12

图13：国内外部分大模型在SuperCLUE金融行业基准投研应用测试中的表现 13

图14：BloombergGPT在公开金融领域基准测试中的表现 13

图15：BloombergGPT在私有金融基准测试中的表现 13

图16：FinGPT整体框架 14

图17：LoRA方法的原理 14

图18：FinGPT在公开金融数据集上的表现及微调模型的成本 15

图19：FewShotCoT和ZeroShotCoT对比 16

图20：大模型的错误案例一以及自动思维链 17

图21：大模型的错误案例二以及自动思维链 17

图22：一个简单的RAG增强检索生成的流程 17

图23：RAG技术和其他模型优化技术的对比（提示工程、微调） 18

图24：RAT技术能够显著提升大模型各方面的表现 19

图25：利用DeepSeekR1结合思维链和本地知识库RAG的基本面量化策略设计 20

图26：以LLM为核心的AIAgent结构组成 21

图27：不同角色的AIMulti-Agent协同合作的两种场景 22

图28：基于大模型的情感分析的提示词模板 23

图29：在沪深300成分股内基于不同LLM构建的新闻情感分类构建的策略净值 24

图30：不同情感因子构建的策略的绩效表现 24

图31：AIAgents多智能体投资决策框架 25

图32：AIAgents多智能体投资决策框架在苹果股票上的交易策略回测统计 26

图33：AIAgents多智能体投资决策框架在苹果股票上的交易策略累计净值 26

图34：基于人机交互的自动化量化投研框架 27

表1：语言模型的发展阶段及主要突破 5

表2：本地大模型部署框架对比 9

表3：DeepSeek蒸馏模型及满血671BR1模型本地部署所需硬件资源 10

表4：不同参数的R1蒸馏模型的资源占用和推理速度 10

表5：SuperCLUE金融领域基准测试分类 12

一、大语言模型的发展回顾

大语言模型的技术发展路线

1948年香农发表开创性的论文《AMathematicalTheoryofCommunication》，首次在论文中提出了信息熵的概念，并通过统计方法研究英语文本的冗余度，引入了预测下一个字符概率的思想，这一思想也奠定了语言模型的理论基础。从1948年开始计算，语言模型已经发展了70

余年。图1中展示了语言模型的主要技术演进路线。

图1：语言模型技术演进图

从按照语言模型的演进路线来看，主要分为四个阶段：

统计语言模型时代（1948-2012），安德烈·马尔科夫（AndreyMarkov）在1913年首次将马尔科夫链应用于语言分析，通过研究普希金的《叶甫盖尼·奥涅金》中元音和辅音的转换序列，开创了用概率模型处理语言序列的先河。这种处理方法后来发展成为了N-gram模型的

理论基础。1976年，FrederickJelinek等人在语音识别研究中首次系统地提出并应用了统计语言模型，通过N-gram模型来计算词序列的概

您可能关注的文档

文档评论（0）

535600147 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

用户编号：6010104234000003

1亿VIP精品文档

更多 >

AI大模型在投资研究中应用及未来趋势.docx