网站大量收购独家精品文档,联系QQ:2885784924

AI大模型在投资研究中应用及未来趋势.docx

AI大模型在投资研究中应用及未来趋势.docx

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

正文目录

一、大语言模型的发展回顾 4

大语言模型的技术发展路线 4

能力提升和训练成本降低加速AI应用普及 5

二、大语言模型在金融领域中的应用 8

大语言模型的官方API调用与本地部署 8

大模型在投研场景中的应用 11

面向金融领域的大模型 12

思维链与检索增强 15

基于LLM的AIAgent系统 21

三、投研场景下的AIAgent应用案例 22

案例1:金融文本情感分析 22

案例2:基于LLM的多智能体投资决策框架 24

案例3:基于人机交互的因子挖掘框架 26

四、展望 28

图表目录

图1:语言模型技术演进图 4

图2:主流大模型基准得分走势 6

图3:主流大模型能力象限 6

图4:2024年最值得关注的中文大模型全景图 6

图5:MMLU测试超过特定得分的最便宜模型价格 7

图6:LMSys测试中不同模型成本曲线 7

图7:当前不同大模型输出质量指数vs价格(美元/百万token) 7

图8:OpenAI主要模型与国内主要大模型能力圈对比 9

图9:OpenAI主要模型与国内主要大模型价格对比 9

图10:deepseek-r1:1.5b模型的文言文翻译输出结果 11

图11:deepseek-r1:32b模型的文言文翻译输出结果 11

图12:人类与AI协同的主流方式 12

图13:国内外部分大模型在SuperCLUE金融行业基准投研应用测试中的表现 13

图14:BloombergGPT在公开金融领域基准测试中的表现 13

图15:BloombergGPT在私有金融基准测试中的表现 13

图16:FinGPT整体框架 14

图17:LoRA方法的原理 14

图18:FinGPT在公开金融数据集上的表现及微调模型的成本 15

图19:FewShotCoT和ZeroShotCoT对比 16

图20:大模型的错误案例一以及自动思维链 17

图21:大模型的错误案例二以及自动思维链 17

图22:一个简单的RAG增强检索生成的流程 17

图23:RAG技术和其他模型优化技术的对比(提示工程、微调) 18

图24:RAT技术能够显著提升大模型各方面的表现 19

图25:利用DeepSeekR1结合思维链和本地知识库RAG的基本面量化策略设计 20

图26:以LLM为核心的AIAgent结构组成 21

图27:不同角色的AIMulti-Agent协同合作的两种场景 22

图28:基于大模型的情感分析的提示词模板 23

图29:在沪深300成分股内基于不同LLM构建的新闻情感分类构建的策略净值 24

图30:不同情感因子构建的策略的绩效表现 24

图31:AIAgents多智能体投资决策框架 25

图32:AIAgents多智能体投资决策框架在苹果股票上的交易策略回测统计 26

图33:AIAgents多智能体投资决策框架在苹果股票上的交易策略累计净值 26

图34:基于人机交互的自动化量化投研框架 27

表1:语言模型的发展阶段及主要突破 5

表2:本地大模型部署框架对比 9

表3:DeepSeek蒸馏模型及满血671BR1模型本地部署所需硬件资源 10

表4:不同参数的R1蒸馏模型的资源占用和推理速度 10

表5:SuperCLUE金融领域基准测试分类 12

一、大语言模型的发展回顾

大语言模型的技术发展路线

1948年香农发表开创性的论文《AMathematicalTheoryofCommunication》,首次在论文中提出了信息熵的概念,并通过统计方法研究英语文本的冗余度,引入了预测下一个字符概率的思想,这一思想也奠定了语言模型的理论基础。从1948年开始计算,语言模型已经发展了70

余年。图1中展示了语言模型的主要技术演进路线。

图1:语言模型技术演进图

从按照语言模型的演进路线来看,主要分为四个阶段:

统计语言模型时代(1948-2012),安德烈·马尔科夫(AndreyMarkov)在1913年首次将马尔科夫链应用于语言分析,通过研究普希金的《叶甫盖尼·奥涅金》中元音和辅音的转换序列,开创了用概率模型处理语言序列的先河。这种处理方法后来发展成为了N-gram模型的

理论基础。1976年,FrederickJelinek等人在语音识别研究中首次系统地提出并应用了统计语言模型,通过N-gram模型来计算词序列的概

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档