20230427-中信证券-机器学习系列_数据治理专题(三):Game Changer_大模型赋能金融数据研究创新.pdfVIP

20230427-中信证券-机器学习系列_数据治理专题(三):Game Changer_大模型赋能金融数据研究创新.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Game Changer-大模型赋能金融数据研究创新 机器学习系列——数据治理专题(三) |2023.4.27 ▍ ▍ 中信证券研究部 核心观点 针对基本面量化研究中行业覆盖存在明显边界的痛点,利用大模型API 接口构 建基于 Prompt Engineering 的投研循环问答机制,能够自动化建立三层行业 数据指标跟踪体系。其中,通过观察指标的逻辑性与指标数据可获得性,周期 行业景气跟踪框架与指标质量表现优异,成长风格行业逻辑构建相对完善。基 于自动化的交互能够在较短时间内实现中信证券二级 109 个行业的全覆盖,有 效拓宽基本面量化行业数据覆盖边界。未来金融垂直大模型将全新定义金融科 张若海 技赋能场景,行业基本面量化研究与数据研究生产力全面提升。 数据科技首席 分析师 ▍ 大模型迭代遵循“摩尔定律”,轻量级开源大模型已实现高频迭代。大模 S1010516090001 型加速进入应用时代,超大量样本训练能够带来大语言模型智能涌现。五 年间,LLM 的参数量规模从亿级达到万亿级,参数量每年成倍增长的规律 有望成为“LLM 时代的摩尔定律”。国内外开源轻量级 LLM 持续不断问 世,从 LLaMA 到Alpaca 之间间隔 1 个月,再到 Dolly 2.0 与StableLM 仅 相隔 1 周,未来短周期的轻量级开源 LLM 迭代有望成为新趋势,LLM 的 垂直赋能与低成本可及性,加速金融垂直应用爆发。 ▍ 涌现能力助力数据应用创新——聚焦基本面量化覆盖扩容。自2020 年起, 伍家豪 A 股市场的主流量化研究团队在行业基本面量化研究中共覆盖 41 个行业 数据科技分析师 (按照中信证券二级行业分类计算),全行业占比仅为37.6% 。受限于人 S1010522090002 员规模等因素,传统人为构建方式无法实现行业全覆盖和持续的逻辑与指 标体系跟踪。基于 ChatGPT 可构建市场宏观需求、中观供需关系、微观 产品价量逻辑与指标体系,助力实现全行业的景气跟踪与指标更新。其中, 通过观察指标的逻辑性与指标数据可获得性,周期行业景气跟踪框架与指 标质量表现优异(指标可得性超 80%),成长风格行业逻辑构建相对完善 (指标可得性超40%),基本面量化跟踪全行业覆盖成为可能。 张强 ▍ 涌现能力助力数据应用创新——聚焦文本分析与金融数据应用标注。政 数据科技分析师 策、公告等非结构化文本数据蕴含丰富信息,用大模型对文本数据进行标 S1010522050003 注,可以深度挖掘文本数据助力量化应用探索。考虑在线模型的数据安全 隐患,我们利用金融语料库微调训练 ChatGLM 模型,实现数据标注、文 本摘要等垂类场景的大模型本地化部署。 ▍ Prompt Engineering 赋能体系构建,自动化助力涌现能力赋能。利用大

您可能关注的文档

文档评论(0)

如此醉 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档