金融大模型应用评测报告摘要版(2024).pdf

金融大模型应用评测报告摘要版(2024).pdf

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

金融大模型应用评测报告

摘要版

(2024)

上海人工智能实验室

上海财经大学

上海库帕思科技有限公司

二零二四年十二月

为进一步推动金融科技创新应用的落地,切实提升金

融服务的智能化水平,降低企业数字化转型成本,并积极

探索金融垂直领域大模型应用的新理念、新机制和新手段,

上海人工智能实验室和上海财经大学根据上海人工智能协

会和上海金融业联合会共同发布的《金融大模型应用评测

指南》(T/SAIAS019—2024)团标,采用上海库帕思科技

有限公司依照上述团标制定的评测数据集《库帕思金融大

模型评测数据集(2024版)》,形成了《金融大模型应用评

测报告(2024)》。

一、金融大模型应用评测范式

(一)评测对象范围

本次测评对象包括国内外、开闭源、通用基模与金融垂模,

共计14个主流大模型机构的20个模型。评测围绕金融行业

的核心业务需求及大模型在金融场景中的适配性,结合银行、

证券、保险、基金等重点应用场景,形成“模型基础能力”、“金

融安全与价值对齐能力”、“金融风险控制能力”、“金融专业认

知能力”、“金融业务辅助拓展能力”5大测评维度。具体详情

参见表1-1。

表1-1参评模型清单

机构模型类型简介

OpenAIGPT-4o基模GPT-4o是OpenAI推出的

(多模态)高级多模态模型,能够接受包括文

本、音频、图片和视频在内的任意组

合输入,生成文本、音频和图片的任

意组合输出。与现有模型相比,GPT-

4o在视觉和音频理解方面

表现尤其出色。

AnthropicClaude-3.5-基模Claude-3.5-Sonnet是

Sonnet(多模态)Anthropic发布的升级版,在推理、编

码和数学能力方面表现尤其出色。

谷歌Gemini-1.5-pro基模Gemini-1.5-pro是GoogleDeepMind

(多模态)发布的强大多模态模型,可处理各种

推理任务。Gemini-1.5-pro可以一次

处理大量数据,包括2小时的视

频、19小时的音频、6万行代码的

代码库或2,000页的文本。

阶跃星辰/Step-2-16k基模Step-2-16k是阶跃星辰发布的新一代

财跃星辰(语言)混合专家模型(MoE)架构大模型,

您可能关注的文档

文档评论(0)

百强名校试卷 + 关注
实名认证
内容提供者

百强名校试卷

1亿VIP精品文档

相关文档