- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
AI现状:中国
人工分析Q12025
人工分析是领先且独立的AI基准测试和洞察提供商。我们支持工程师和公司了解AI能力,并就其AI战略做出关键决策。
我们的数据、见解和出版物基于我们对人工智能技术及其应用场景的全面基准测试。这包括从语言模型API的小时级性能测试到我们众包平台上的数百万次投票。
我们的公共网站,artificialanalysis.ai,广泛被人工智能创新领域的领先公司引用。如欲讨论本报告、我们的出版物或服务,请通过contact@artificialanalysis.ai联系我们。
按起源划分的前沿语言模型
中国AI实验室逐渐赶上美国AI实验室;来自中国实验室的模型随着DeepSeek的R1模型的发布,现在正在接近o1级智能
索引1人工分析智能959085807570OpenAI,23oUSAOpenAI,o1eek,R1DeepS中国OpenAI,o1-preview人类,克劳德十四行诗(6月24日)GPT-4TurboOpenAI,DeepSeek,GPT-4oV3指令
索引1人工分析智能
95
90
85
80
75
70
OpenAI,
2
3
o
USA
OpenAI,o1
eek,R1
DeepS
中国
OpenAI,o1-preview
人类,克劳德
十四行诗(6月24日)
GPT-4Turbo
OpenAI,
DeepSeek,
GPT-4o
V3
指令72B
OpenAI,
GPT-4
阿里巴巴,Qwen2指导72B阿里巴巴,Qwen2.5
DeepSeek,V2·i
缩小差距:2024年最后几个月见证了多家顶尖中国AI实验室推出众多高性能模型。这导致了中国AI实验室与美国AI实验室在智能水平上的差距缩小。目前,一些中国模型已与美国顶级实验室的模型竞争。
605550454035阿里巴巴,Qwen聊天
60
55
50
45
40
35
阿里巴巴,Qwen聊天372B
OpenAI,GPT-3.5Turbo
阿里巴巴,Qwen聊3天7B
推理模型很快变得司空见惯:推理模型(在回答前进行“思考”的模型)最早由OpenAI在2024年第三季度引入。几个月内,以DeepSeek为代表的中国竞争对手已基本复制了o1的智能水平。目前,多家中国AI实验室已经拥有前沿级别的推理模型。
30
2520AArtificialAnalysis
25
20
AArtificialAnalysis
15
4Q221Q232Q233Q234Q231Q242Q243Q244Q241Q252Q25
在前沿实验室附近打开模型:由DeepSeek和阿里巴巴领导的开放权重模型已经接近o1级智能。
模型发布日期
1.人工分析智能指数:涵盖一系列语言模型智能和推理评估数据集的平均值。目前包括MMLU、GPQADiamond、MATH-500及HumanEval。发布日期基于该模型的首次公开发布。2.o3智能指数通过放大测量的o1的智能指数估算得出。3.基于公司声明和可比结果估算。
在可用的情况下,尚未通过人工分析进行独立基准测试
索引1
索引1人工分析智能
95
90
85
80
75
70
65
60
55
50
45
40
35
30
25
20
15
诗(10
自2023年初推出OpenAI的GPT-4以来,美国领先的AI实验室已经争先恐后赶上OpenAI
随着时间的推移,美国领先的AI实验室前沿语言模型智能1主要趋势
3OpenAI人类GoogleMetaGPT-4美洲驼3.370B美洲驼3.1甲双子座1.5Pro(24年5月)
3
OpenAI
人类
GoogleMeta
GPT-4
美洲驼3.3
70B美洲驼3.1
甲
双子座1.5Pro(24年5月)
o3o1o1-预览
Pro双子座1.5
Pro
Gemini2.0闪存克劳德3.5(Sep‘24)十四行诗(6月
Gemini2.0闪存
GPT-4
GPT-4T
文档评论(0)