- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
DeepSeek冲击全球,AI竟争格局大转变
中国新创人工智能(AI)公司深度求索(DeepSeek)1月发布最新大语言模型DeepSeekR1,旋即震撼全
球。根据多项第三方评测,DeepSeekR1以极低成本实现与美国科技巨头OpenAI去年底才发布的最
新模型“o1”同等性能,令市场相信发展AI无须再投入大量成本。这不仅挑战美国在AI领域的主导地
位,也标志着接下来全球AI竞争格局可能迎来重大转变。
成本虽低性能比肩OpenAI
首先,AI是一种极为耗电,成本极高的技术。为此,美国最有实力的几个科技巨头前仆后继地抢购
核能公司,以便为AI模型提供必要电力。
去年,OpenAI表示AI产业需要数万亿美元的投资,才能支持高需求晶片的开发。相比之下,DeepSeek
今年1月新开发的AI模型DeepSeekR1,其能力足以媲美OpenAI的GPT-4等顶级模型,成本只有
区区560万美元,相较于其他科技巨头在AI技术上花费的数十亿美元,这一成本不过是它们的零
头。有Meta员工更透露,相关数字在Meta不过是名高层的薪水。
随着DeepSeek只花费560万美元就成功训练R1,美国业界对需要为AI投入多少资本的共识发生
了巨大变化,不少人认为DeepSeek将推动AI产业进入新时代,让工作更有效率。
打破顶级晶片是发展AI唯一途径的观念
第二,人们原持有的信念是:更大的预算和顶级晶片是推动AI发展的唯一途径,但DeepSeek的出现似
乎打破了这一观念,因为DeepSeek使用的半导体晶片不如英伟达生产的最高端的先进晶片,但同样
能制造出高性能模型,这为对顶级晶片的需求和未来带来了巨大的不确定性。
英伟达的高端GPU近年来几乎掌控了全球大部分AI研发的算力需求,尤其是高端晶片如A100和
H100,一直是全球AI模型训练和推理的主力设备。但美国政府自2022年起,限制英伟达高端晶片
H100和A100等出口到中国,英伟达就推出性能较低的H800来符合规定。
DeepSeek表示,它使用了没那么先进的H800晶片打造了一个看上去与OpenAl最好的产品不相上
下的模型。中国官媒《经济日报》就发文指,DeepSeek的成功证明了大模型创新不一定要依赖最先
进的硬件,而是可以靠聪明的工程设计和高效的训练方法。
开放代码免费使用
第三,除性能领先外,R1在开源程度上也远超竞争对手o1。据悉它不仅开放代码,允许任何人免费使
用、修改及商业化,还允许用户用它训练自己的模型,彻底打破了以往大型语言模型被少数公司垄断
的局面。
开源AI模型的其中一个好处是普及性,少掉昂贵的授权费,世界各地的开发者都能踩在这些开放模型
的肩膀上,做出更多类型软件,让AI更加普遍。
MetaAI首席科学家YannLeCun直言,DeepSeek的成功得益于开放生态,其创新是基于前人成果的
持续反复运算,显示了开源模型正在超越闭源系统。
文档评论(0)