- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
战略研究
从DeepSeek爆火看算力基建的发展与布局
□温建功李红娟
DeepSeek,中国人工智能大模型的新里程碑,应商通过软硬件技术的进步推动芯片计算效率
自2025年1月上线以来受到全球关注,不仅引爆的提升,但芯片计算效率的提高也可能导致芯片
了新一轮的人工智能应用热潮,更是在短期内引价格等硬件成本的增加。二是靠大模型技术优
发了市场对人工智能大模型企业巨额算力资源投化和算法革新,以减少训练所需的计算资源或时
入的广泛质疑,触发美股部分算力相关科技股的间成本。
剧烈震荡,在全球算力产业界掀起波澜。算力芯DeepSeek选择的是第二种。2024年12月,
片领域的巨头英伟达,其股价在1月27日暴跌约DeepSeek-V3正式发布,作为一款强大的MoE(混
17%,市值瞬间蒸发近6000亿美元,这一跌幅创合专家模型)语言模型,DeepSeek-V3在数学、代
下了美国历史上单日市值跌幅的新纪录,截至3码等任务上表现出色,甚至能与一些闭源大模型
月上旬,英伟达已经较1月的市值高点跌去了约如GPT-4o、Claude-3.5-sonnet相媲美。据官方技
一万亿美元。深度求索公司(DeepSeek)推出的系术论文披露,DeepSeek-V3的训练成本仅为557.6
列开源大模型之所以备受业界关注,主要在于其万美元,远低于其他大型语言模型。2025年1月
提供了高性能且成本低廉的训练方案,这引发了发布的DeepSeek-R1是推理模型,擅长处理复杂
业界对算力基础设施深度投资和价值利用的新思任务,其在数学、代码、自然语言推理等任务上比
考,对整个算力产业产生了广泛而深远的影响。肩OpenAI-o1,小模型超越o1-mini;并且DeepSeek
团队将R1推理能力蒸馏到更小的模型中,让小模
引发新一轮人工智能热潮
型在保持高性能的同时,更易于部署。
自ChatGPT引爆人工智能大模型概念以来,自DeepSeek-R1发布后,在无任何广告投放
全球大模型规模和数量不断增加,其性能也实现的情况下,DeepSeekAPP在7天内便实现了1亿
了显著提升。然而,相应的人工智能大模型规模用户增长,迅速跃升为全球增速最快的AI应用,
的训练成本也在急速上升。在DeepSeek出现之各行各业掀起了DeepSeek大模型的适配和接入
前,以中美为代表的多个人工智能企业均选择在应用潮。在算力芯片领域,华为、摩尔线程、英特
大模型算力基建上进行超高投入,被外界形象地尔、英伟达等企业迅速响应,不仅宣布了DeepSeek
称为AI领域的“军备竞赛”。大模型的适配与上线计划,还推出了具备DeepSeek
一般来说,降低人工智能大模型训练和应用大模型本地部署能力的算力芯片产品。在云服务
成本的方法有二:一是依赖于计算设备设施的技领域,硅基流动宣布率先和华为云合作推出基于
术革新或硬件成本下降,通过计算效率的提升来昇腾云的DeepSeek-R1V3的推理服务,其他厂
降低成本,例如,以英伟达为代表的算力芯片供商诸如阿里云、腾讯云、浪潮云等也纷纷加入战
202025·8
局;在互联网领域,腾讯系软件如微信、腾讯文档、潮,阿里云、腾讯、字节跳动、智谱等国内厂商均宣
腾讯元宝、QQ浏览器等纷纷宣布接入DeepSeek-布其旗下的模型API降价。
R1满血版,同时,三大运营商、各大手机厂商及新深度求索公司的开源策略也刺激了各类大模
能源汽车厂商也迅速跟进,接入了DeepSeek-R1。型企业:阿里云开源了全尺寸多模态的阿里万相
在机构方面,多地政府在探索DeepSeek大模型的大模型(Wan2.1),3月初又开源了QwQ-32B推理
接入,各大金融机构、高等院校、大量中小企业等模型,后者“展现出与DeepSeek-R1(激活参数
也陆续接入并开展AI应用。
您可能关注的文档
最近下载
- 表面麻醉剂的生产工艺及流程.docx
- JRC-JLR-7800-7500 GPS-中文操作说明书.pdf VIP
- 社会保障学作业四 答案 国家开放大学.docx
- 社会保障学作业二 答案 国家开放大学.docx
- 专题05+生物的分类、鉴别和保护(期末复习课件)七年级生物上学期新教材冀少版.pptx VIP
- 专题04+微生物+(期末复习课件)七年级生物上学期新教材冀少版.pptx VIP
- 专题03+藻类、植物和动物(期末复习课件)七年级生物上学期新教材冀少版.pptx VIP
- 专题02+组织、器官、系统和生物体(期末复习课件)七年级生物上学期新教材冀少版.pptx VIP
- 专题01+细胞(期末复习课件)七年级生物上学期新教材冀少版.pptx VIP
- 2025公路水泥混凝土路面设计规范.pdf
原创力文档


文档评论(0)