华为昇腾一体机深度研究:国产AI算力的星辰大海.docVIP

华为昇腾一体机深度研究:国产AI算力的星辰大海.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

华为昇腾一体机深度研究:国产AI算力的星辰大海

1昇腾一体机打通AI落地“最后一公里”

昇腾AI一体机是国内AI软硬件技术的黄金交点,是以国产算力领军者华为昇腾AI基础软硬件平台为基础,联合国内领先AI厂商打造的先进生产力工具。2023年7月6日,华为昇腾在WAIC2023会上联合四家伙伴共同发布昇腾AI大模型训推一体化解决方案,双方通过共同设计、联合开发、协同上市、持续迭代,为企业带来“开箱即用”的大模型一体化解决方案。昇腾AI基础软硬件平台包含华为Atlas系列硬件及伙伴自有品牌硬件、异构计算架构CANN、全场景AI框架昇思MindSpore、昇腾应用使能MindX、一站式开发平台ModelArts和统一工具链MindStudio等。

国内各厂商陆续发布合作款昇腾一体机,应用范围由科研逐步扩展到AI全场景乃至垂类模型落地。2023年3月,华为昇腾与旗下华鹏振宇打造了专为高校和科研院所设计的AI训练开发一体机,奠定了将AI算力、AI平台软件、AI开发框架、开发组件和存储高效融合的算力底座基础架构;2023年6月,软通动力发布训推一体化平台,支持用户一站式AI开发、深度适配不同AI应用场景;2023年8月起云从科技、科大讯飞、智谱AI等国内领先AI大模型厂商合作款昇腾一体机面世,昇腾一体机应用范围扩展到AI全场景;后续医渡科技、安恒信息等公司将昇腾一体机用于自身垂类模型落地。昇腾一体机凭借其领先的软硬件基础设施性能,以及昇腾的优秀工程化能力,正逐渐成为千行百业大模型产业化重要抓手。

1.1昇腾一体机瞄准大模型本地化部署蓝海市场

1.1.1本地化部署市场需求清晰

大模型本地化部署市场需求主要有数据安全需求和技术需求两大类:

1)数据安全需求:三星芯片代码泄露事件为重要标志,大模型或能够永久学习泄露数据内容,造成不可逆损失。据澎拜新闻援引韩国媒体《economist》报道,2023年3月,三星内部发生三起涉及ChatGPT误用与滥用案例,包括两起“设备信息泄露”和一起“会议内容泄露”,报道称半导体设备测量资料、产品良率等内容或已被存入ChatGPT学习资料库中。据Cyberhaven统计,员工直接发给ChatGPT的企业数据中,有11%都是敏感数据。

2)技术需求:使用本地化部署的大模型,可以让机构和个人在这种不断变化的市场环境中积累经验,而单单使用API则无法做到这一点。据willows.ai,对于AI原生应用,需要了解模型的内部状态、梯度和中间输出结果,使用基于API的模型,会限制进一步进行实验和增强模型的可能性。此外,AI工程化开发成本较高,中小厂商难以负担,使用打包工程化能力的AI一体机能够降低中小厂商进行AI创业的门槛。

1.1.2海外巨头争先入局验证赛道景气度

英伟达发布L40S强势切入大模型本地化部署市场,验证赛道景气度。英伟达L40S不支持NVLink协议,最多只能做到8卡并行,因此其主要目标客户是中小型企业的算法训练,与A100单卡相比,L40S在AI推理效能提高20%,AI训练效率提高70%,微调方面比A100快50%。

戴尔集团与英伟达联合发布用于安全、本地化部署生成式AI的ProjectHelix。据英伟达官网,ProjectHelix将支持从基础设施配置、建模、训练、微调、应用开发和部署一直到部署推理和精简结果等整个生成式AI的生命周期。。ProjectHelix还包含NVIDIAAIEnterprise软件,为客户提供用于整个AI生命周期的工具。NVIDIAAIEnterprise包含100多个框架、预训练模型和开发工具,例如用于构建主题鲜明、安全可靠的生成式AI聊天机器人的NVIDIANeMo?大型语言模型框架与NeMoGuardrails软件。此外,ProjectHelix还将安全和隐私功能内置在基础组件中,如SecuredComponentVerification等在本地保护数据可以降低固有风险,帮助企业满足监管要求。

1.2国内G端率先落地,乐观预计市场规模超4500亿元

G端数据安全最为迫切,推动大模型本地化部署需求率先落地。从数据的自主可控出发,党政军对数据安全需求强烈:据维创,政府数据和军队国防机密若泄密极易造成重大负面影响,甚至危及国家安全和社会稳定。优刻得与沐曦、智谱华章共同在宁夏的开放平台上面向第一批用户也正是G端的航天医院、数字

您可能关注的文档

文档评论(0)

wu9872 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档