- 1、本文档共2页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
寒武纪首次实现季度盈利,国产AI芯片崛起中
在美国针对AI芯片管控的背景下,为了推动国产AI芯片的发展,国家先后出台了一系类扶持国产AI芯片发展的政策。
而且,智算行动方案还要求新建智算中心国产算力芯片使用占比超过50.00%,国产存储使用占比超过50.00%,服务具有国际影响力的通用及垂直行业大模型设计应用企业超过10家。
值得一提的是,中国移动此次总中标金额约为191.04亿元,且项目公示的中标人全部为搭载了国产AI芯片的国产服务器厂商。
AI芯片并非只有GPU一种,除了GPU之外,还包括ASIC与FPGA。不过,AI芯片绝大部分市场份额被GPU与ASIC所占据。公开信息显示,GPU的优势在于高并行结构,生态系统成熟,支持跨平台等。ASIC则是专门为深度学习计算定制的芯片,具有效率高,功耗小,体积小等优势。
据国泰君安研报,由于ASIC是为了特定任务而设计,减少了很多针对通用加速计算的不必要的硬件设计。因此,与GPU相比,ASIC成本明显降低。
在算力方面,ASIC单卡算力与GPU相比仍有一定的差距,例如,谷歌TPUv6和微软的Maia100算力约为英伟达H100的90.00%与80.00%。不过,谷歌TPUv6和微软的Maia100单价显著低于H100,故在推理场景中,ASIC更具有性价比。
因此,除了GPU之外,国内部分AI芯片厂商也根据自身禀赋选择ASIC方向进行突围,其中,寒武纪选择的就是ASIC路径。
寒武纪智能计算集群系统是将公司自研的加速卡或者训练征集产品与合作伙伴提供的服务器设备、网络设备与存储设备结合,并配备公司的集群管理软件组成的数据中心集群,其核心算力来源是公司自研的云端智能芯片。
据慧博投研,寒武纪思元100芯片是中国首款高峰值云端智能芯片。思元290是公司首款云端训练芯片,采用了7nm工艺,在4位和8位定点运算下,理论峰值分别为1024TOPS、512TOPS。思元370是寒武纪的第三代云端产品,采用7nm智能工艺的同时,还是其首款采用Chiplet技术的AI芯片。
对于业绩增长的原因,海光信息在业绩预告中表示,公司的CPU产品进一步拓展市场应用领域、扩大市场份额,支持了广泛的数据中心、云计算、高端计算等复杂应用场景。另外,在AIGC的时代背景下,公司DCU产品快速迭代发展,得到市场更广泛认可,以高算力、高并行处理能力、良好的软件生态支持了算力基础设施、商业计算等AI行业应用,进一步促进了公司业绩的较快增长。
海光信息DCU系列产品属于GPU,其以GPGPU架构为基础,兼容通用的“类CUDA”环境。因此,海光信息DCU主要部署在服务器集群或数据中心,支持高复杂度和高吞吐量的数据处理任务,以及全精度模型训练。
海光信息目前在售的DCU产品为深算一号与深算二号,深算三号正在研发中。另外,公司在投资者互动平台表示,深算二号具有全精度浮点数据和各种常见整型数据计算能力,性能相对于深算一号性能提升100%以上。
据财报数据,海光信息DCU已经实现LLaMa、GPT、Bloom、ChatGLM、悟道、紫东太初等为代表的大模型的全面应用,并与国内包括文心一言等大模型全面适配。
文档评论(0)