AIASIC,算力芯片的下一篇章.pptx

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

ASIC可以适应不同的业务场景和商业模式的需求,可以满足大型CSP客户的诸多需求:1)内部工作负载的架构优化;2)更低的功耗,更低的成本;3)为AI工作负载定制的内存和I/O架构。随着AI应用的发展和生态逐步完善,AI算力集群特别是推理集群对加速计算芯片需求巨大,驱动ASIC快速成长。预计2028年数据中心ASIC市场规模将提升至429亿美元,CAGR为45.4%。

ASIC针对特定算法和应用进行优化设计,在特定任务上的计算能力强大,通常具有较高的能效比。目前ASIC以推理场景应用为主,并开始切入到部分训练环节。对照北美四大CSP的自研产品路线:Google的TPU出货目前以v5产品为主,2025年将量产TPUv6;亚马逊的ASIC产品包括Trainium和Inferentia,分别用于训练和推理环节;微软和Meta也推出了各自的ASIC产品Maia100和MTIA

。由于大型CSP的业务模型、应用场景等多通过自身云来承载,每个云承载了独特的应用和商业模型,包括内部应用(比如搜索引擎

、社交媒体等)、SaaS服务(比如AI聊天机器人、Copilot等)、IaaS服务等,自研ASIC可适应自身不同的业务场景和商业模式的需求。

相关标的:1)博通:全球AIASIC龙头,目前已向多家头部CSP客户批量供应ASIC产品,其在计算,存储,网络IO,封装等领域广泛的IP储备可为其XPU产品线赋能。2)Marvell:全球一线ASIC厂商,其定制计算产品包括AI加速芯片,针对安全、NIC/DPU、ARM计算、存储、视频和CXL功能的ASIC等,客户包括北美头部云厂商。

风险提示:AI产业发展不及预期的风险;大型科技企业资本支出不及预期的风险;GPU竞争的风险。;目 录

1 ASIC芯片市场前景;3;4;5;6;目 录;2.1 ASIC硬件性能:针对特定算法和应用优化设计,具有较高能效比;ASIC的单位算力成本更低,满足一定的降本需求。ASIC因其硬件结构是为特定任务定制的,减少了很多针对通用加速计算的不必要的硬件设计,其单位算力成本相比GPU或更低。谷歌TPUv5、亚马逊Trainium2的单位算力成本分别为英伟达H100的70%、60%;ASIC在软件生态上的优势:云厂商普遍具备较强的研发能力,为ASIC研发了配套的全栈软件生态,开发了一系列编译器、底层中间件等,提升ASIC在特定场景下的计算效率??部分第三方芯片厂商推出了开源平台,未来ASIC的软件生态将会愈发成熟和开放。

ASIC在软件生态上的劣势:软件生态相对较为单一,主要针对特定的应用场景和算法进行优化。与GPU相比,ASIC的编程难度较大,需要专业的知识和技能,开发工具和软件库相对较少。这使得开发者在使用ASIC时需要花费更多时间和精力进行开发调试。

GPU软件生态的优势:软件生态丰富成熟,拥有广泛的开发工具、编程语言和软件库支持,如英伟达的CUDA和AMD的ROCm等

。开发者可使用熟悉的编程语言如C、C++、Python等进行开发,且有大量的开源项目和社区支持,方便开发者学习和交流。这使得GPU在各种应用场景中都能快速地进行开发和部署。

GPU软件生态的劣势:软件生态在特定任务上的优化程度可能不如ASIC。在一些对性能和功耗要求极高的特定场景中,需要进行大量的优化工作才能发挥出GPU的最佳性能。;ASIC在执行特定AI算法时的高性能和高能效的优势,对于大规模数据中心等对能耗敏感的场景非常重要。由于ASIC不需要集成通用的功能模块,从而减少不必要的硬件资源浪费,如果AI应用场景明确且需求量大,ASIC在大规模生产后其单位成本可显著降低。但ASIC也有开发周期长且灵活性差的劣势,由于ASIC的设计和制造是针对特定算法和应用场景进行的,一旦设计完成其功能就固化下来,难以对芯片的功能和性能进行修改和升级,如果AI算法发生较大变化,ASIC可能无法快速适应这种变化。此外,ASIC的生态系统还不够完善,开发者在使用ASIC时可能需要花费更多时间和精力去搭建开发环境、编写底层代码等,开发难度较大。

ASIC更适用于推理:在推理阶段,AI模型已训练完成,需要对输入的数据进行快速的预测和分类。此时对芯片的计算精度要求相对较低,但对计算速度、能效和成本等要求较高。ASIC正好满足这些需求,其高度定制化的设计能针对推理任务进行优化,以较低的功耗实现快速的推理计算。且在大规模部署的场景下,ASIC的成本优势更加明显,可以降低企业的运营成本。

GPU更适用于训练:AI训练过程需要处理大量的数据和复杂的计算,对芯片的计算能力、内存带宽和并行处理能力要求非常高。GPU拥有众多的计算核心

您可能关注的文档

文档评论(0)

535600147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6010104234000003

1亿VIP精品文档

相关文档