- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
ASIC可以适应不同的业务场景和商业模式的需求,可以满足大型CSP客户的诸多需求:1)内部工作负载的架构优化;2)更低的功耗,更低的成本;3)为AI工作负载定制的内存和I/O架构。随着AI应用的发展和生态逐步完善,AI算力集群特别是推理集群对加速计算芯片需求巨大,驱动ASIC快速成长。预计2028年数据中心ASIC市场规模将提升至429亿美元,CAGR为45.4%。
ASIC针对特定算法和应用进行优化设计,在特定任务上的计算能力强大,通常具有较高的能效比。目前ASIC以推理场景应用为主,并开始切入到部分训练环节。对照北美四大CSP的自研产品路线:Google的TPU出货目前以v5产品为主,2025年将量产TPUv6;亚马逊的ASIC产品包括Trainium和Inferentia,分别用于训练和推理环节;微软和Meta也推出了各自的ASIC产品Maia100和MTIA
。由于大型CSP的业务模型、应用场景等多通过自身云来承载,每个云承载了独特的应用和商业模型,包括内部应用(比如搜索引擎
、社交媒体等)、SaaS服务(比如AI聊天机器人、Copilot等)、IaaS服务等,自研ASIC可适应自身不同的业务场景和商业模式的需求。
相关标的:1)博通:全球AIASIC龙头,目前已向多家头部CSP客户批量供应ASIC产品,其在计算,存储,网络IO,封装等领域广泛的IP储备可为其XPU产品线赋能。2)Marvell:全球一线ASIC厂商,其定制计算产品包括AI加速芯片,针对安全、NIC/DPU、ARM计算、存储、视频和CXL功能的ASIC等,客户包括北美头部云厂商。
风险提示:AI产业发展不及预期的风险;大型科技企业资本支出不及预期的风险;GPU竞争的风险。;目 录
1 ASIC芯片市场前景;3;4;5;6;目 录;2.1 ASIC硬件性能:针对特定算法和应用优化设计,具有较高能效比;ASIC的单位算力成本更低,满足一定的降本需求。ASIC因其硬件结构是为特定任务定制的,减少了很多针对通用加速计算的不必要的硬件设计,其单位算力成本相比GPU或更低。谷歌TPUv5、亚马逊Trainium2的单位算力成本分别为英伟达H100的70%、60%;ASIC在软件生态上的优势:云厂商普遍具备较强的研发能力,为ASIC研发了配套的全栈软件生态,开发了一系列编译器、底层中间件等,提升ASIC在特定场景下的计算效率??部分第三方芯片厂商推出了开源平台,未来ASIC的软件生态将会愈发成熟和开放。
ASIC在软件生态上的劣势:软件生态相对较为单一,主要针对特定的应用场景和算法进行优化。与GPU相比,ASIC的编程难度较大,需要专业的知识和技能,开发工具和软件库相对较少。这使得开发者在使用ASIC时需要花费更多时间和精力进行开发调试。
GPU软件生态的优势:软件生态丰富成熟,拥有广泛的开发工具、编程语言和软件库支持,如英伟达的CUDA和AMD的ROCm等
。开发者可使用熟悉的编程语言如C、C++、Python等进行开发,且有大量的开源项目和社区支持,方便开发者学习和交流。这使得GPU在各种应用场景中都能快速地进行开发和部署。
GPU软件生态的劣势:软件生态在特定任务上的优化程度可能不如ASIC。在一些对性能和功耗要求极高的特定场景中,需要进行大量的优化工作才能发挥出GPU的最佳性能。;ASIC在执行特定AI算法时的高性能和高能效的优势,对于大规模数据中心等对能耗敏感的场景非常重要。由于ASIC不需要集成通用的功能模块,从而减少不必要的硬件资源浪费,如果AI应用场景明确且需求量大,ASIC在大规模生产后其单位成本可显著降低。但ASIC也有开发周期长且灵活性差的劣势,由于ASIC的设计和制造是针对特定算法和应用场景进行的,一旦设计完成其功能就固化下来,难以对芯片的功能和性能进行修改和升级,如果AI算法发生较大变化,ASIC可能无法快速适应这种变化。此外,ASIC的生态系统还不够完善,开发者在使用ASIC时可能需要花费更多时间和精力去搭建开发环境、编写底层代码等,开发难度较大。
ASIC更适用于推理:在推理阶段,AI模型已训练完成,需要对输入的数据进行快速的预测和分类。此时对芯片的计算精度要求相对较低,但对计算速度、能效和成本等要求较高。ASIC正好满足这些需求,其高度定制化的设计能针对推理任务进行优化,以较低的功耗实现快速的推理计算。且在大规模部署的场景下,ASIC的成本优势更加明显,可以降低企业的运营成本。
GPU更适用于训练:AI训练过程需要处理大量的数据和复杂的计算,对芯片的计算能力、内存带宽和并行处理能力要求非常高。GPU拥有众多的计算核心
您可能关注的文档
- 乘用车行业智能驾驶专题:产业趋势加速,智驾赋能车企销量、利润.pptx
- 驰宏锌锗深度报告:锌光熠熠驰宏志,铅程似锦锗业兴.pptx
- 出口景气度结构性改善,行业出口有望边际向好.pptx
- 第十批国采竞争相对激烈,中标品种集中度再度提升.pptx
- 风电设备行业长风起·2025年度策略:陆海风高歌猛进,深远海破浪扬帆.pptx
- 风电/电网产业链周评(12月第2周):陆风招标持续高增,背靠背直流提供换流阀增量市场.pptx
- 锂电产业链双周评(12月第1期):钠电、固态电池等新技术蓬勃发展,电池企业海外布局加速推进.pptx
- 电力设备行业2025年度策略:主网景气不减,出海雄关漫道.pptx
- 光伏2025年度策略报告-平芜尽处是春山:大周期底部确立,供给端改善在即.pptx
- 2025年度策略之端侧AI:智能眼镜,智能化与交互迭代落地,驱动行业爆发.pptx
- 第三单元解决问题的策略 三年级下册数学高频考点重难点讲义(苏教版)(1).docx
- 4.4 解比例 数学六年级下册同步培优讲义(苏教版).docx
- 第四单元《根据方向与距离确定物体位置》(教案)五年级下册数学青岛版.docx
- (奥数典型题)第三讲 分解质因数 五年级下册数学思维拓展提升讲义(人教版).docx
- 2.2:2、5、3的倍数-人教版五年级数学下册第二单元:因数和倍数.docx
- 第六单元正比例和反比例 六年级下册数学高频考点重难点讲义(苏教版).docx
- 第二单元除数是一位数的除法 三年级下册数学高频考点重难点讲义(人教版).docx
- 第二单元-认识三角形和四边形 四年级数学下册提升(北师大版).docx
- 第一单元观察物体(三)五年级下册数学高频考点重难点讲义(人教版).docx
- 第九单元 数学广角—推理 二年级数学下册重难点知识点(人教版).docx
最近下载
- 涂药法-中医护理技术操作规程.ppt VIP
- 弱势群体社会医学(医学课件).ppt VIP
- 小学语文四年级上册《语文园地六》作业设计.docx
- 2024-2030年中国鹿行业经营风险与发展前景趋势预测分析研究报告.docx
- GB_T27065-2015_合格评定产品、过程和服务认证机构要求.doc
- 个人能力就业分析报告.pdf VIP
- 成语故事《三顾茅庐》故事简介PPT.pptx VIP
- 现代遗传学(厦大)中国大学MOOC慕课 章节测验期中期末考试答案.docx
- 北京市西城区2022-2023学年六年级上学期英语期末试卷(音频暂未更新).docx VIP
- 在役聚乙烯PE地埋燃气管道失效可能性评分表、后果评分表.pdf VIP
文档评论(0)