AIGC算力产业发展报告.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

AIGC算力产业发展报告人工智能不同计算任务需要各类芯片实现?强大的调度、管理、 协调能力;?应用范围广?开发方便灵活?并行架构?计算单元多?适合大量逻辑确定 的重复计算低延时开发周期短硬件可根据需求调整成本和壁垒高成本低能耗低性能强针对AI设定特定架构????????通用性强,CPUGPU应用方便 FPGA?研发阶段?数据中心?AI推理 AI用ASIC?成熟量产阶段?逻辑判断?任务调度与控制?模型训练性能更优,能效更高6资料来源:Huaweiforum,浙商证券研究所AI服务器芯片构成——CPU+加速芯片 AI服务器CPU+加速芯片:通常搭载GPU、FPGA、ASIC等加速芯片,利用CPU与加速芯片的组合可以满足高吞吐量互联的需求 应用领域计算机视觉机器学习 自然语言处理 应用场景 训练(算力30TOPS) 推理(算力30TOPS)芯片种类优点缺点GPU提供了多核并行计算的基础结构,核心数多,可支撑大量数据的并行计算,拥有更高浮点运算能力管理控制能力弱,功耗高FPGA可以无限次编程,延时性较低,拥有流水线并行(GPU只有数据并行),实时性最强,灵活性最高开发难度大,只适合定点运算,价格比较昂贵ASIC与通用集成电路相比体积更小,重量更轻,功耗更低,可靠性提高,性能提高,保密性增强,成本降低灵活性不够,价格高于FPGA高度适配 计算 (5~30TOPS) 9资料来源:华经产业研究院,亿欧智库,浙商证券研究所CPU擅长逻辑控制,可用于推理/预测01整个CPU的指挥控制中心,由指令寄存器IR、指令译码器ID和操 作控制器OC等组成。 CPU运行原理指令译码执行指令修改指令 计数器取指令 控制单元控制指令控制指令 数据 存储单元运算单元 作为计算机系统的运算和控制核心,是信息处理、程序运行的最终执行单元。 有大量的缓存和复杂的逻辑控制单元, 擅长逻辑控制、串行的运算。 计算量较小,且不擅长复杂算法运算和 处理并行重复的操作。 暂时存 放数据的区域, 保存等 待处理 或已经 处理过的数据。CPU优势劣势 执行部件,运算器的核心。可以执行算术运 算和逻辑运算。运算单元所进行的全部操作 都是由控制单元发出的控制信号来指挥。资料来源:CSDN,浙商证券研究所整理在深度学习中可用于推理/预测10GPU高度适配AI模型构建ChatGPT引发GPU热潮AI模型构建(以英伟达A100为例)百度:即将推出文心一言(ERNIEBot)训练过程推理过程95%???GPU的并行计算高度适配神经网络 GPU帮助高速解决问题:2048个A100 GPU可在一分钟内成规模地处理BERT 3X 1X 0.7X V100A10040GBA10080GB FP16FP16FP16多实例GPU(MIG)技术允许多个网络同时基于单个A100运行,从而优化计算资源的利用率。在A100其他推理性能增益的基础之上,仅结构稀疏支持一项就能带来高达两倍的性能提升。在BERT等先进的对话式AI模型上,A100可将推理吞吐量提升到高达CPU的249倍; 249X 1X CPUOnlyA10040GBA10080GB苹果:引入AI加速器设计的M2系列芯片(M2pro和M2max)将被搭载于新款电脑OpenAI:随着ChatGPT的使用量激增,OpenAI需要更强的计算能力来响应百万级别的用户需求,因此增加了对英伟达GPU的需求AMD:计划推出与苹果M2系列芯片竞争的台积电4nm工艺Phoenix系列芯片,以及使用Chiplet工艺设计的AlveoV70AI芯片。这两款芯片均计划在今年推向市场,分别面向消费电子市场以及AI推理领域?之类的训练工作负载;245X 12资料来源:英伟达官网,镁客网,腾讯网,浙商证券研究所 ASIC可进一步优化性能与功耗,全球巨头纷纷布局 国内外ASIC芯片龙头布局随着机器学习、边缘计算、自动驾驶的发展,大量数据处理任务的产生,对于芯片计算效率、计算能力和计能耗比的要求也越来越高,ASIC通过与CPU结合的方式被广泛关注,国内外龙头厂商纷纷布局迎战AI时代的到来。 谷歌:张量处理器——TPU?最新的TPUv4集群被称为Pod,包含4096个 v4芯片,可提供超过1exaflops的浮点性能 阿里巴巴:含光800AI芯片?硬件:自研芯片架构;?软件:集成达摩院先进算法,可实现大网络 模型在一颗NPU上完成计算。 英伟达:GPU+CUDA ?主要面向大型数据密集型HPC和AI应用; ?基于Grace的系统与NVIDIAGPU紧密结 合,性能比NVIDIADGX系统高出10倍; Habana(Intel收购)?已推出云端

文档评论(0)

1658576823bd104 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档