CPU、GPU、FPGA、ASIC等AI芯片特性及对比.docVIP

下载本文档

8
0
约8.34千字
约 16页
2021-09-18 发布于浙江
举报
版权申诉

CPU、GPU、FPGA、ASIC等AI芯片特性及对比.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

CPU、GPU、FPGA、ASIC等AI芯片特性及对比 1、前言目前，智能驾驶领域在处理深度学习AI算法方面，主要采用GPU、FPGA 等适合并行计算的通用芯片来实现加速。同时有部分芯片企业开始设计专门用于AI算法的ASIC专用芯片，比如谷歌TPU、地平线BPU等。在智能驾驶产业应用没有大规模兴起和批量投放之前，使用GPU、FPGA等已有的通用芯片可以避免专门研发定制芯片（ASIC）的高投入和高风险，但是，由于这类通用芯片设计初衷并非专门针对深度学习，因而存在性能不足、功耗过高等方面的问题。这些问题随着自动驾驶行业应用规模的扩大将会日益突出。本文从芯片种类、性能、应用和供应商等多角度介绍AI芯片，用于给行业内入门新人扫盲。 2、什么是人工智能（AI）芯片？从广义上讲，能运行AI算法的芯片都叫AI芯片。目前通用的CPU、GPU、FPGA等都能执行AI算法，只是执行效率差异较大。但狭义上讲一般将AI芯片定义为“专门针对AI算法做了特殊加速设计的芯片”。目前AI芯片的主要用于语音识别、自然语言处理、图像处理等大量使用AI算法的领域，通过芯片加速提高算法效率。AI芯片的主要任务是矩阵或向量的乘法、加法，然后配合一些除法、指数等算法。AI算法在图像识别等领域，常用的是CNN卷积网络，一个成熟的AI算法，就是大量的卷积、残差网络、全连接等类型的计算，本质是乘法和加法。对汽车行业而言，AI芯片的主要用于就是处理智能驾驶中环境感知、传感器融合和路径规划等算法带来的大量并行计算需求。 AI芯片可以理解为一个快速计算乘法和加法的计算器，而CPU要处理和运行非常复杂的指令集，难度比AI芯片大很多。GPU虽然为图形处理而设计，但是CPU与GPU并不是专用AI芯片，其内部有大量其他逻辑来实现其他功能，这些逻辑对于目前的AI算法来说完全无用。目前经过专门针对AI算法做过开发的GPU应用较多，也有部分企业用FPGA做开发，但是行业内对于AI算法必然出现专用AI芯片。 3、为什么要用AI芯片？人工智能从功能上来看包括推理和训练两个环节，智能驾驶行业亦然。在训练环节，通过大数据训练出一个复杂的神经网络模型，目前大部分企业在训练环节主要使用英伟达的GPU集群完成。推理环节是指利用训练好的模型，使用大量数据推理出各种结论。因此，训练环节对芯片的算力性能要求比较高，推理环节对简单指定的重复计算和低延迟的要求很高。从应用场景来看，人工智能芯片应用于云端和设备端，在智能驾驶领域同样具备云服务器和车载的各种计算平台或域控制器，在智能驾驶深度学习的训练阶段需要极大的数据量和大量运算，单一处理器无法独立完成，因此训练环节只能在云服务器实现。相对的在设备端即车上，各种ECU、DCU等终端数量庞大，而且需求差异较大。因此，推理环节无法在云端完成，这就要求车上的各种电子单元、硬件计算平台或域控制器有独立的推理计算能力，因此必须要有专用的AI芯片来应对这些推理计算需求。传统的CPU、GPU都可以拿来执行AI算法，但是速度慢，性能低，尤其是CPU，在智能驾驶领域无法实际投入商用。比如，自动驾驶需要识别道路、行人、红绿灯等路况和交通状况，这在自动驾驶算法里面都是属于并行计算，如果是CPU去执行计算，那么估计车撞到人了也没算出来个结果，CPU并行计算速度慢属于先天不足。如果用GPU速度要快得多，毕竟GPU专为图像处理并行计算设计，但是GPU功耗过大，汽车的电池无法长时间支撑正常使用，而且GPU价格相对较高，用于自动驾驶量产的话普通消费者也用不起。另外，GPU因为不是专门针对AI算法开发的ASIC，执行AI计算的速度优势还没到极限，还有提升空间。在智能驾驶这样的领域，环境感知、物体识别等深度学习应用要求计算响应方面必须快！时间就是生命，慢一步就有可能造成无法挽回的情况，但是保证性能快效率高的同时，功耗不能过高，不能对智能汽车的续航里程造成较大影响，也就是AI芯片必须功耗低，所以GPU不是适合智能驾驶的最佳AI芯片选择。因此开发ASIC就成了必然。 4、AI芯片的种类当前主流的AI芯片主要分为三类，GPU、FPGA、ASIC。GPU、FPGA均是前期较为成熟的芯片架构，属于通用型芯片。ASIC属于为AI特定场景定制的芯片。行业内已经确认CPU不适用于AI计算，但是在AI应用领域也是必不可少，另外一种说法是还有一种类脑芯片，算是ASIC的一种。 FPGA（Field Programmable Gate Array，现场可编程门阵列）具有足够的计算能力和足够的灵活性。FPGA的计算速度快是源于它本质上是无指令、无需共享内存的体系结构。对于保存状态的需求，FPGA中的寄存器和片上内存（BRAM）是属于各自的控制逻辑的，无需不必要的仲裁和缓存，因此FPGA在运算速度足够快，优