GPU行业市场分析.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

GPU行业市场分析

GPU芯片概述

GPU定义和主要组成

GPU(GraphicsProcessingUnit):一般称为图形处理器,被广泛用

于个人电脑工作站移动设备游戏机嵌入式系统中做图像和图

形相关运算工作。GPU结构:GPU是一个异构的多核处理器芯片,

针对图形图像处理优化。通常包括运算单元L0/L1/L2缓存Warp

调度器存取单元分配单元寄存器堆PCIe总线接口显卡互

联单元等组件。GPU工作方式:GPU并不是一个独立运行的计算平

台,需要通过PCIe总线与CPU连接在一起来协同工作,可以看作

CPU的协处理器。

GPU相较于CPU并行计算能力更强

CPU当中运算单元占据面积相对较小。CPU硬件设计过程中为了实

现低延迟增加了存储单元和控制单元的复杂度,运算单元在GPU中

占据面积相对较小,以lntelCorei73960X为例,其运算单元面积

(621.4mm2)大致占总芯片面积(435mm2)的30%。CPU的并

行计算能力相对较弱。CPU通过指令级并行数据级并行也可以提

升其并行计算能力,但是带来的提升也是有限的。单核CPU性能逐

步逼近物理极限。由于CPU受至『能耗墙’:的限制,CPU主频难以持

续提升,单核CPU性能逐步逼近物理极限,采用多核CPU的策略

一定程度缓解了CPU性能提升的制约,当前大数据和人工智能带来

了海量的数据,CPU已经无法跟上多源异构数据的爆炸性增长。

GPU具有数量众多的运算单元,采用极简的流水线进行设计,适合

计算密集易于并行的程序。CPU的运算单元数目相对较少,单一

运算核心的运算能力更强,采用分支预测寄存器重命名乱序执行

等复杂的处理器设计,适合相对复杂的串行运算。GPU设计过程中

侧重吞吐优化,具备强大的内存访问带宽。CPU设计过程中侧重时

延优化,包含复杂的多级缓存L(1/L2/L3)和逻辑控制单元。CPU

承担运算核心和控制中心的地位,GPU一般作为协处理器负责图形

渲染和并行计算。

GPU的核心功能一:图形渲染

GPU凭借其较强的并行计算能力,已经成为个人电脑中图像渲染的

专用处理器。图形渲染具体实现要通过五阶段:顶点着色形状装配

光栅化纹理填充着色、测试与混合。GPU渲染流程:三维图像信

息输入GPU后,读取3D图形外观的顶数据后,1)在流处理器中

构建3D图形的的整体骨架,即顶处理;2)由光栅化处理单元把

矢量图形转化为一系列像素,即光栅化操作;3)在纹理映射单元

实现纹理填充;4)在流处理器中完成对像素的计算和处理,即着色

处理;5)在光栅化处理单元中实现测试与混合任务。至此,实现一

个完整的GPU渲染流程。

GPU的核心功能二:通用计算

2003年,GPGPUG(eneralPurposecomputingonGPU,基于GPU的

通用计算)的概念首次被提出,意指利用GPU的计算能力在非图形处

理领域进行更通用、更广泛的科学计算。GPGPU概念的提出,为

GPU更为广泛的应用开拓了思路,GPGPU在传统GPU的基础上进

行了优化设计,部分GPGPU会去除GPU中负责图形处理加速的硬

件组成,使之更适合高性能并行计算。GPGPU在数据中心被广泛地

应用在人工智能和高性能计算、数据分析等领域。GPGPU的并行处

理结构非常适合人工智能计算,人工智能计算精度需求往往不高,

INT8、FP16、FP32往往可以满足大部分人工智能计算。GPGPU同

时可以提供FP64的高精度计算,使得GPGPU适合信号处理、三维

医学成像、雷达成像等高性能计算场景。

微架构设计是GPU性能提升的关键所在

GPU微架构M(icroArchitecture)是兼容特定指令集的物理电路构

成,由流处理器、纹理映射单元、光栅化处理单元、光线追踪核心、

张量核心、缓存等部件共同组成。图形渲染过程中的图形函数主要用

于绘制各种图形及像素、实现光影处理、3D坐标变换等过程,期间

涉及大量同类型数据

文档评论(0)

pengyou2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档