GPU简介及高性能并行计算.docx

下载文档

1
0
约1.13万字
约 11页
2023-03-24 发布于湖北
举报
版权申诉
保障服务

GPU简介及高性能并行计算.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第一章．GPU 的诞生 NVIDIA 公司在 1999 年 8 月 31 日发布 GeForce 256 图形处理芯片时首先提出GPU 的概念。 GPU 之所以被称为图形处理器，最主要的原因是因为它可以进行几乎全部与计算机图形有关的数据运算，而这些在过去是CPU 的专利。目前，计算机图形学正处于前所未有的发展时期。近年来，GPU 技术以令人惊异的速度在发展。渲染速率每6 个月就翻一番。性能自99 年，5 年来翻番了 10 次，也就是（2 的 10 次方比 2）提高了上千倍！与此同时，不仅性能得到了提高，计算质量和图形编程的灵活性也逐渐得以改善。以前，PC 和计算机工作站只有图形加速器，没有图形处理器（GPU），而图形加速器只能简单的加速图形渲染。早期GPU 的强大处理功能只被用于 3D 图像渲染，应用领域受到了限制。随着以CUDA 为代表的GPU 通用计算API 的普及，GPU 在计算机中的作用将更加重要， GPU 的含义也可能从图形处理器（Graphic Processing Unit）扩展为通用处理器（General Purpose Unit）。 GPU 渲染流水线第二章.GPU 发展简介 GPU 的渲染流水线的主要任务是完成 3D 模型到图像的渲染工作。常用的图形学 API （Direct3D/OpenGL）编程模型中的渲染过程被分为几个可以处理的阶段，分别由GPU 中渲染流水线的不同单元进行处理。GPU 输入的模型是数据结构（或语言）定义的对三维物体的描述，包括几何、方向、物体表面材质以及光源所在位置等；而GPU 输出的图像则是从观察点对 3D 场景观测到的二维图像。在GPU 渲染流水线的不同阶段，需要处理的对像分别是顶点（vertex）几何图元（primitive）、片元（fragment）像素（pixel）。如下图典型渲染过程可分为以下几个阶段：顶点生成图形学 API 用简单的图元（点、线、三角形）表示物体表面。每个顶点除了（x,y,z）三维坐标属性外还有应用程序自定义属性，例如位置、颜色、标准向量等。顶点处理本阶段主要是通过计算把三维顶点坐标映射到二维屏幕，计算各顶点的亮度值等。这个阶段是可编程的，由vertex shader 完成。输入与输出一一对应，即一个顶点被处理后仍然是一个顶点，各顶点间的处理相互独立，可以并行完成。图元生成根据应用程序定义的顶点拓扑逻辑，把上阶段输出的顶点组织起来形成有序的图元流。顶点拓扑逻辑定义了图元在输出流中的顺序，一个图元记录由若干顶点记录组成。图元处理这一阶段也可编程的，由geometry shader 完成。输入和输出不是一一对应，一个图元被处理后可生成 0 个或者多个图元，各图元处理也是相互独立的。本阶段输出一个新的图元流。5.片元生成这一阶段将对每一个图元在屏幕空间进行采样，及光栅化。每一个采样点对应一个片元记录，记录该采样点在屏幕空间的位置，与视点之间的距离以及通过插值获得的顶点属性等。片元处理片元处理阶段是可编程的，有pixel shader 完成，主要完成图形的填色功能。模拟光线和物体表面的交互作用，决定每个片元的颜色及透明程度等属性。像素操作用每个片元的屏幕坐标来计算该片元对最终生成图像上的像素的影响程度。本阶段计算每个采样点离视点的距离，丢弃被遮挡住的片元。当来自多个片元影响同一个像素时，往往都根据图元处理输出流中定义的图元位置进行像素更新。图形渲染过程具有内在的并行性：顶点之间、图元之间、片元之间的数据相关性很弱，对他们计算可以独立并行进行。这使得通过并行处理提高吞吐量成为可能。首先，渲染流水线具有时间上的功能并行。流水线的各级可以同时工作，当各级都能满负荷工作时，能够获得最高性能。其次，渲染流水性具有数据并行性。不仅可以通过SIMD 提高每一个可编程着色器的性能，还可以在一个GPU 内集成多条渲染流水线实现更高的吞吐量。着色器模型在图形熏染中，GPU 中可编程计算单元被称为着色器（shader），着色器的性能由 DirectX 中规定的 shader model 来区分。GPU 中最主要的可编程单元是顶点着色器和像素着色器。为了实现更细腻逼真的画质，GPU 的体系架构从最早的固定功能流水线到可编程流水线，再到 DirectX 10 时代的以通用的可编程计算单元为主、图形固定功能单元为辅的形式。在这一过程中，着色器的可编程性也随着架构的发展不断提高。下面给出每代模型的大概特点。 NVIDIA GPU 发展 NVIDIA 公司是全球视觉计算技术行业领袖及GPU 的发明者。作为高性能处理器的GPU 可在工作站、个人计算机、游戏机和移动设备上生成令人叹为观止的互动图形效果。 1993 年，黄仁勋与 Curtis P

您可能关注的文档

文档评论（0）

mph + 关注: 官方认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

认证主体上海谭台科技有限公司

IP属地湖北

统一社会信用代码/组织机构代码: 91310115MA7CY11Y3K

1亿VIP精品文档

更多 >

GPU简介及高性能并行计算.docx