通用计算中的GPU.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 5 卷 第 11 期 2009 年 11 月 通用计算中的GPU 高小鹏 龙 翔 万 寒 倪 璠 关键词 :图形处理器 通用计算 流处理 北京航空航天大学 近年来,图形处理器 (G P U ,G r a p h i c s 1999年,NVIDIA GeForce 256的出现标志 Pr oc e s s U n i t )的发展速度已超过了同一时期 着第二代GPU 的诞生。该款芯片实现了坐标变 CPU 的发展速度。今天的GPU不仅具备高质量 换、三角形建立、裁剪、光照变换以及着色等 高性能图形处理能力,而且随着内部并行处理 功能。第二代GPU 的主要特征是将TL功能从 单元数量的快速增长及可编程性的持续改进, CPU分离出来,实现了顶点的快速变换。虽然 已经演化成为一个新型的并行计算平台。伴 仍不具备真正的可编程能力,但可配置性得到 随着G P U在物理、化学、生物、石油、图像 了加强。 处理、线性代数、3D重构等通用计算领域的 第三代GPU是以200 1年NVIDIA和ATI分别 广泛应用,利用GPU进行通用计算 (Gen er al- 推出的GeForce3和Radeon 8500为标志。图形硬 Purpose Computing on GPU ,GPGPU )已经成 件的流水线被定义为流处理器,出现了顶点级 为一个必须予以重视的研究领域。本文将分析 可编程性,同时像素级也具有有限的编程性。 和总结三方面问题:(1 )当前主流GPU采用何 虽然这一阶段的GPU 的编程性比较有限,但正 种体系结构支持通用计算;(2 )主流GPU在通 是由于可编程性的引入,使得使用GPU进行通 用计算领域的应用;(3 )GPU的编程环境。 用计算成为可能。 2002年A T I发布的R ad e on 9700和2003年 GPU发展概述 NVIDIA GeForce FX 的推出,标志着GPU进入 了第四代——完全可编程时代。GPU 的可编程 在计算机图形学发展初期,图形处理中 性更加通用化,能够包含上千条指令,同时具 计算部分均由软件完成,硬件仅将软件计算完 备了浮点运算功能。2004年后GPU又引入了分 成的图形图像输出。20世纪80年代初期,出现 支处理、统一架构着色器 (Unified Shader )等 [1] 了以GE (Geom etr y En gin e ) 为代表的具有 关键技术。这些技术的出现为GPU通用计算编 大规模集成电路特征的GPU 。20世纪90年代, 程提供了极大的便利,奠定了GPU应用于通用 G P U 承担了越来越多的图形计算功能。随着 计算领域的重要基础。 NVIDIA与ATI进入这一领域,GPU进入大发展 为了高效地支持通用计算,2006年NVIDIA 时期,但我们仍然将1999年之前出现的图形芯 与ATI分别为推出了CUDA (Computer Unified 片称为第一代GPU 。这时的GPU虽然通过硬件 Device Architecture ,统一计算架构)编程环 处理部件提高了3D 图形处理的速度,但缺乏 [2] [3] 境 和CTM (Close To the Metal ) 编程环境。 硬件TL (Transform and Lighting ,坐标变换 借助这些开发环境,软件开发人员可以在一定 及光照变换)引擎,只能起到3D 图像加速的作 的抽象层次来开发通用计算程序,并可充分利 用,不具有软件编程特性。 用GPU所提供的高性能的浮点处理器阵列。

文档评论(0)

docindoc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档