网站大量收购闲置独家精品文档,联系QQ:2885784924

高等计算机体系结构文献综述GPU发展.docVIP

高等计算机体系结构文献综述GPU发展.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高等计算机体系结构文献综述GPU发展

北 京 科 技 大 学 《高等计算机体系结构》 文献综述 题目:GPU的发展研究 学 院 计算机与通信工程学院 班 级 ? 124班 学 号 ? 姓 名 ? 陈希 时 间 ? 2012年11月02日? 引言 随着半导体工艺的发展, 芯片上集成的晶体管数目按照摩尔定律增加, 各种处理器的存储和计算能力也因此不断提高。作为最常用的两类处理器芯片, CPU 和GPU 的性能发展呈现不同的规律。CPU 是计算机的主控处理部件, 需要应对各种复杂的控制过程, 追求的标量性能, 注重通用性, 因此在其芯片体系结构设计时, 不得不将大量的芯片资源用于分支预测、乱序执行等复杂的控制逻辑, 从而限制了其计算性能的提升。而GPU 原本只负责加速图形计算, 功能相对比较单一, 芯片的控制逻辑比较简单, 主要的芯片资源都用于提升计算性能, 因此其计算能力发展更为迅速。 例如, AMD公司2009 年第一季度发布的专业级流处理GPUFireSt ream 9270[ 1] 的单精度浮点峰值性能达到1.2T Flo ps, 而Intel 公司顶级的Core2 Ex tr eme 9650四核处理器的浮点处理能力仅有96GFlo ps, 可见在计算性能方面, GPU 要高出CPU 整整一个数量级。计算性能增长的同时, GPU 的存储性能也在不断提升, 2~ 4GB 的存储容量、256~ 512 位宽的存储总线都为GPU 发挥出强大的计算能力提供了充分的保证。除了计算性能外, 从性/ 价比和性能/ 功耗比上看, GPU 相对于通用CPU 同样拥有明显的优势。这些特性都使得GPU 成为搭建超级计算机的良好选择, 可以在有限的系统规模和金钱开销的限制下达到非常高的峰值计算性能, 因此越来越受到高性能计算领域的关注。计算性能不断提升的同时, 限制GPU 广泛应用的另一制约因素) ) ) 可编程性, 也在不断提高。早期的GPU 仅负责图形加速, 流水线的功能固定, 只能执行有限的几个操作以完成图像的生成。硬件工艺的进步使得GPU 内处理单元的结构越来越复杂, 功能也越来越灵活, 其流水线具备了执行用户自定义程序的能力, 从而具备了初步的可编程性。从最初的底层图形API 发展到现在高度抽象的CUDA[ 2] 、Broo k + [ 3] 以及OpenCL[ 4] , GPU的可编程性得到了极大的提升, 已经具备了开发非图形领域应用的基本能力, GPU 上的通用计算( General Purpose computat io n on GPU s, 简称 GPGPU[ 5] ) 也成为体系结构、编程及编译等领域热点的研究方向之一。 CPU/GPU协同并行计算研究进展 GPU定义及相关技术 GPU英文全称(Graphic ProcessingUnit),中文翻译为“图形处理器”。GPU是相对于CPU的一个概念,由于在现代的计算机中图形的处理变得越来越重要, 需要一 个专门的图形的核心处理器。GPU是显示卡的“ 大脑”, 它决定了该显卡的档次和大部分性能,同时也是2D显示卡和3D显示卡的区别依据。GPU 使显卡减少了对C P U 的依赖, 并进行部分原本CPU的工作, 尤其是在3D图形处理时。GPU所采用的核心技术有硬体TL、立方环境材质贴图和顶点混合、纹理压缩和凹凸映射贴图双重纹理四像素256位渲染引擎等,而硬体TL技术可以说是G P U 的标志。 T&L技术是最近在图形加速卡上都可以看得到的规格名称之一,这个名词的原来意义是:Transforming以及Lighting,光影转换。在图形加速卡中,T&L的最大功能是处理图形的整体角度旋转以及光源阴影等三维效果。 3D图上有许多的连结点,每一个连结点都可视为一条线的转折点,通过这些连结点,图形芯片可以很清楚地将整个对象的结构辨识出来。然而,这些连结点在这张3D设计图上的位置是固定不动的,换句话说,不管我们从任何一个角度来看这个对象,连结点的位置并没有变动,变动的只有角度的不同。不过,对象图案若只进行到Transforming的阶段,在对象的表面也只有连结点而已,并没有加上颜色色块或任何材质的贴图表现,因此,很像是立体的3D透视图。 一般来说,T&L的效能常用「单位时间内所能处理多少个多边形的连结点变化以及光源运算」为基准。像nVidia的GeForce 2便能在每秒钟处理2500万个多边形,

文档评论(0)

yingrong + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档