gpu大百科全书第六节.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
gpu大百科全书第六节

GPU 大百科全书第六章 谁也离不开的缓冲 房子分大小,缓冲分等级 前言:时隔一个月,GPU 大百科全书又回来了。在之 长达三个多月的漫长连载中,我们一起按照工作顺 序走过了整个GPU 的流水线,相信在经历了这次辛苦的旅程之后,屏幕前的你多多少少都会有所收获了吧。 我们在上一期GPU 大百科全书的结尾曾经说过,工作单元游历的完结并不代表着GPU 大百科全书的结 束,因为除了我们见过的这些功能各异的运算/操作单元之外,GPU 中 有这一群数量庞大且作用极其重要 的 “幕后英雄”。它们分布在整个GPU 内外,虽然并不直接参与任何运算和控制动作,但却担负着提升GPU 执行效率的重要使命。它们就是GPU 以及整个显卡最重要的组成部分——缓冲体系。 缓冲对于这个世界来说是至关重要的存在。工厂里的堆料车间是缓冲;城市里的停车场是缓冲;学生 们做题时的草稿纸是缓冲;甚至当你被沉重的工作压得透不过气来的时候,放下工作去睡上一觉也是缓冲。 缓冲可以为连贯任务的执行提供极大的帮助,甚至 能为执行单元更好的动作提供先决条件。对于GPU 这 一大并行度的运算执行体系来说,通过合理的缓冲设置来临时挂起和快速存储数据,不仅有助于数据的快 速存储和结果的转移,更可以掩盖延迟造成的执行断档。 辅路可以为城市交通提供缓冲 要说缓冲体系完全躲在幕后吧,其实也有点冤枉。这些幕后英雄中有一位曝光率极高,甚至到了人尽 皆知的地步。但对整个体系来说,润物细无声才是形容它们最好的词汇。今天,我们就来见见这些平时不 怎么露面,但却能够影响GPU 性能的朋友们吧。 房子分大小,缓冲分等级 现代GPU 的缓冲体系十分庞大,它包含了由体积、延迟及位置决定的4 个主要的组成部分,分别是显 存 (Memory)、纹理缓存 (Texture cache)、共享缓存 (shared)及寄存器(Register)。显存置于GPU 芯片外部,通过GPU 内部的显存控制器进行控制和操作。纹理缓存、共享缓存及寄存器则集成在GPU 内部, 分别供TMU 和ALU 控制及使用。 GPU 缓冲体系 在整个缓冲体系中,显存的体积是最大的,大到只能将其独立到GPU 芯片之外。作为缓冲体系中最重 要的组成部分,显存的知名度已经高到一提显卡必定提到它的地步了。相对于显存,缓冲体系中其他三位 成员的名声不仅矮了一大截,甚至都不为大多数人所知晓。尽管在整个缓冲体系中显存并不是需要投注最 多设计资源的部分,其作用也并不比其他三者更加突出。但在很多消费者心目中,显存的快慢和大小几乎 是影响一款显卡身份和地位的唯一标准。对于GPU 及整个显卡体系来说,显存就像是一个巨大的仓库,材 质也好,指令也罢,几乎所有涉及显示的东西都能装进去。 我们今天的故事,就从这最大的仓库开始吧。 显存翻新历代记 显存翻新历代记 显存的历史是如此的漫长悠久,它的命运一直是与显卡交织在一起的,甚至可以说显存的历史就是显 卡的历史。当最初的显卡出现时,尽管功能单一且作用极其有限,但它毕竟担负着输出画面的职责,而输 出画面这一连贯动作本身需要一个临时缓冲,因此从显卡诞生的第一天起,显存作为帧缓冲就已经出现了。 今天我们看到的运行频率高达数G,带宽动辄几百G 的显存系统,全部发端于缓冲这些每秒不过几K 甚至 仅仅几百字节画面数据的buffer。 古老的Trident 8900 显卡 限于半导体工艺以及IC 逻辑结构涉及的水平,最初的显存与内存具有极大的通用性,FP-DRAM (Fast Page DRAM)及EDO-RAM (Extend Data Output DRAM)等等当时内存常用的颗粒在显存中同样适用,甚至 当时相当多显卡的显存颗粒都是可拆卸和手工扩展的。这些延迟几十甚至几百纳秒的显存在今天看来简陋 不堪而且慢如蜗牛,但他们在当时不仅十分先进,而且其高通用性也促进和保障了显卡的正常工作以及稳 定发展。 EDO-RAM 随着时间的推移,显卡逐渐从传统的2D 输出控制机构转变成了能够执行CPU 发出的图形相关命令的 独立单元,甚至具备了操作纹理及材质的能力。材质的以及帧缓存的配合操作对显卡的存储空间提出了 所未有的要求,传统的FP-DRAM 以及EDO-RAM 已经无法满足图形发展的需要。于是对SD-RAM 的大规模使 用

文档评论(0)

rachel + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档