Nvidia_T200详解并行处理器.docVIP

下载本文档

18
0
约9.47千字
约 5页
2016-10-15 发布于贵州
举报

Nvidia_T200详解并行处理器.doc

Nvidia_T200详解并行处理器

注：本文是Nvidias GT200:into the parallel processor的中文译文，原文作者为David Kanter博士翻译本文的目的旨在明CUDA是如何在硬件上实现的，帮助编程人员编写和优化CUDA程序感谢Call of duty的指导简介过去十年中，计算领域出现了一个新的发展趋势：GPU通用计算。由Intel,IBM,SUN,AMD和富士通生产的通用CPU虽然有了很大发展，但性能提高速度却已经不能与与上世纪八十年代末九十年代初相比。单线程处理的性能在很大程度上受到了限制。这些限制一方面来自于通用计算程序中过低的指令级并行;另一方面来自于“功率墙(Power Wall)”--集成电路的功率消耗的物理限制。摩尔定律能够为处理器提供数以亿计的晶体管，但在为了运行单线程程序而设计的处理器中，这些晶体管绝大多数都被用于制造高速缓存(Cache)。这样做虽然能把处理器功耗控制在合理的范围内，却阻碍了性能的进一步提高。与此同时，GPU（图形处理单元）却有效的利用了数量巨大的晶体管资源。由于图形渲染过程的高度并行性，GPU的性能按时间呈几何级数增长。同时，随着 GPU计算能力的不断增长，一场GPU革命的时机也成熟了。GPU已经从由若干专用的固定功能单元(Fixed Function Unit)组成的专用并行处理器，进化为了以通用计算资源为主，固定功能单元为

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

Nvidia_T200详解并行处理器.docVIP