Nvidia_T200详解并行处理器.docVIP

  • 18
  • 0
  • 约9.47千字
  • 约 5页
  • 2016-10-15 发布于贵州
  • 举报
Nvidia_T200详解并行处理器

注:本文是Nvidias GT200:into the parallel processor的中文译文,原文作者为David Kanter博士 翻译本文的目的旨在明CUDA是如何在硬件上实现的,帮助编程人员编写和优化CUDA程序 感谢Call of duty的指导 简介 过去十年中,计算领域出现了一个新的发展趋势:GPU通用计算。 由Intel,IBM,SUN,AMD和富士通生产的通用CPU虽然有了很大发展,但性能提高速度却已经不能与与上世纪八十年代末九十年代初相比。单线程 处理的性能在很大程度上受到了限制。这些限制一方面来自于通用计算程序中过低的指令级并行;另一方面来自于“功率墙(Power Wall)”--集成电路的功率消耗的物理限制。摩尔定律能够为处理器提供数以亿计的晶体管,但在为了运行单线程程序而设计的处理器中,这些晶体管绝大多 数都被用于制造高速缓存(Cache)。这样做虽然能把处理器功耗控制在合理的范围内,却阻碍了性能的进一步提高。 与此同时,GPU(图形处理单元)却有效的利用了数量巨大的晶体管资源。由于图形渲染过程的高度并行性,GPU的性能按时间呈几何级数增长。同时,随着 GPU计算能力的不断增长,一场GPU革命的时机也成熟了。GPU已经从由若干专用的固定功能单元(Fixed Function Unit)组成的专用并行处理器,进化为了以通用计算资源为主,固定功能单元为

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档