- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
GPU计算背后的故事
Ian Buck畅谈GPU计算背后的故事摘要: 近日,GPGPU(General Purpose GPU)计算方面的资深专家、NVIDIA(英伟达)公司的GPU计算软件总经理Ian Buck接受The Next Platform网站采访,畅谈了GPU计算背后的故事...近日,GPGPU(General Purpose GPU)计算方面的资深专家、NVIDIA(英伟达)公司的GPU计算软件总经理Ian Buck接受The Next Platform网站采访,畅谈了GPU计算背后的故事。Ian Buck对于GPU计算的研究最早起始于2000年。当时,Buck及其在斯坦福大学的一个小团队敏锐观察到了图形处理器在性能方面的优势和发展趋势。在 分辨率为1024x768、刷新率为60Hz的情况下,GPU仍然可以很好的实现图像的动态刷新显示。尽管GPU的执行指令只有4-8条,其包含的操作次 数却为每秒60兆左右。Buck团队开始思考如何将GPU应用于游戏和图形处理之外的更多领域。Buck表示, 将GPU用于通用计算的想法是从GPU支持可编程开始的。当时,为了更好的提高游戏图像的显示效果,GPU提供了简单的编程接口。而GPU高并行度的计算 潜力正好符合矩阵乘和很多线性代数操作的需求。因此,Buck团队开始利用GPU非常有限的可编程能力探索了GPU在游戏图像之外的应用性能。在最初几年,他 们遇到了非常大的困难。尽管初步试验可以证实GPU用于通用计算的巨大潜力,推广这个想法却十分不易。一方面,GPU厂商还没有意识到GPU可编程能力的 重要性。因而,GPU提供的图像API非常有限。另外一方面,Buck团队的规模实在比较小。掌握计算机图像学相关知识的同时,又掌握分子动力学等相关应 用领域的理论实在困难。然而,Buck团队开发的GPU 通用计算方面先驱项目——Brook,最终打开了GPGPU的篇章。在2004年,Buck加盟 NVIDIA 并开始集合相关的硬件和软件工程师创造GPGPU 模型——CUDA。Buck曾表示, 在CUDA的应用当中,最让其影响深刻的就是,乳腺癌检测和诊断的系统。与传统方法相比,采用支持CUDA编程的Tesla GPU后,医生能够更早、更精确地发现乳腺癌。而美国国家癌症研究所数据显示,基于CUDA的系统在运行蛋白质配体运算(用于研发治疗癌症和老年痴呆症的 新药)时只需要原来1/12的时间。此后,CUDA 开始受到越来越多的关注。然而,Buck表示,他之前和来自很多工业界的人士交流发现,他们宁愿牺牲性能,也不愿接受一门新的语言。为了能够给相关编程人 员提供很好的入门体验,从而便于CUDA的推广,CUDA采用了已经流行的C语言作为基础。这样,编程人员就不需要去学习特定的显示芯片的指令或是特殊的 结构,即可编写GPU上运行的程序。CUDA的核心 设计理念就是计算机中的线程。与传统CPU中的4、8和16个线程不同,GPU中的线程可以多达几万个。Buck表示,看起来这些线程的管理是一件十分复杂的事情。但实际上,编程人员主要的困难在于如何发挥这些线程的优势,而不是管理这些线程。早期,CUDA的性能主要依赖编程人员人工发现代码中可并行计 算的部分。目前,随着CUDA库的发展,这方面的工作开始越来越自动化。CUDA团队已经开发了很多石油、天然气和国防等相关产业所使用的科学计算方面的 库。最终,2012年发布的Titan超级计算机使用了18688个NVIDIA Tesla K20 GPU作为协处理器,标志着GPGPU在高性能计算方面的成功推广和应用。从2011年开始,Top 500的超级计算机中至少有50台会使用GPU进行加速。而这些机器基本上也都出现在Green 500的列表中。Buck表示,CUDA在超级计算领域的成功应用也迎来了很好的使用反馈。目前,Buck在NVIDIA的团队就根据用户反馈开始探索GPU内存的管理方式。CUDA6就推出了一个新的软件内存管理特性,支持数据在CPU内存和GPU内存之间的自动转移。计划于明年面世的 NVIDIA Pascal GPU 架构则将配备 NVLink,使 GPU 和 CPU 之间的数据传输速度较现有的 PCI-Express 标准加快5至12倍。此外,为了进一步减少编程工作,Cray、PGI以及NVIDIA等领先的HPC供应商在2011年推出了OpenACC编程标准。该标准定义了一组标准化的、高层次的代码注释,使C/C++和Fortran编程人员可以利用GPU加速代码运行。NVIDIA在今年7月更是发布了全新OpenACC免费工具套件,让相关研究人员能够更多的关注科学本身。Buck也一再强调,OpenACC的初衷就是让用户“首先是个科学家,然后才是一个程序员”。
您可能关注的文档
最近下载
- 静脉输液安全隐患及防范措施.pptx VIP
- 专题27.4 相似三角形的性质【十大题型】-2024-2025学年九年级数学下册举一反三系列(人教版).pdf VIP
- 体育教育个人职业生涯规划书.docx VIP
- 梁模板碗扣钢管高支撑架计算600.doc VIP
- 黄磷尾气在循环流化床锅炉中的掺烧使用介绍.PDF VIP
- 碗扣钢管楼板模板支架计算书97027.doc VIP
- Boss Roland逻兰ME-90B 贝斯综合效果器[Simplified Chinese] ME-90B Reference Manual 说明书用户手册.pdf
- 玩转手机银行APP.doc VIP
- 征信报告模板详细版带水印可编辑2025年9月新版.pdf VIP
- 征信电子版PDF个人信用报告简版2024年12月最新版可编辑带水印模板.pdf VIP
原创力文档


文档评论(0)