OpenACC应用编程接口-中国科大超算中心.PDF

  1. 1、本文档共73页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
OpenACC应用编程接口-中国科大超算中心

OpenACC 应用编程接口 2.0 版 ,2013 年 6 月 校正,2013 年 8 月 小小河 译 法律条款 1. 对本文档的任何使用都被视为完全理解并接受本文档所列举的所有法律条款。 2. 本文档的所有权利归作者所有,作者保留所有权利。 3. 未经作者书面同意,禁止任何形式的商业使用。商业使用形式包括但不限于存储、出版、复制、传 播、展示、引用、编辑。 4. 本文档允许以学术研究、技术交流为目的使用。复制、传播过程中不得对本文档作任何增减编辑,引 用时需注明出处。 5. 实施任何侵权形为的法人或自然人都必须向作者支付赔偿金,赔偿金计算方法为: 赔偿金 = 涉案人次×涉案时长(天)×涉案文档页数×受众人次×100 元人民币, 涉案人次、涉案时长、涉案文档页数、受众人次小于 1 时,按 1 计算。 6. 对举报侵权行为、提供有价值证据的自然人或法人 ,作者承诺奖励案件实际赔偿金的 50%. 7. 涉及本文档的法律纠纷由作者所在地法院裁决。 8. 本文档所列举法律条款的最终解释权归作者所有。 QQ: 2740513613 2 hpcfan@ 译者序4 第1 章 引言5 1.1 范围5 1.2 执行模型5 1.3 存储模型7 1.4 本文档中的约定8 1.5 本文档组织结构8 1.6 参考文献9 1.7 1.0 版到2.0 版的变化9 1.8 2013 年8 月版文档里的更正之处 10 1.9 未来修订的主题 10 第2 章 导语12 2.1 导语格式 12 2.2 条件编译 13 2.3 内部控制变量 13 2.4 特定设备的子语 13 2.5 加速器计算构件 14 2.6 数据环境20 2.7 loop 构件28 2.8 cache 导语32 2.9 组合导语33 2.10 atomic 导语34 2.11 declare 导语37 2.12 可执行导语39 2.13 计算区域内的过程调用42 2.14 异步行为44 第3 章 运行时库47 3.1 运行时库的定义47 3.2 运行时库例程48 第4 章 环境变量64 4.1 ACC_DEVICE_TYPE 64 4.2 ACC_DEVICE_NUM 64 第5 章 词汇表65 附录A 对支持特定设备编译器的建议68 A.1 目标设备68 A.2 目标平台的接口例程69 A.3 推荐选项72 中译版更新记录73 QQ: 2740513613 3 hpcfan@ 译者序 2007 年以来,以 nVidia GPU 为代表的加速器并行计算风起云涌,带有加速器的超级计 算机在 TOP500 中的份额逐年增加,支持加速器的主流应用软件也呈爆炸式增长,研究加速 器计算的技术人员数以百万计,世界范围内的大学、研究机构竞相开设相关课程。 目前有三家厂商提供加速器产品:nVidia GPU、AMD GPU、Intel 至强 Phi 协处理器。 三种加速器使用的编程语言分别为 CUDA C/CUDA Fortran、OpenCL 和 MIC 导语。加速器 计算有四个技术困难:一是 CUDA/OpenCL 等低级语言编程难度大,且需要深入了解加速器 的硬件结构。而大部分的用户不是专业编程人员,学习一门新的编程技术将耗费大量时间、 人力、财力。二是加速器的计算模型与 CPU 差别很大,移植旧程序需要几乎完全重写。大 量的旧程序在性能优化上已经千锤百炼,稳定性上也久经考验,完全重写是不可完成的任务。 三是低级编程语言开发的程序与硬件结构

您可能关注的文档

文档评论(0)

2105194781 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档