- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
新一代高性能并行编程陈一峰-HPCAdvisoryCouncil
新一代高性能并行编程
陈一峯
信息与技术学院
北京大学
多种通讯机制的必要性
不同设备的典型多种底层通讯机制(性能):
集群消息传递(MPI/IB verbs)
多CPU多核使用共享存储
众核使用非顺序一致的共享存储
GPU与主存间PCI使用cudaMemcpy显式数据传输.
很难强迫程序员使用一种统一的通讯:
分布式共享存储?
弱一致性?
分化全局地址空间?
统一的通讯机制, no!
不同通讯机制的统一表示, yes!
影响通讯性能的主要因素 (需要源程序控制)
通讯与计算重合 (发出通讯的时机 )
粒度 (消息长度)
因此“统一表示”必须足够丰富 ,允许控制:
数据位置(哪个存储器/ 内部地址)
数据与线程的关系
行优先、列优先存储 ,矩阵的转制、划分、分布…
集群点到点、集合通讯
多GPU同时进行PCI传输
……
Example (Transposition)
From GPUs to Main Memory
并行化数组(PARRY)
存储类型
元素类型
维度树结构
类型互引
数据传输
这不就是简单代数吗!
可以证明代数系统具有完全性
所有使用加法、乘法、整数除法和整数
余数的下标表达式均可以表示为数组类
型的偏移表达式
任何通讯模式只要使用以上整数操作 ,
就能用Parray表示 (永远不需要升级规
范版本只需升级实现)。
Parallel PCI cudaMemcpy
from Hmem back to Dmem
实现
Parray CUDA 子程序数组拷贝虚代码与实现
Any Array Types!
统一表示MPI 集合通讯
(点到点间通讯任意地址偏移组合)
D An arbitrary array type
MPI_Alltoall when being contiguous
北京大学天河湍流合作基础研究
PKUFFT (用GPU )
规模达到日本地球模拟 MKL (不用GPU )
器记录43倍。 美洲豹
FFT速度记录达到美洲
豹的1.6倍。
证明GPU加速在超大系
统上是实际可用的。
MKL
北京大学众核软件研究组提供以下服务
湍流 燃烧
计算宇宙学
洋流
新编程接口
研发软件工具
培训与移植服务
您可能关注的文档
- 工程地质教学大纲-白银广播电视大学.DOC
- 工程岩体分级标准在深部巷道围岩分级中的应用及-煤田地质与勘探.PDF
- 工程建设项目优秀设计成果申报表-中国施工企业管理协会.DOC
- 工程总包-AKWApparateVerfahren.PDF
- 工程技术中心年报系统-上海研发公共服务平台.DOC
- 工程分析-环境保护-山东栖霞政府门户网站.PDF
- 差分与齐次非平稳序列模型.DOC
- 巫峡-水白中学.PPT
- 差应变法地应力测量-地质力学学报-中国地质科学院地质力学研究所.PDF
- 已提交方法学CDMProjectCycle.PPT
- 新高考生物二轮复习讲练测第6讲 遗传的分子基础(检测) (原卷版).docx
- 新高考生物二轮复习讲练测第12讲 生物与环境(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第3讲 酶和ATP(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第9讲 神经调节与体液调节(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第11讲 植物生命活动的调节(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第8讲 生物的变异、育种与进化(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第5讲 细胞的分裂、分化、衰老和死亡(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第5讲 细胞的分裂、分化、衰老和死亡(检测)(原卷版).docx
- 新高考生物二轮复习讲练测第12讲 生物与环境(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第11讲 植物生命活动的调节(检测)(原卷版).docx
文档评论(0)