一种面向不可靠网络快速RDMA通信方法.docVIP

一种面向不可靠网络快速RDMA通信方法.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种面向不可靠网络快速RDMA通信方法

一种面向不可靠网络的快速RDMA通信方法   摘要:大数据量的远程内存访问(RDMA)传输是并行计算机中最基本的通信模式之一,对系统整体性能的影响很大.随着并行计算机系统的规模扩大,系统的容错性设计面临着很大的挑战,互连网络具有链路不可靠、自适应路由等特点,如何面向不可靠网络实现可靠的端到端RDMA传输是并行系统体系结构设计的一大难题.提出一种面向不可靠网络下的快速RDMA传输方法,方法能够在节点控制器芯片上高效实现,对上层驱动软件和应用提供可靠的端到端RDMA传输服务.与传统的建立连接的方法相比,方法的硬件设计复杂度大大降低;方法另一优点是实现了按需重传,避免了传统方法中一次RDMA传输出现错误时,需要重传整个RDMA数据的开销,在相同的错误概率下,新方法的传输效率得到了很大的提升.   关键词:远程内存访问;RDMA;MPI;滑动窗口   中图分类号:TP302.1 文献标识码:A   A Fast RDMA Offload Method for Unreliable   Interconnection Networks   WANG Shaogang,XU Weixia,WU Dan,PANG Zhengbin,XIA Jun   (College of Computer, National Univ of Defense Technology, Changsha, Hunan410073, China)   Abstract:Large data RDMA (Remote Data Memory Access) transport is the most commonly used parallel communication mode for parallel computers, which has great impact on the whole system performance. As the system size increases, the faulttolerate architecture design faces new challenges. The interconnection network usually uses the adaptive routing mode and becomes more unreliable. This paper proposed a fast RDMA offload method for unreliable interconnection networks, which can be efficiently implemented on the NIC hardware and provides reliable RDMA communication for upper driver and programs. Compared with the traditional approaches, the hardware overhead is greatly reduced. Another benefit is that it can partially retransmit the fault data, which greatly reduces the whole RDMA delay. Simulation results show that the RDMA delay is greatly reduced, compared with the traditional methods.   Key words:remote data memory access, RDMA, MPI, sliding window approach   高性能并行计算机系统发展迅速,2013年11月份发布的Top500高性能计算机排行榜中,系统峰值性能已经达到50 P (Petaflops),处理核数达到数十万的规模.据此发展趋势,国际上高性能计算机计算水平将在2015年左右达到100 P量级,在2016年达到1 E (Exaflops)量级[1-4].如此大规模的系统需要支持数百万个节点的高效通信,节点间通信机制已成为制约系统性能乃至成败的关键因素.   并行计算机互连网络中,Serdes链路速率已达40Gbps[5-7],高速链路的误码率大大增加,给链路级的可靠传输带来了很大的挑战;随着网络规模的扩大,网络的平均故障时间越来越短,并行计算机的互连网络变得越来越“不可靠”.在这种条件下,并行计算机体系结构设计迫切需要进行对应的容错设计.   远程内存访问(RDMA)是并行机系统中最基本的通信模式之一[1,3],其他复杂的聚合

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档