- 1、本文档共12页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
MPI Alltoall 通信在多核机群中的优化
1,2,3 1,2 1 1
李强 孙凝晖 霍志刚 马捷
1 中国科学院计算技术研究所高性能计算机研究中心 北京 100190
2 中国科学院计算机系统结构重点实验室 北京 100190
3 中国科学院研究生院 北京 100039
liqiang@
Optimizing MPI Alltoall Communication inMulticore Clusters
1,2,3 1,2 1 1
Qiang Li , Ninghui Sun , Zhigang Huo , Ma Jie
1(Institute of Computing Technology, Chinese Academy of Sciences, Beijing 100190, China)
2(Key Laboratory of Computer System and Architecture, Chinese Academy of Sciences, Beijing 100190, China)
3(Graduate University of Chinese Academy of Sciences, Beijing 100049, China)
AbstractMPI Alltoall is an important collective operation and widely used in many applications. In multicore clusters, many processes
run in a node. On one hand, shared memory has been adopted to optimize Alltoall communication of small messages by leader-based
schemes. However, as these schemes adopt a fixed number of leader processes, the optimal performance can ’t be obtained for all small
messages.On the other hand, processes within a nodecontend for the same network resource .InAlltoall communication of large messages ,
many synchronization messages are required. Nerveless, the contention makes their latency increase many times. As a result, the
synchronization overhead significantly increases the whole latency of Alltoall communication.In this paper, weanalyze the performance
impact of the number of leader processes and the considerable overhead of synchronization messages in Alltoall communication. Base
on the analysis, twooptimizations are presented. For Alltoall communication of smallmessages, the PLP method adopts changeable
numbers of leader processes. For Alltoall communication of largemessages, the LSS method reduces the number of synchronization
messages from to . The evaluations prove two methods. For small mess
您可能关注的文档
- 公共建筑照明能耗管理控制系统.pdf
- 钢包弱搅拌阶段的工艺探究.pdf
- 海水淡化副产浓海水资源化利用.pdf
- 后霸权和文化研究.pdf
- RAID机制在闪存存储系统中的应用的研究.pdf
- W-ZrC复合材料的反应浸渗法制备和后续热处理工艺研究.pdf
- 橙色烟火剂热爆炸危险性分析.pdf
- 黑龙港地区2007-2008年度小麦生产特点和气象条件分析.pdf
- 柴油机喷嘴内部流动的试验的研究.pdf
- 层式通风气流组织特性的理论和实验研究.pdf
- 新的一年工作展望.docx
- 医生年终个人工作的述职报告(3篇).docx
- 2023年消防设施操作员之消防设备中级技能考前冲刺练习题附答案详解.docx
- 2022-2023年环境影响评价工程师之环评技术导则与标准通关练习题包括详细解答.docx
- 2023年中级注册安全工程师之安全生产管理考前冲刺检测卷和答案.docx
- 2023年中级银行从业资格之中级银行管理考前冲刺测试卷提供答案解析.docx
- 2023年公共营养师之二级营养师通关模拟考试试卷附带答案.docx
- 证券分析师之发布证券研究报告业务考前冲刺模拟题库.docx
- 2022-2023年二级建造师之二建建设工程法规及相关知识综合提升测试卷附答案.docx
- 2023年二级建造师之二建机电工程实务通关模拟考试试卷提供答案解析.docx
文档评论(0)