- 1、本文档共4页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于GPU集群的深度优先并行算法设计与实现.pdf
第42卷 第 1期 计 算 机 科 学 Vo1.42No.1
2015年 1月 Computer Science Jan2015
一 种基于GPU集群的深度优先并行算法设计与实现
余 莹 。 李肯立 郑光勇
(衡阳师范学院计算机科学系 衡阳421002) (湖南大学信息科学与工程学院 长沙410082)
摘 要 深度优先搜索算法在 GPU集群中大型图上的简单执行,会导致线程 间的负载不平衡和无法合并内存访问
的情况,这使得算法的性能较低。为了明显提高算法在单个GPU和多个GPU环境下的性能,在处理数据之前通过
采取一系列有效的操作来进行重新编排。提 出了构造线程和数据之间映射的新技术,通过利用前缀求和及二分查找
操作来达到完美的负载平衡。为了降低通信开销,对DFS各分支中需要进行交换的边集执行修剪操作。实验结果表
明,算法在单个GPU上可以尽可能地实现最佳的并行性,在多GPU环境下可以最小化通信开销。在一个 GPu集群
中,它可以对含有数十亿节点的图有效地执行分布式DFS。
关键词 GPU,深度优先搜索(DFS),分布式算法,CUDA,MPI
中图法分类号 TP391.9 文献标识码 A DOI 10.11896/j.issru1002—137)(.2015.1.019
ImplementationofDepthFirstSearchParallelAlgorithm onClusterofGPUs
YU Ying。 LIKen-li ZHENG Guang-yong
(DepartmentofCompuperScience,HengyangNormalUniversity,Hengyang421002,China)
(CollegeofComputerScienceandElectronicEngineering,HunanUniversity,Changsha410082,China)。
Abstract Straightforwardimplementationofdepthfirstsearchalgorithm forlargegraphonGPU cluster,maylead to
loadimbalancebetweenthreadsandun-coalescedmemoryaccesses,givingrisetOthelow performanceofthealgorithm.
InordertoachieveimprovementoftheperformanceinasingleGPU andmulti—GPUsenvironment,aseriesofeffective
operationswereusedtoreschedulebeforeprocessingthedata.A novelstrategyformappingbetweenthreadsanddata
wasproposed,andbyusingtheprefixsum andbinarysearchoperations,loadbalancingwasachievedperfectly.Inorder
toreducethecommunicationoverhead,weperformedpruningoperationonthesetofedgeswhichneedstObeexchanged
atallbranchesofDFS.Experimentalresultsshow thatthealgorithm canachieveitsbestparallelism availableonasin—
gleGPU andminimizecommunicationoverheadamongGPUs.GPU clustercaneffectivelyperform thedistributedDFS
ongraphswhichcontainbillionsofnodes.
Ke
您可能关注的文档
- GAUSS PERIODS AND CYCLIC CODES FROM CYCLOTOMIC SEQUENCES OF SMALL ORDERS.pdf
- FRAND标准必要专利许可使用费的计算——以中美相关案件比较为视角.pdf
- ICU机械通气患者气管内吸痰时插管深度的改进.pdf
- IKSH-20型油菜开沟机的使用及故障排除.pdf
- MBR膜在线路板废水深度处理中的应用.pdf
- miR-21与Nocodazole联合作用对小鼠成肌细胞C2C12周期的影响.pdf
- Narcotrend用于全麻手术期间麻醉深度监测的临床评价.pdf
- Narcotrend脑电意识监测在麻醉深度监测中的应用.pdf
- Numerical prediction on the scour burial of cylinder object freely resting on the sandy seabed in the East China Sea using the DRAMBUIE model.pdf
- O3H2O2深度氧化处理石化废水的研究.pdf
- 康复医疗服务行业2025年市场扩张与需求增长分析报告.docx
- 2024-2025学年初中美术七年级下册苏少版(2024)教学设计合集.docx
- 房屋租赁管理委托事权合同.docx
- 2024-2025学年初中生物学八年级上册人教版(新课程标准)(2024)教学设计合集.docx
- 2025年新能源汽车分时租赁在城市交通拥堵治理中的创新应用评估报告.docx
- 2024-2025学年初中生物学八年级上册苏教版(2024)教学设计合集.docx
- 房屋租赁合同.docx
- 美容医疗器械市场供需关系与产品创新方向报告.docx
- 房屋租赁合同书自行成交版.docx
- 2024-2025学年初中生物学八年级下册北师大版(2024)教学设计合集.docx
文档评论(0)