集群GPU队列使用指南.docxVIP

下载本文档

2
0
约2.14千字
约 2页
2024-08-13 发布于北京
举报
版权申诉

集群GPU队列使用指南.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

集群GPU队列使用指南

单个GPU使用

首先编写.cu文件，拷贝至用户的主目录下。假设源文件是vectorAdd.cu，编译出来vectorAdd,编译指令如下（命令是一整行的）：

接下来，编写提交的脚本testgpu.txt内容如下：

#!/bin/bash-x

#PBS-NVectorAdd

#PBS-lnodes=1:ppn=1:gpus=1

#PBS-joe

#PBS-qgpu

#definevariables

PATH=/opt/cuda/bin:$PATH

n_proc=$(cat$PBS_NODEFILE|wc-l)

LD_LIBRARY_PATH=/opt/cuda/lib64:/opt/cuda/lib:$LD_LIBRARY_PATH:$LD_LIBRARY_PATH

#binaryfile

/home/users/yourname/vectorAdd

exit0

最后提交任务，qsubtestgpu.txt即完成所有操作。

多个GPU使用（Cuda+OpenMPI）

由于目前gpu对列内每个节点有8个cpu核，只有1个gpu卡。一般只需要一个cpu核绑定一块gpu卡。所以在申请队列中如果需要同时申请多块gpu卡，那么需要控制好申请的cpu数。例如同时申请２个gpu卡，那么在申请脚本里面nodes=2，也就是申请16个cpu核，其中0-7核是在node1，8-15核在node2。在mpi的控制里面，需要绑定第0核和第8核去访问gpu。其余的14个核可以做其他相关的计算。

编译：假设mpi控制指令和cuda程序都写在一个test.cu，编译指令如下。

nvcc-I/opt/cuda/include-I/opt/cuda/NVIDIA_GPU_Computing_SDK/C/common/inc-I/opt/cuda/NVIDIA_GPU_Computing_SDK/shared/inc-L/opt/cuda/lib64-L/opt/cuda/NVIDIA_GPU_Computing_SDK/C/lib-L/opt/cuda/NVIDIA_GPU_Computing_SDK/C/common/lib-L/opt/cuda/NVIDIA_GPU_Computing_SDK/shared/lib-I/opt/intel/include/intel64-I/opt/soft/compiler/ompi/1.4.5/icc.ifort/include-L/opt/intel/lib/intel64-L/opt/soft/compiler/ompi/1.4.5/icc.ifort/libtest.cu-otest-lcutil_x86_64-lcuda–lmpi

递交脚本示例：

#!/bin/bash-x

#PBS-Ncudampi

#PBS-lnodes=2:ppn=8:gpus=1

#PBS-lwalltime=00:08:00

#PBS-joe

#PBS-qgpu

#definevariables

PATH=/opt/cuda/bin:$PATH

n_proc=$(cat$PBS_NODEFILE|wc-l)

LD_LIBRARY_PATH=/opt/cuda/lib64:/opt/cuda/lib:/opt/intel/lib/intel64:/opt/soft/compiler/ompi/1.4.5/icc.ifort/lib:$LD_LIBRARY_PATH

#runningjobs

cd$PBS_O_WORKDIR

#thefollowlinemustbemodifiedtoyourbinaryfile

time

您可能关注的文档

文档评论（0）

知识贩卖机 + 关注: 实名认证

文档贡献者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

集群GPU队列使用指南.docxVIP