- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用户使用文档(Linux Cluster部分).doc
用户使用文档(Linux Cluster部分)
操作系统:
Linux操作系统使用Redhat Enterpirse Linux AS 4.0, 包含Redhat分发的绝大部分的软件包,用户可以在PC上安装Rehat Linux 9.0或其它linux熟悉操作系统环境。
参考书籍:UNIX编程环境
文本编辑器:用来编译代码的编译器主要有:vim emacs 等。
此部分要求在使用前熟悉。
编译器:
本部分目的在于掌握Intel Compiler的使用。请在此之前熟悉C/Fortran语言。
Intel C/C++编译器接受遵守ANSI C/C++ , ISO C/C++ standards, GNU inline ASM for IA-32 architecture标准的输入。与linux下常用的gcc兼容并支持更大的C语言扩展,包括源文件、命令行参数、目标文件。不支持gcc的inline方式的汇编。
例:
注意,编译与链接都由icc来完成,icc常用命令行参数:
-o 输出文件命名
-I include路径
-L lib路径
-l 包含的lib名
-c 仅生成目标文件(*.o),不链接
-On n=0,1,2,3 编译器优化选项,n=0关闭编译器优化,n=3使用最激进的优化
-c99[-] 打开/关闭 c99规范的支持
详细的请参照icc的manpage.
Intel Fortran编译器支持F77/90/95标准并与CFV(Compaq Visual Fortran)兼容。
例:
编译与连接同样由ifort来完成,ifort常用命令行参数:
-o 输出文件命名
-I include路径
-L lib路径
-l 包含的lib名
-c 仅生成目标文件(*.o),不链接
-On n=0,1,2,3 编译器优化选项,n=0关闭编译器优化,n=3使用最激进的优化
-std90 使用F90标准编译
-std95 使用F 95标准编译
-f77rtl 编译使用F77运行方式的代码(用于解决特殊问题)
核心数学库的使用
本节介绍Intel MKL的使用。Intel MKL数学库针对Intel系列处理器进行了专门的优化,主要包含的库有:
基本线形代数运算(BLAS)
向量与向量、向量与矩阵、矩阵与矩阵的运算
稀疏线形代数运算
快速傅立叶变换(单精度/双精度)
LAPACK(求解线形方程组、最小方差、特征值、Sylvester方程等)
向量数学库(VML)
向量统计学库(VSL)
高级离散傅立叶变换
例,计算NxN矩阵相乘,属于基本线性运算,查找MKL手册BLAS章节可以使用Level 3中的 ?gemm 函数进行运算,假定计算双精度浮点则使用dgemm 函数。
C语言中的定义(CBLAS中):
? void cblas_dgemm(const enum CBLAS_ORDER Order, const enum ,CBLAS_TRANSPOSE TransA, const enum CBLAS_TRANSPOSE TransB, const int M, const int N, const int K, const double alpha, const double *A, const int lda, const double *B, const int ldb, const double beta, double *C, const int ldc);
对应数学表达式:
? c = alpha*op(a)*op(b)+ beta*c,
编写一个程序实现:
文件: mulit.c
编译:
icc multi.c -I/opt/intel/mkl/include –L/intel/mkl/lib –lmpi_ipf –o multi
MPI程序编译方法:
消息传递接口(MPI)并行程序设计模型程序的编译命令。
例:文件hello.c
编译与连接均使用mpicc,参数与mpicc中定义的编译器相同,这里与icc相同。
mpicc –c hello.c –o hello.o
mpicc hello.o –o hello
运行使用mpirun 命令,将运行需要的节点定义在文件中并在-machinfile中制定。
文件: nodelist
运行:
$mpirun –machefile nodelist –np 4 ./hello
node1: hello worl
文档评论(0)