并行算法实验设计报告.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
并行算法实验设计报告

两个矩阵相乘的行列划分并行算法 摘要:给定两个 QUOTE n 阶矩阵 QUOTE A 与 QUOTE B ,矩阵乘法是指计算 QUOTE C=A×B C=A×B ,现在对两个矩阵乘法进行串行和并行的实验和分析 关键词:并行算法;矩阵相乘; 算法原理: 1、串行算法 通常的O(n3)矩阵乘矩阵的串行计算过程如算法1所示,此外为计算矩阵相乘,还可以有对3层循环采用其他嵌套形式的串行算法。 算法1: 稠密矩阵相乘的i,j,k形式串行算法 2、并行算法 两个矩阵相乘的行列划分并行算法假设一共有P个进程,将矩阵A按行分成P个块,将矩阵B按列分成P个块: 每块包含连续若干个行.为使得负载平衡,应使得每块中的行数尽量相等.将Ak与Bk分别存储在进程Pk的A‘与B‘中.将C分为P×P块,且将Ci,j存储在Pi的Pi中,如算法2 算法2 稠密矩阵乘C=A×B的行列划分并行算法 实验由MPICH2在VS2010上进行并行环境的配置来完成,单机情况下用进程数的个数模拟多处理器。 在实验中算法由以下几个函数实现: void readData();此函数被rankID为0的进程调用,负责从dataIn.txt文件中A[M,K],B[P,N]两个相乘矩阵的数据,并为结果矩阵C[M,N]分配空间。其中C[N,N]=A[M,K]*B[P,N]。 int gcd(int M,int N,int group_size) 此函数用来返回两个整数的不大于group_size的最大公因子,即算法所用到的处理器个数,为了保证行划分和列划分可以平均的划分,通过求M,N不大于group_size的最大公因子来确定实际用到的处理器p。 void printResult();此函数被rankID为0的进程调用,用来将A,B,C矩阵打印输出给用户,并输出用于分发数据和并行计算的时间。 int main(int argc, char **argv) ;程序的主函数。 算法分析(可扩展性分析): 在LogP模型上,算法2并行执行时间为: Tp=2n3p+ps+bn2 由此可知,并行效率为: Ep=11+p2s2cn3+bp/(2cn) 因此,等效率函数为:W=O(p3/2) 算法的MPI程序: // matrix.cpp : 定义控制台应用程序的入口点。 // #include stdafx.h #include stdio.h #include stdlib.h #include mpi.h #includempicxx.h #define intsize sizeof(int) #define floatsize sizeof(float) #define charsize sizeof(char) #define A(x,y) A[x*K+y] #define B(x,y) B[x*N+y] #define C(x,y) C[x*N+y] #define a(x,y) a[x*K+y] #define b(x,y) b[x*n+y] #define buffer(x,y) buffer[x*n+y] /* 此宏用来简化对标号为奇数的处理器内的缓冲空间的访问 */ #define c(l,x,y) c[x*N+y+l*n] float *a,*b,*c,*buffer; int s; float *A,*B,*C; /* A[M,K],B[P,N].正确的情况下K应该等于P,否则无法进行矩阵相乘 */ int M,N,K,P ; int m,n; int myid; int p; /* 保存工作站集群中处理器数目,也即通信子大小 */ FILE *dataFile; /* 用于读取输入文件内容和将计算结果输出到结果文件的临时文件指针 */ MPI_Status status; double time1; double starttime,endtime; /* * 函数名: readData * 功能: 此函数被rankID为0的进程调用,负责从dataIn.txt文件中读入 * A[M,K],B[P,N]两个相乘矩阵的数据,并为结果矩阵C[M,N]分配空间。 * 其中C[N,N]=A[M,K]*B[P,N] * 输入: 无 * 返回值:无 */ void readData() { int i,j; starttime = MPI_Wtime(); dataFile=fopen(dataIn.txt,r); fscanf(dataFile,%d%d, M, K);

文档评论(0)

haihang2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档