- 63
- 0
- 约 6页
- 2016-12-25 发布于重庆
- 举报
矩阵转置并行实现
1、算法描述:
若处理器个数为p,且它们的编号依次是0,1,…,p-1,则将n阶矩阵A分成p个大小为mxm的子块,m=[n/p]。p个子块组成一个子块阵列,记其中第i行第j列的子块为Aij,它含有第(i-1)m+1至第im行中的第(j-1)m+1至第jm列的所有元素。对每一处理器按行主方式赋以二维下标,记编号为i的处理器的二维下标为(v,u),其中v=[i/],u=imod,将A的子块存入下标为(v,u)表示的对应处理器中。转置分为两步进行:第一步,子块转置;第二步,处理器内部转置。为了避免对应子块交换数据是处理器发生死锁,可令下三角块先向与之对应的上三角子块发送数据,然后从上三角子块接收数据;上三角子块数据先存放在缓冲区buffer中,然后从与之对应的下三角子块接收数据,最后再将缓冲区中的数据发送给下三角子块,流程图如下所示:
2、程序代码:
#include stdio.h
#include stdlib.h
#include mpi.h
#include math.h
#define E 0.0001
#define a(x,y) a[x*m+y]
#define b(x,y) b[x*m+y]
#define A(x,y) A[x*size+y]
#define B(x,y) B[x*size+y]
#define intsize sizeof
您可能关注的文档
最近下载
- 2025年湖北省中考英语试卷真题(含答案).docx
- 生物会考必考41个课本母图(填空版)_.pdf
- 2025年哈尔滨理工大学辅导员考试真题.docx VIP
- 新时代职业英语 通用大学英语2 单元测试卷U6(含 听力文本及答案).docx VIP
- 术后并发症的早期识别与处理.pptx VIP
- 12-3DMine矿山工程软件自学教程.pdf VIP
- 2026江西赣州市政公用集团社会招聘39人备考题库及答案详解(全优).docx VIP
- 2026贵州中考:语文重点基础知识点大全.doc VIP
- 宾语补足语在英语句子中应用与.pdf VIP
- [国家事业单位招聘】2025国家广播电视总局广播电视规划院高校毕业生招聘笔试历年参考题库典型考点附带.docx VIP
原创力文档

文档评论(0)