omp并行计算程报告.docVIP

下载本文档

3
0
约 11页
2017-03-05 发布于贵州
举报
版权申诉

omp并行计算程报告.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

omp并行计算程报告

并行计算与多核多线程技术课程报告专业班级学号姓名成绩 2015 年 9月 21日 4.1 基于OpenMP的并行算法实现 4.1.1 主要功能模块与实现方法 xxj_g 0; xxj_g xxj_M/2; xxj_g++ for xxj_d 0; xxj_d xxj_P; xxj_d++ xxj_C[xxj_g][xxj_d] 0; for xxj_k 0; xxj_k xxj_N; ++xxj_k xxj_C[xxj_g][xxj_d] + xxj_A[xxj_g][xxj_k] * xxj_B[xxj_k][xxj_d]; for xxj_g xxj_M/2; xxj_g xxj_M; xxj_g++ for xxj_d 0; xxj_d xxj_P; xxj_d++ xxj_C[xxj_g][xxj_d] 0; for xxj_k 0; xxj_k xxj_N; ++xxj_k // cout 2num omp_get_thread_num endl; xxj_C[xxj_g][xxj_d] + xxj_A[xxj_g][xxj_k] * xxj_B[xxj_k][xxj_d]; 将两个矩阵的乘法进行并行运算打开2个进程#pragma omp parallel num_threads 4 注意输出和输入部分的for循环不能用并行，否则会出现输入输出的个数出错的问题。将得到最终结果的xxj_C[i][j]分成两个子矩阵进行运算第一个子矩阵为xxj_A[i][j]的M/2行乘以xxj_B[i][j]的P列的结果，第二个子矩阵为xxj_A[i][j]的M-M/2行乘以xxj_B[i][j]的P列的结果。参照顺序型的程序 for xxj_i 0; xxj_i xxj_M; xxj_i++ for xxj_j 0; xxj_j xxj_P; xxj_j++ xxj_C[xxj_i][xxj_j] 0; for xxj_k 0; xxj_k xxj_N; ++xxj_k xxj_C[xxj_i][xxj_j] + xxj_A[xxj_i][xxj_k] * xxj_B[xxj_k][xxj_j]; 4.1.2 实验加速比分析取三组数据进行比较第一次第二次第三次顺序时间 124748 27512 31403 串行时间 72290 18597 18541 加速比 1.7256 1.4793 1.6937 5. 设计体会通过这次实验，我了解了并行计算的运行与设计方式，更了解了它的方便和快捷，对于一个程序来说，节省了时间无疑是一个最大的优势，尤其是面对很多的数据的时候，特别的是在我测试数据的时候，要想办法找出成百上千的数据进行测试，虽然它的优点很多，也具有一定的挑战性，不过并行计算的地位始终是非常重要的。 6. 附录 6.1 基于OMP的并行程序设计 6.1.1 代码及注释截图（2）大数据量获得较好加速比的执行结果顺序的时间为xxj_st并行的时间为xxj_ct加速比为xxj_bi测试数据为50*50的两个矩阵，数据为随机生成的，生成随机数据的代码为：#include #include #include #include #include using namespace std; int main int xxj_nl 0; int xxj_nj 1000; int xxj_nCont 0; srand time NULL ; ofstream xxj_ofs xxj_d2.txt ; while 1 xxj_nl rand %xxj_nj; xxj_ofs xxj_nl ; xxj_nCont++; if xxj_nCont 5000 break; xxj_ofs.close ; 截图为：加速比为1.5389 6.1.3 遇到的问题及解决方案问题一将输入输出的for循环放入了并行语句中错误代码及后果 #pragma omp parallel num_threads 2 for xxj_i 0; xxj_i xxj_M;xxj_ i++ for xxj_j 0; xxj_j xxj_N; xxj_j++ cin xxj_A[xxj_i][xxj_j]; for xxj_a 0; xxj_a N; xxj_a++ for xxj_b 0; xxj_b xxj_P; xxj_b++ cin xxj_B[xxj_a][xxj_b]; for xxj_g 0; xxj_g xxj_M