omp并行计算程报告.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
omp并行计算程报告

并行计算与多核多线程技术 课程报告 专业 班级 学号 姓名 成绩 2015 年 9月 21日 4.1 基于OpenMP的并行算法实现 4.1.1 主要功能模块与实现方法 xxj_g 0; xxj_g xxj_M/2; xxj_g++ for xxj_d 0; xxj_d xxj_P; xxj_d++ xxj_C[xxj_g][xxj_d] 0; for xxj_k 0; xxj_k xxj_N; ++xxj_k xxj_C[xxj_g][xxj_d] + xxj_A[xxj_g][xxj_k] * xxj_B[xxj_k][xxj_d]; for xxj_g xxj_M/2; xxj_g xxj_M; xxj_g++ for xxj_d 0; xxj_d xxj_P; xxj_d++ xxj_C[xxj_g][xxj_d] 0; for xxj_k 0; xxj_k xxj_N; ++xxj_k // cout 2num omp_get_thread_num endl; xxj_C[xxj_g][xxj_d] + xxj_A[xxj_g][xxj_k] * xxj_B[xxj_k][xxj_d]; 将两个矩阵的乘法进行并行运算打开2个进程#pragma omp parallel num_threads 4 注意输出和输入部分的for循环不能用并行,否则会出现输入输出的个数出错的问题。 将得到最终结果的xxj_C[i][j]分成两个子矩阵进行运算第一个子矩阵为xxj_A[i][j]的M/2行乘以xxj_B[i][j]的P列的结果,第二个子矩阵为xxj_A[i][j]的M-M/2行乘以xxj_B[i][j]的P列的结果。 参照顺序型的程序 for xxj_i 0; xxj_i xxj_M; xxj_i++ for xxj_j 0; xxj_j xxj_P; xxj_j++ xxj_C[xxj_i][xxj_j] 0; for xxj_k 0; xxj_k xxj_N; ++xxj_k xxj_C[xxj_i][xxj_j] + xxj_A[xxj_i][xxj_k] * xxj_B[xxj_k][xxj_j]; 4.1.2 实验加速比分析 取三组数据进行比较 第一次 第二次 第三次 顺序时间 124748 27512 31403 串行时间 72290 18597 18541 加速比 1.7256 1.4793 1.6937 5. 设计体会 通过这次实验,我了解了并行计算的运行与设计方式,更了解了它的方便和快捷,对于一个程序来说,节省了时间无疑是一个最大的优势,尤其是面对很多的数据的时候,特别的是在我测试数据的时候,要想办法找出成百上千的数据进行测试,虽然它的优点很多,也具有一定的挑战性,不过并行计算的地位始终是非常重要的。 6. 附录 6.1 基于OMP的并行程序设计 6.1.1 代码及注释 截图 (2)大数据量获得较好加速比的执行结果 顺序的时间为xxj_st并行的时间为xxj_ct加速比为xxj_bi测试数据为50*50的两个矩阵,数据为随机生成的,生成随机数据的代码为:#include #include #include #include #include using namespace std; int main int xxj_nl 0; int xxj_nj 1000; int xxj_nCont 0; srand time NULL ; ofstream xxj_ofs xxj_d2.txt ; while 1 xxj_nl rand %xxj_nj; xxj_ofs xxj_nl ; xxj_nCont++; if xxj_nCont 5000 break; xxj_ofs.close ; 截图为: 加速比为1.5389 6.1.3 遇到的问题及解决方案 问题一 将输入输出的for循环放入了并行语句中 错误代码及后果 #pragma omp parallel num_threads 2 for xxj_i 0; xxj_i xxj_M;xxj_ i++ for xxj_j 0; xxj_j xxj_N; xxj_j++ cin xxj_A[xxj_i][xxj_j]; for xxj_a 0; xxj_a N; xxj_a++ for xxj_b 0; xxj_b xxj_P; xxj_b++ cin xxj_B[xxj_a][xxj_b]; for xxj_g 0; xxj_g xxj_M

文档评论(0)

sxa632 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档