并行计算实验上机.ppt

  1. 1、本文档共34页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实例: GPU上矩阵乘法 GPU上矩阵乘法(主机端函数): … //分配设备端显存 cudaMalloc((void**)cuda_a, sizeof(float)* n * n); cudaMalloc((void**)cuda_b, sizeof(float)* n * n); cudaMalloc((void**)cuda_c, sizeof(float)* n * n); ///生成矩阵a, b generateMatrix(a, b); //cudaMemcpyHostToDevice - 从内存复制到显存 //cudaMemcpyDeviceToHost - 从显存复制到内存 cudaMemcpy(cuda_a, a, sizeof(float)* n * n, cudaMemcpyHostToDevice); cudaMemcpy(cuda_b, b, sizeof(float)* n * n, cudaMemcpyHostToDevice); ///设备端函数 CUDAkernal blocks_num, THREAD_NUM, 0 (cuda_a , cuda_b , cuda_c , n , time); //cudaMemcpy 将结果从显存中复制回内存 cudaMemcpy(c, cuda_c, sizeof(float)* n * n, cudaMemcpyDeviceToHost); //Free cudaFree(cuda_a); cudaFree(cuda_b); cudaFree(cuda_c); } 实例: GPU上矩阵乘法 GPU上矩阵乘法(设备端函数): __global__ static void CUDAkernal (const float* a, const float* b, float* c, int n) { //block内的threadID const int tid = threadIdx.x; //blockID const int bid = blockIdx.x; //全局threadID const int idx = bid * THREAD_NUM + tid; const int row = idx / n; const int column = idx % n; …. 实例: GPU上矩阵乘法 GPU上矩阵乘法(设备端函数): …. //计算矩阵乘法 if (row n column n) { float t = 0; for (i = 0; i n; i++) { t += a[row * n + i] * b[i * n + column]; } c[row * n + column] = t; } } 实例: GPU上矩阵乘法 GPU上矩阵乘法(shared memory): __global__ static void CUDAkernal (const float* a, const float* b, float* c, int n) { ///静态分配shared memory __shared__ int s[64]; …. } … ///动态分配shared memory CUDAkernal blocks_num, THREAD_NUM, N (cuda_a , cuda_b , cuda_c , n , time); …. * * * * * * * * * * * * * * 并行计算实验上机 主要内容 资料下载 关于上机 上机题目(OpenMP、MPI、GPU) 实验资料 实验资料下载: /~wpc520/ParaAlg/ 主要内容 资料下载 关于上机 上机题目(OpenMP、MPI、GPU) 关于上机 上机地点:电三楼5楼机房 上机时间: 第8~10周的周六,分两批次:学号末位奇数9:00-12:00,学号末位偶数18:00-21:00 OpenMP:4.8 9:00-12:00/18:00-21:00 MPI: 4.15 9:00-12:00/18:00-21:00 GPU: 4.22 9:00-12:00/18:00-21:00 上机要求:每次上机后,

文档评论(0)

benzei244572 + 关注
实名认证
内容提供者

没啥好说的额

1亿VIP精品文档

相关文档