- 1、本文档共34页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实例: GPU上矩阵乘法 GPU上矩阵乘法(主机端函数): … //分配设备端显存 cudaMalloc((void**)cuda_a, sizeof(float)* n * n); cudaMalloc((void**)cuda_b, sizeof(float)* n * n); cudaMalloc((void**)cuda_c, sizeof(float)* n * n); ///生成矩阵a, b generateMatrix(a, b); //cudaMemcpyHostToDevice - 从内存复制到显存 //cudaMemcpyDeviceToHost - 从显存复制到内存 cudaMemcpy(cuda_a, a, sizeof(float)* n * n, cudaMemcpyHostToDevice); cudaMemcpy(cuda_b, b, sizeof(float)* n * n, cudaMemcpyHostToDevice); ///设备端函数 CUDAkernal blocks_num, THREAD_NUM, 0 (cuda_a , cuda_b , cuda_c , n , time); //cudaMemcpy 将结果从显存中复制回内存 cudaMemcpy(c, cuda_c, sizeof(float)* n * n, cudaMemcpyDeviceToHost); //Free cudaFree(cuda_a); cudaFree(cuda_b); cudaFree(cuda_c); } 实例: GPU上矩阵乘法 GPU上矩阵乘法(设备端函数): __global__ static void CUDAkernal (const float* a, const float* b, float* c, int n) { //block内的threadID const int tid = threadIdx.x; //blockID const int bid = blockIdx.x; //全局threadID const int idx = bid * THREAD_NUM + tid; const int row = idx / n; const int column = idx % n; …. 实例: GPU上矩阵乘法 GPU上矩阵乘法(设备端函数): …. //计算矩阵乘法 if (row n column n) { float t = 0; for (i = 0; i n; i++) { t += a[row * n + i] * b[i * n + column]; } c[row * n + column] = t; } } 实例: GPU上矩阵乘法 GPU上矩阵乘法(shared memory): __global__ static void CUDAkernal (const float* a, const float* b, float* c, int n) { ///静态分配shared memory __shared__ int s[64]; …. } … ///动态分配shared memory CUDAkernal blocks_num, THREAD_NUM, N (cuda_a , cuda_b , cuda_c , n , time); …. * * * * * * * * * * * * * * 并行计算实验上机 主要内容 资料下载 关于上机 上机题目(OpenMP、MPI、GPU) 实验资料 实验资料下载: /~wpc520/ParaAlg/ 主要内容 资料下载 关于上机 上机题目(OpenMP、MPI、GPU) 关于上机 上机地点:电三楼5楼机房 上机时间: 第8~10周的周六,分两批次:学号末位奇数9:00-12:00,学号末位偶数18:00-21:00 OpenMP:4.8 9:00-12:00/18:00-21:00 MPI: 4.15 9:00-12:00/18:00-21:00 GPU: 4.22 9:00-12:00/18:00-21:00 上机要求:每次上机后,
您可能关注的文档
- 德国GUHRING切削刀具.ppt
- 德国公益印象:教育公益.ppt
- 边缘和线特征提取.ppt
- 编目知识讲座.ppt
- 变革中的IT、AV产品EMC测试和认证.ppt
- 变频器故障分析.ppt
- 变频器与PLC的通信.ppt
- 标杆比较中的竞争情报.ppt
- 标准化改革与科技创新.pptx
- 标准样品定值的一般原则和统计方法.pptx
- DB44_T 2611-2025 城市排水管网有毒有害气体监测与风险分级管理技术标准.pdf
- DB44_T 2612-2025 竞赛类科普活动策划与实施服务规范.pdf
- DB43_T 2947-2024 烟草种子质量控制规程.pdf
- DB37_T 4836-2025 煤矿风量实时监测技术要求.pdf
- 叉车防撞系统,全球前22强生产商排名及市场份额(by QYResearch).docx
- 超滤膜,全球前18强生产商排名及市场份额(by QYResearch).docx
- DB62T 4172-2020 玉米品种 酒623规范.pdf
- DB62T 4160-2020 在用真空绝热深冷压力容器综合性能在线检测方法.pdf
- DB62T 4164-2020 辣椒品种 酒椒1号.pdf
- DB62T 4133-2020 公路隧道地质超前预报机械能无损探测技术规程.pdf
文档评论(0)