- 3
- 0
- 约1.16千字
- 约 37页
- 2017-06-14 发布于河南
- 举报
lectur4_CUDA并行模型
2013 HPC 课程HPC课程:GPU编程之CUDA 基于Kernel的数据并行执行模型彭博;目标;;;;一个处理图像的Kernel源代码;;一个简单的可运行的例子矩阵相乘;编程模型:方矩阵相乘例子;;矩阵相乘简单的Host端执行的C代码;Kernel函数- 一个小的例子;一个稍微大些的例子;一个再大一些的例子; // 线程配置
// TILE_WIDTH 是一个用“#define”定义的常量
dim3 dimGrid(Width/TILE_WIDTH, Width/TILE_WIDTH, 1);
dim3 dimBlock(TILE_WIDTH, TILE_WIDTH, 1);
// 开始在device端执行该Kernel函数!
MatrixMulKerneldimGrid, dimBlock(Md, Nd, Pd, Width);;Kernel函数;Col = 0 * 2 + threadIdx.x
Row = 0 * 2 + threadIdx.y;Block (0,1)计算过程演示;一个简单的矩阵相乘Kernel;CUDA Thread Block(线程块);并行的历史;并行的历史(续);? David Kirk/NVIDIA and Wen-mei Hwu, 2007-2012
您可能关注的文档
最近下载
- 高血压性脑出血重症管理专家共识(2026版).pptx VIP
- 《基于杜邦分析法的2022年比亚迪集团企业盈利能力分析案例(论文)》7700字.docx VIP
- 显微镜基本知识.ppt
- T∕CCTAS 308-2026 穿越活动断裂带铁路隧道设计规范.pdf VIP
- 锻压机上下料机械手机械及PLC的设计【毕业论文】.docx VIP
- 消费者行为学知到智慧树期末考试答案题库2025年湖南大学.docx VIP
- 2025年全国高等学校英语专业四级考试真题及答案解析.pdf VIP
- 禹州商品交易博览城商铺自营商户管理协议.doc VIP
- 长歌行汉乐府古诗原文.docx VIP
- 2025年江苏卫生系统招聘考试(中药学)历年参考题库含答案详解.docx VIP
原创力文档

文档评论(0)