- 20
- 0
- 约7.87千字
- 约 46页
- 2018-07-05 发布于天津
- 举报
TILE_WIDTH2的子矩阵每个线程块中有-Read
矩阵乘法示例 矩阵P = M * N 大小为 WIDTH x WIDTH 在没有采用分片优化算法的情况下: 一个线程计算P矩阵中的一个元素 M和N需要从全局存储器载入WIDTH次 向GPU传输矩阵数据 void MatrixMulOnDevice(float* M, float* N, float* P, int Width) { int size = Width * Width * sizeof(float); float* Md, Nd, Pd; //设置调用内核函数时的线程数目 dim3 dimBlock(Width, Width); dim3 dimGrid(1, 1); //在设备存储器上给M和N矩阵分配空间,并将数据复制到设备存储器中 cudaMalloc(Md, size); cudaMemcpy(Md, M, size, cudaMemcpyHostToDevice); cudaMalloc(Nd, size); cudaMemcpy(Nd, N, size, cudaMemcpyHostToDevice); //在设备存储器上给P矩阵分配空间 cudaMalloc(Pd, size); 计算结果向主机传输 //内核函数调用 //只使用了一个线程块(dimGrid)
您可能关注的文档
- -高性能计算中心-上海交通大学.DOC
- 006艺术教育基地智能综合管理平台招标文件-深圳第二高级中学.DOC
- 01农林果蔬类-山东教育招生考试院.DOC
- 07食品工程原理复习题.DOC
- 05交通运输工程道路方向培养方案-华南理工大学.DOC
- 080700动力工程及工程热物理---博士培养方案-能源与动力工程学院.DOC
- 09届高三地理宇宙中的地球单元考试卷.DOC
- 0丽水水阁提升改造工程MBBR填料设备招标文件.DOC
- 09湖南电气控制技术技能竞赛技术文件.DOC
- 09知识单元-数字电路基础.DOC
- 4.4 控制系统的设计与实施(教学设计)高中通用技术苏教版2019必修2.docx
- 2026届衡水市第十三中学高三第一次质量调研(一模)数学试题.doc
- 3.1.1关系数据结构及关系代数教学设计-浙教版高中信息技术选修三.docx
- 高考化学二轮复习 阿伏伽德罗常数.docx
- 运筹学期末复习完全手册(直接使用版).docx
- 人工肝治疗中的家属支持与护理.pptx
- 人工肝治疗后的康复护理.pptx
- 4 自由落体运动(表格式教学设计)高中物理人教版2019必修第一册.docx
- 第05讲 充分条件、必要条件、充要条件(八大题型)新高一数学(苏教版2019必修第一册).docx
- 29 古代诗歌文本比较鉴赏题(比较形象、语言、表达技巧、情感态度)高考语文二轮复习专题.docx
最近下载
- 2023款比亚迪宋PLUS DM-i 冠军版_汽车使用手册用户操作图示图解详解驾驶指南车主车辆说明书电子版.pdf
- 骨干教师考试题库大全及详细答案.docx VIP
- “一带一路”国家跨文化商务交际教程(第二版)答案.pdf VIP
- 发动机气缸盖拆装课件.pptx VIP
- 食品卫生总则 2022新版- 中文版 CXC 1-1969.docx VIP
- 《如何降低采购成本》课件.pptx VIP
- 2024版国际货物单次运输合同标准范本3篇.docx VIP
- 金融业薪酬改革预案启动.pdf VIP
- 《进场和出场参观16间交易室》中英对照版.doc VIP
- 《用easylanguage开发交易系统》第01卷中英对照版word.doc VIP
原创力文档

文档评论(0)