- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]CUDA的安装
CUDA深入浅出学习; 目录;cuda安装及配置;
在HKEY_LOCAL_MACHINE\SOFTWARE Microsoft\Visua lStudio\8.0\Languages\File Extensions\下面添加子键 .cu ,然后copy .cpp的键值到.cu。这样才能表示cu也是VS下的VC的工程文件。
;在HKEY_CURRENT_USER\Software\Whole Tomato\Visual Assist X\VANet8 在ExtSource键添加键值.cu。;*5.打开Visual Assist属性,在projects 的C/C++ Directories custom下面添加CUDA的头文件目录,这样才能在Visual Assist 生成规则的时候找到CUDA自身的特殊定义才能生成Visual Assist的关键字,如__global__.; 目录;cuda的运行模型
;cuda的内存模型
;2.基本的一些函数;
__syncthreads();
同步块中的所有线程。一旦所有线程均达到此同步点,执行将正常恢复。
clock_t clock();
在设备代码中执行时,返回随每一次时钟周期而递增的每个多处理器计数器的值。
; 目录;用CUDA求随机数的平方和;利用cuda进行计算之前,在主函数中我们加入如下的代码。;在显卡上面写代码,在函式前面加上 __global__ 表示这个函式是要在显示芯片上执行的,代码如下:;最后,在主函数里面把结果复制回内存上;改进1:把随机的1048576个数分成256组,每组有4096个数,然后利用256个线程,每个线程处理一组数据。__global__ static void sumOfSquares(int *num, int* result, clock_t* time) {??? const int tid = threadIdx.x;(线程数为256)??? const int size = DATA_SIZE / THREAD_NUM;??? int sum = 0;??? int i;??? clock_t start;??? if(tid == 0) start = clock();??? for(i = tid * size; i (tid + 1) * size; i++) {?????? sum += num[i] * num[i];??? }??? result[tid] = sum;??? if(tid == 0) *time = clock() - start; }主函数里面改为:;? int* gpudata, *result;??? clock_t* time;??? cudaMalloc((void**) gpudata, sizeof(int) * DATA_SIZE);??? cudaMalloc((void**) result, sizeof(int) *THREAD_NUM);??? cudaMalloc((void**) time, sizeof(clock_t));??? cudaMemcpy(gpudata, data, sizeof(int) * DATA_SIZE,??? ??? cudaMemcpyHostToDevice);??? sumOfSquares1, THREAD_NUM, 0(gpudata, result, time);??? int sum[THREAD_NUM];??? clock_t time_used;??? cudaMemcpy(sum, result, sizeof(int) * THREAD_NUM, cudaMemcpyDeviceToHost);??? cudaMemcpy(time_used, time, sizeof(clock_t),??? ??? cudaMemcpyDeviceToHost);??? cudaFree(gpudata);??? cudaFree(result);??? cudaFree(time);在CP
您可能关注的文档
- [工学]CA6140车床主轴机械加工工艺的设计.doc
- [工学]AS-T-T044 A5 SRS系统.ppt
- [工学]CAD2007.ppt
- [工学]cad2008课件 第3章.ppt
- [工学]CAD2010教程6.ppt
- [工学]cad实用教程第1章.ppt
- [工学]CAD2009课件1.ppt
- [工学]CAD快捷键及注意事项.doc
- [工学]CAD讲义.ppt
- [工学]CAD中文版系列综合培训教程PPT格式01.ppt
- 专题06 经济体制(我国的社会主义市场经济体制)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题11 世界多极化与经济全球化-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 专题03 经济发展与社会进步-5年(2020-2024)高考1年模拟政治真题分类汇编(浙江专用)(解析版).docx
- 专题09 文化传承与文化创新-5年(2020-2024)高考1年模拟政治真题分类汇编(北京专用)(原卷版).docx
- 5年(2020-2024)高考政治真题分类汇编专题08 社会进步(我国的个人收入分配与社会保障)(原卷版).docx
- 专题07 探索世界与把握规律-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 5年(2020-2024)高考政治真题分类汇编专题06 经济体制(我国的社会主义市场经济体制)(原卷版).docx
- 专题11 全面依法治国(治国理政的基本方式、法治中国建设、全面推进依法治国的基本要求)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题17 区域联系与区域协调发展-【好题汇编】十年(2015-2024)高考地理真题分类汇编(解析版).docx
- 专题01 中国特色社会主义-5年(2020-2024)高考1年模拟政治真题分类汇编(原卷版).docx
文档评论(0)