[工学]CUDA的安装.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]CUDA的安装

CUDA深入浅出学习; 目录;cuda安装及配置; 在HKEY_LOCAL_MACHINE\SOFTWARE Microsoft\Visua lStudio\8.0\Languages\File Extensions\下面添加子键 .cu ,然后copy .cpp的键值到.cu。这样才能表示cu也是VS下的VC的工程文件。 ;在HKEY_CURRENT_USER\Software\Whole Tomato\Visual Assist X\VANet8 在ExtSource键添加键值.cu。 ;*5.打开Visual Assist属性,在projects 的C/C++ Directories custom下面添加CUDA的头文件目录,这样才能在Visual Assist 生成规则的时候找到CUDA自身的特殊定义才能生成Visual Assist的关键字,如__global__.; 目录;cuda的运行模型 ;cuda的内存模型 ;2.基本的一些函数; __syncthreads(); 同步块中的所有线程。一旦所有线程均达到此同步点,执行将正常恢复。 clock_t clock(); 在设备代码中执行时,返回随每一次时钟周期而递增的每个多处理器计数器的值。 ; 目录;用CUDA求随机数的平方和;利用cuda进行计算之前,在主函数中我们加入如下的代码。;在显卡上面写代码,在函式前面加上 __global__ 表示这个函式是要在显示芯片上执行的,代码如下:;最后,在主函数里面把结果复制回内存上; 改进1:把随机的1048576个数分成256组,每组有4096个数,然后利用256个线程,每个线程处理一组数据。 __global__ static void sumOfSquares(int *num, int* result, clock_t* time) {??? const int tid = threadIdx.x;(线程数为256)??? const int size = DATA_SIZE / THREAD_NUM;??? int sum = 0;??? int i;??? clock_t start;??? if(tid == 0) start = clock();??? for(i = tid * size; i (tid + 1) * size; i++) {?????? sum += num[i] * num[i];??? }??? result[tid] = sum;??? if(tid == 0) *time = clock() - start; } 主函数里面改为: ;? int* gpudata, *result;??? clock_t* time;??? cudaMalloc((void**) gpudata, sizeof(int) * DATA_SIZE);??? cudaMalloc((void**) result, sizeof(int) *THREAD_NUM);??? cudaMalloc((void**) time, sizeof(clock_t));??? cudaMemcpy(gpudata, data, sizeof(int) * DATA_SIZE,??? ??? cudaMemcpyHostToDevice);??? sumOfSquares1, THREAD_NUM, 0(gpudata, result, time);??? int sum[THREAD_NUM];??? clock_t time_used;??? cudaMemcpy(sum, result, sizeof(int) * THREAD_NUM, cudaMemcpyDeviceToHost);??? cudaMemcpy(time_used, time, sizeof(clock_t),??? ??? cudaMemcpyDeviceToHost);??? cudaFree(gpudata);??? cudaFree(result);??? cudaFree(time); 在CP

您可能关注的文档

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档