图解vs20中CUDA配置.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
图解vs20中CUDA配置

第一种方法 VS2010下配置CUDA 4.0 Posted onHYPERLINK /2011/06/14/vs2010下配置cuda-4-0/06月 14, 2011byHYPERLINK /author/xuanmanstein/xuanmanstein cuda4.0 正式发布了,一直没时间弄。之前一直在vs2008下用cuda wizard。现在实验室配了GTX580,需要把之前在笔记本GT540M上跑的程序再跑一遍,体验下性能的飙升,正好学学把4.0和VS2010配好。 汇总网上几篇帖子,总结一下。只实验win7 x64 下 编release x64的程序。 编译cutil64。默认装好的SDK下没编译cutil64.dll。需要自己编 一下,但是工程都是现成的:C:\ProgramData\NVIDIA Corporation\NVIDIA GPU Computing SDK 4.0\C\common,有2005 2008 2010各种版本的sln 直接找cutil_vs2010.sln,双击编译,注意是release x64版的,如果最后执行程序是还是提示找不到cutil64.dll,注意把它放到个能找到的路径下。 改path变量。 “工具-》选项-》文本编辑器”改扩展名 新建个项目。项目属性-自定义生成,选4.0 改cuda_conv.vcxproj。 找到: ImportGroup Label=”ExtensionSettings” /ImportGroup 替换成: ImportGroup Label=”ExtensionSettings” Import Project=”$(VCTargetsPath)\BuildCustomizations\CUDA 4.0.props” / /ImportGroup 这步很关键,如果不改的话,下一步做不成。 添加.cu的文件,每个.cu的文件上点右键,点属性:在”常规”里把项类型从”不参与生成”改成CUDA C/C++: 特别说明: 如果不做3,在5这步可以看见这个界面,但是没有CUDA C/C++这个选项; 如果做了3但不做4,在5这步看不见这个界面。 配置项目属性里的C++路径 inc lib bin啊,还有linker里的附加依赖项cudart.lib、cutil64.lib,这些和普通的C++程序没区别,就是别忘了多了一个CUDA C/C++,对照自己的显卡,改下计算能力,目标平台什么的。对这些我是喜欢VS2010的风格,写了一个CUDA的属性文件,每次新建工程在属性管理器 里添加进来就行了,省得以前每次都要设一遍。 然后程序就能运行了,visual assert X高亮什么的参考别人的帖子就行了。网上很多人说不成功,估计卡不知道第4 、5步吧。 最后,GTX580确实NB,比GT540M还快了8倍左右,比C++的MKL程序快66倍,已经和别人论文里写的提升倍率差不多了,可能改改程序还能提高吧。 平台 型号 频率 核心数量 每帧图像平均耗时 笔记本CPU I5 480M 2.66GHz 2CPU核 4线程 Matlab 4.5s MKL(C++) 660ms 笔记本GPU GT540M 672MHz 96SP CUDA C 80ms 台式机GPU GTX580 772MHz 512SP CUDA C 10ms 不过,实验室插GTX580的台式机是个DELL的图形工作站,06年的老货,CPU虽然8个核的至强,编译选项也开了”多处理器生成”,但是编译 过程特别慢,明显不如现在笔记本里双核的i5 480M。对比GPU的执行速度差异,CPU的编译速度差距显得很有趣,核多不干活,鸡多不下蛋。 【IT168 专稿】我正在建立一些新的CUDA原型项目,旨在弄清楚如何最好地使用CUDA 4.0,我把它写成一个快速教程,教你如何使用Visual Studio 2010中的CUDA和最新的C++0x特性编写一个简单的应用程序。   因为目前CUDA SDK要求项目使用v90工具集(Visual Studio 2008)编译,解决方案需要两个项目,一个包括CUDA目标v90的DLL项目,一个目标v100(Visual Studio 2010)包含C++代码的项目。   安装依赖   确保你安装了以下依赖软件包   ● Visual Studio 2010和2008 SP1(CUDA需要)   ● Parallel NSight 1.51   ● CUDA 4.0 RC或3.2,以及Thrust   本文引用的例子全部使用的是CUDA 4.0 RC,如果你没有安装CUDA 4.0,它们也可以在3.2环境下工作。

文档评论(0)

aww4466 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档