Matlab使用GPU并行加速方法.docx

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Matlab使用GPU并行加速方法

Matlab使用GPU并行加速方法GPU具有十分强大的数值计算能力,它使用大规模并行方式进行加速。Matlab是十分重要的数学语言,矩阵计算十分方便。但是Matlab是解释型语言,执行相对较慢。我们可以使用GPU对Matlab进行加速。Matlab调用GPU加速方法很多,主要有:1 在GPU上执行重载的MATLAB函数1.1最简单的编程模式对GPU上已加载数据的Matlab函数直接调用。Matlab已经重载了很多GPU标准函数。优点①用户可以决定何时在Matlab工作区和GPU之间移动数据或创建存储在GPU内存中的数据,以尽可能减少主机与设备间数据传输的开销。②用户可在同一函数调用中将在GPU上加载的数据和Matlab工作区中的数据混合,以实现最优的灵活性与易用性。③这种方法提供了一个简单的接口,让用户可以在GPU上直接执行标准函数,从而获得性能提升,而无需花费任何时间开发专门的代码。缺点①在这种情况下,用户不得对函数进行任何更改,只能指定何时从GPU内存移动和检索数据,这两种操作分别通过gpuArray和gather命令来完成。1.2在Matlab中定义GPU内核用户可以定义Matlab函数,执行对GPU上的数据的标量算术运算。使用这种方法,用户可以扩展和自定义在GPU上执行的函数集,以构建复杂应用程序并实现性能加速。这种方式需要进行的内核调用和数据传输比上述方法少。优点①这种编程模式允许用算术方法定义要在GPU上执行的复杂内核,只需使用Matlab语言即可。②使用这种方法,可在GPU上执行复杂的算术运算,充分利用数据并行化并最小化与内核调用和数据传输有关的开销。缺点①在这种情况下,用户不得对函数进行任何更改,只能指定何时从GPU内存移动和检索数据以及使用arrayfun命令调用函数。函数会在GPU矢量的各个元素上执行,充分利用数据并行化。1.3直接从Matlab调用CUDA代码为了进一步扩展在GPU上执行的集合函数,可以从CUDA代码中创建一个Matlab可调用的GPU内核。第三种编程模式可以让用户轻松地从Matlab直接调用已有CUDA代码,使非CUDA专家同样能够进行代码重用。优点①这种编程模式提供了直接从Matlab进行CUDA代码测试的整体解决方案,无需使用GPU在环配置进行基于文件的数据交换。②用户还可以直接从Matlab控制有关线程块大小和共享内存的参数。缺点①用户需要会CUDA编码。2、Matlab与CUDA C混合编程用Matlab与C/C++混合编程,采用动态链接库的方式产生可以供Matlab调用的.dll文件。该方法使用CUDA C/C++语言编写在GPU上执行的代码,将之编译成.dll文件,然后使用C/C++语言编写mexFunction函数,在函数中加载使用CUDA的.dll文件,使用Matlab或者VC++编译mexFunction为另一个.dll文件。最后在Matlab中调用含有mexFunction的.dll文件,执行GPU加速。优点十分灵活,可以将CUDA C/C++与Matlab相互调用,最大化计算性能。缺点编码要求较高,需要会CUDA C/C++语言及Matlab语言,还要会DLL编程及调用等。(混合编程代码请去/s/1c08OMnI下载)

文档评论(0)

yaobanwd + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档