Matlab使用GPU并行加速方法.docx

下载文档

17
0
约1.36千字
约 7页
2017-02-05 发布于重庆
举报
版权申诉
保障服务

Matlab使用GPU并行加速方法.docx

1、本文档共7页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

Matlab使用GPU并行加速方法

Matlab使用GPU并行加速方法GPU具有十分强大的数值计算能力，它使用大规模并行方式进行加速。Matlab是十分重要的数学语言，矩阵计算十分方便。但是Matlab是解释型语言，执行相对较慢。我们可以使用GPU对Matlab进行加速。Matlab调用GPU加速方法很多，主要有：1 在GPU上执行重载的MATLAB函数1.1最简单的编程模式对GPU上已加载数据的Matlab函数直接调用。Matlab已经重载了很多GPU标准函数。优点①用户可以决定何时在Matlab工作区和GPU之间移动数据或创建存储在GPU内存中的数据，以尽可能减少主机与设备间数据传输的开销。②用户可在同一函数调用中将在GPU上加载的数据和Matlab工作区中的数据混合，以实现最优的灵活性与易用性。③这种方法提供了一个简单的接口，让用户可以在GPU上直接执行标准函数，从而获得性能提升，而无需花费任何时间开发专门的代码。缺点①在这种情况下，用户不得对函数进行任何更改，只能指定何时从GPU内存移动和检索数据，这两种操作分别通过gpuArray和gather命令来完成。1.2在Matlab中定义GPU内核用户可以定义Matlab函数，执行对GPU上的数据的标量算术运算。使用这种方法，用户可以扩展和自定义在GPU上执行的函数集，以构建复杂应用程序并实现性能加速。这种方式需要进行的内核调用和数据传输比上述方法少。优点①这种编程模式允许用算术方法定义要在GPU上执行的复杂内核，只需使用Matlab语言即可。②使用这种方法，可在GPU上执行复杂的算术运算，充分利用数据并行化并最小化与内核调用和数据传输有关的开销。缺点①在这种情况下，用户不得对函数进行任何更改，只能指定何时从GPU内存移动和检索数据以及使用arrayfun命令调用函数。函数会在GPU矢量的各个元素上执行，充分利用数据并行化。1.3直接从Matlab调用CUDA代码为了进一步扩展在GPU上执行的集合函数，可以从CUDA代码中创建一个Matlab可调用的GPU内核。第三种编程模式可以让用户轻松地从Matlab直接调用已有CUDA代码，使非CUDA专家同样能够进行代码重用。优点①这种编程模式提供了直接从Matlab进行CUDA代码测试的整体解决方案，无需使用GPU在环配置进行基于文件的数据交换。②用户还可以直接从Matlab控制有关线程块大小和共享内存的参数。缺点①用户需要会CUDA编码。2、Matlab与CUDA C混合编程用Matlab与C/C++混合编程，采用动态链接库的方式产生可以供Matlab调用的.dll文件。该方法使用CUDA C/C++语言编写在GPU上执行的代码，将之编译成.dll文件，然后使用C/C++语言编写mexFunction函数，在函数中加载使用CUDA的.dll文件，使用Matlab或者VC++编译mexFunction为另一个.dll文件。最后在Matlab中调用含有mexFunction的.dll文件，执行GPU加速。优点十分灵活，可以将CUDA C/C++与Matlab相互调用，最大化计算性能。缺点编码要求较高，需要会CUDA C/C++语言及Matlab语言，还要会DLL编程及调用等。（混合编程代码请去/s/1c08OMnI下载）