基于CPU和GPU混合运算短波二维宽带测向实现.docVIP

下载本文档

0
0
约2.94千字
约 7页
2018-08-27 发布于福建
举报
版权申诉

基于CPU和GPU混合运算短波二维宽带测向实现.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于CPU和GPU混合运算短波二维宽带测向实现

基于CPU和GPU混合运算短波二维宽带测向实现　　摘要：通过CPU和GPU的混合计算结构搭建的信号和数据处理系统，搭配数据采集卡或高速光传输网络，实现了短波宽带测向的实时处理。该方法的处理速度相较于MATLAB和CPU平台可以提高1～2个数量级，相较于同等处理速度的多DSP平台则体现了开发周期短、费用低、工作量小和可靠性高等众多优势。　　关键词：GPU 短波宽带测向　　中图分类号：TN97 文献标识码：A 文章编号：1672-3791（2016）06（c）-0014-02 　　在阵列信号处理中，通常采用多个DSP核并行运算、多个FPGA阵列或者DSP+FPGA的处理架构，完成针对多路宽带数据的运算处理。以20圆阵的短波宽带测向为例，当信号带宽变大时，常规的自研高速信号实时处理平台往往因为架构复杂，开发周期长，可扩展性较差，导致产品研发过程大部分都花费在硬件调试和维护上，不利于产品的更新换代。　　1 宽带测向的GPU实现方案设计　　自从2006年NVIDIA公司推出GPU的通用编程模型CUDA以来，基于CUDA架构的通用并行运算系统已开始广泛应用在国防工业各个领域。CUDA简化了GPU的开发流程，运用C语言即可进行GPU的通用计算编程。因此，该文在进行方案设计之前，将基于CUDA进行快速宽带测向算法的实现，先与同样具有很强并行计算能力的FPGA对比，分析基于GPU进行快速宽带测向的可行性和优势。　　1.1 GPU完成快速宽带测向的可行性　　使用FPGA和GPU对各种算法进行加速是比较合适的选择，但二者的应用方式还有一定差异。　　首先，GPU使用C语言进行开发，FPGA使用VHDL和Verilog等描述性语言开发，对软件开发人员来说，FPGA开发起点偏高，需要了解硬件电路知识，更重要的是高速信号处理的FPGA设计需要调试硬件平台，而且比较容易出现时序问题，会加大开发难度，恰恰相反，这些都是GPU的优势所在，不需要学习新的编程语言，不需要维护硬件平台，没有时序设计困扰。　　其次，从成本和功耗方面分析，在同等处理能力的情况下，GPU显卡由于大量商用的原因，价格相对较低，同时，计算资源较多的高端FPGA较难购买，价格偏高，还涉及到硬件制版费用，时间成本和人力成本也需考虑。在同等处理能力的情况下，FPGA的功耗属于动态功耗，使用资源越多功耗越大，不过，一般要低于GPU。　　综上所述，在开发难度、体积和成本等方面GPU有一定的优势，FPGA在功耗方面有一定的节省，不过，要是应用多片FPGA芯片进行组合运算时，还要考虑综合功耗。　　1.2 基于GPU的并行测向算法　　由于时间分辨率和频率分辨率是倒数关系，时间分辨率越小，测向速度越快，同时频率分辨率就会越粗，测向准确度就会下降。在基于二维宽带测向算法中，减小FFT计算数据，可以加快测向速度，但要以牺牲频率分辨率为代价。为了获得高精度的快速测向性能，一般考虑在高采样率下进行宽带二维测向，如此一来，大数据量的FFT运算和二维谱峰搜索将耗费大量时间。由于各通道、各频点测向运算的相对独立性，可以使用GPU进行并行运算，加速FFT运算过程，在不降低频率分辨率的情况下减少测向时间。　　CUDA提供了一个CUFFT运算库，可以高效地并行完成多个一维FFT运算，最多可以实现800万点的FFT运算。文中测向阵元数为20阵元，宽带条件下基带IQ数据的采样频率为9.830 4 MHz，测向带宽8 MHz。为了兼顾测向速度和测向灵敏度要求，单通道FFT点数为8 192点，带内测向点数为6 666点，此时频率分辨率约为1.2 kHz，时间分辨率为0.8 ms。测向流程如图1所示。　　瞬时测向带宽为8 MHz，先采集20通道单帧数据0.8 ms进行FFT运算，选取信噪比超过门限的信号进行测向，极端情况下，考虑6 666个频点全部测向。　　先完成20通道的FFT运算，每路FFT的采样点数为8 192点，一次并行运算的FFT点数是16 3840，小于800万，满足CUFFT库的使用要求。　　具体捕获流程如下。　　（1）申请3个显存块，显存块1用于接收内存块1中的基带采样数据，使用不同频点的载波信号，分别对20个通道的基带数据进行FFT运算。将20个通道的采样数据，按频点数顺序存储在1块内存里。　　（2）显存2用于接收内存块2中的校正库和理论库数据，显存3用于存储运算结果。　　（3）在显存3中开展二维谱峰搜索，快速完成角度遍历运算，给出所有待测频点的方位角、仰角信息，同时结果仍保留在显存3。　　（4）将运算结果拷贝到主机内存，释放GPU的运算资源。　　2 测向方案的试验验证　　2.1 试验条件　　（1）硬件环境：CPU是Inte