- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于CUDA的高速FFT计算.pdf
第 28 卷第 4 期 计 算 机 应 用 研 究 Vol. 28 No. 4
2011 年 4 月 Application Research of Computers Apr. 2011
*
基于 CUDA 的高速 FFT 计算
, , ,
赵丽丽 张盛兵 张 萌 姚 涛
( , 7 10072)
西北工业大学 计算机学院 西安
: FFT , CUDA
摘 要 针对快速傅里叶算法 在 图形 图像处理和科学计算领域 的重要作 用 提 出了一种基 于 的高速
FFT , GPU FFT ,
计算方法 在分析 硬件平 台执行模式及 算法并行性特征的基础上 采 用多线程并行的映射方法实
, 。 , FFT CUFFT
现算法 并从存储层次优化算 法 实验结果表 明 了该算法的高效性 且优化后 的 加速 比能达到 库加
速 比的 2 ~ 6 倍 。
关键词: 图形处理器; 统一计算架构; 映射策略; 存储层次
中图分类号: TP312 文献标志码: A 文章编号: 1001-3695 ( 2011) 04-1556-04
doi: 10 . 3969 /j . issn. 1001-3695. 2011. 04 . 100
High performance FFT computation based on CUDA
ZHAO Li-li ,ZHANG Sheng-bing ,ZHANG Meng ,YAO Tao
( School of Comp uter Science & Technology ,Northwestern Polytechnical University ,Xi ’an 7 10072 ,China)
Abstract : The Fourier transform is essential for many image processing and scientific computing techniques. This paper presen-
ted an implementation to accelerate FFT computation based on CUDA. Based on the analysis of the GPU architecture and algo-
rithm parallelism feature ,brought a mapping strategy used multithread ,and explored the optimization in memory hierarchy. The
results on CUDA show an improveme
文档评论(0)