- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种带溢出控制的高性能FFT处理器的实现.pdf
褚超等:一种带溢出控制的高性能F玎处理器的实现
一种带溢出控制的高性能FFT处理器的实现①
褚超②一。 付博~。 谢应科。 韩承德。
(。中国科学院计算技术研究所北京100080)
(“中国科学院研究生院北京100039)
摘要 提出一种带自适应溢出控制的高性能定点H叩处理器的设计方法。这种方法在
CORDIC算法基础上,通过优化数据存储结构和旋转因子生成方式,实现每个周期完成一
个基4蝶形运算。同时提,L8一种高效的溢出控制实现方法,在不中断处理器流水工作的
FP.
情况下,根据蝶形运算结果,动态地实现定点肿的溢出控制。在Xilinx公司XCV2P30
GA芯片上实现了整个n叩处理器,系统时钟频率达到130MHz,对于1024点16位复数F玎
运算需要9.85p.s,对16384点FFr运算需要220.56玲,优于目前大多数已有的FFr处理器。
关键词FFT处理器,CORDIC算法,溢出控制,地址生成器
0 引言
n=0
离散傅立叶变换(DFll)是描述离散信号时域和
频域关系的基本数学工具。DVB.T和DAB等新应
Ⅳ个点的DFT需要D(Ⅳ2)次复数乘法和复数加法
用的出现,对DFT的实时性要求越来越高,而目前 运算,运算量巨大,因此快速算法就显得尤为重要。
常用的快速傅立叶变换(FFr)模块完成1024点、16
位字长定点、块浮点或浮点运算需要几十甚至上百 速计算方法是DFT计算的里程碑,该算法具有同址
微秒的时间…1,很难满足实时系统的要求,如何设计 运算的特性,易于硬件实现,绝大多数的DFT专用
一种高性能的FFr处理器成为实时系统设计的一个 处理器都基于这种算法【4l。
关键问题。 常见FFr算法有基2、基4和分裂基三种。基2
提高F耵处理器性能的常用设计方法是增加运 算法的蝶形运算部件结构简单,但是蝶形运算次数
算流水级和提高功能部件并行度【2,3l。随着运算部 较多,乘法运算量也较大;基4算法的蝶形运算部件
件高度并行,数据访问速度已成为系统瓶颈,提高数 比较复杂,数据访问次数比较少,总的计算量也较
据访问的并行性成为一个关键问题。本文在 少;分裂基算法结合了基2和基4算法的特点,但其
CORDIC算法的基础上提出了一种带溢出控制的定
L型蝶形运算部件在硬件实现上比较复杂。本文从
点FFr处理器的设计方法,采用同址运算,并通过优 算法复杂性和硬件实现难易度考虑,采用基4频域
化数据存储结构和旋转因子生成方法,提高了处理 抽取算法。当样本点N=47时,对于式(1)可按如
器的数据吞吐能力,每周期可以完成一个蝶形运算, 下方式进行频域抽取:
使得数据并行性最大化。同时针对F耵处理器的溢 Ⅳ/4—1 肭一l
出问题采用一种限幅控制方法,根据蝶形运算的结 x(后):∑戈(n)噼+∑菇(n)嚼+
n=0 n=N/4
果,使用较少的硬件代价动态完成对FFr处理器的 3N/4-l Ⅳ一t
(2)
溢出控制,不破坏运算部件流水效率。 ∑算(n)嚼+∑聋(n)嚼
^
文档评论(0)