基于cpl逻辑的高速3232-b定浮点并行乘法器的设计.docxVIP

基于cpl逻辑的高速3232-b定浮点并行乘法器的设计.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于cpl逻辑的高速3232-b定浮点并行乘法器的设计 高速乘法器是大多数数字处理器(pd)系统的一个重要计算单元,需要卷积和滤波。一方面,乘法器往往处于关键延时路径中,它决定了DSP算法的性能。目前,DSP芯片的指令周期仍取决于完成一次乘法运算的时间。另一方面,随着具有多媒体功能的便携设备的出现,要求DSP系统在保持高速运算同时,具有较低的功耗,才能保持设备的长时间可靠运转。因此,低功耗高速运算单元尤其是乘法器的设计是DSP系统设计中的关键。 为了提高乘法运算的速度,人们提出了很多高效的实现算法和结构。通过研究不同的实现算法,结果表明在16-b到32-b间的乘法运算中,改进的BOOTH编码算法同Dadda等算法相比,在低功耗的同时仍能保持高速的特性。 本文采用了一种改进的BOOTH编码算法实现了32×32-b位的定/浮点并行乘法器的结构,并通过几种不同电路逻辑风格设计方案在延时、功耗及面积3方面的比较分析,选择了CPL逻辑实现乘法器的设计。本设计由0.45μm的CMOS工艺实现,工作电压为3.3V。 1 booth编码大乘法器的设计 1.1 构造模型的建立 高速乘法器的一种实现方案就是提高并行计算量,减少后续计算量。BOOTH编码算法是广泛采用的一种算法,它能使部分积减少一半。详细的BOOTH编码算法见文献。 乘法运算可分为3步来实现: (1)产生部分积; (2)加法阵列累加部分积(压缩器); (3)利用先行进位等加法器得到最终结果。 图1为本文设计的乘法器结构框图。 由图1可见,BOOTH编码乘法器主要由3部分组成: (1)乘法阵列,主要包括部分积产生器、压缩器以及全加器、半加器; (2)BOOTH编码器和符号扩展; (3)2n位加法器,本文采用的是一种进位选择加法器和先行进位加法器的混合结构。 为了增加并行计算,减小延时,这里采用了一种符号延伸的方法来代替以往的符号传递方法,其基本思想是在每一个部分积中增加两个额外的符号位,定义为PPn+1和PPn+2(PPn为部分积的符号位)。它能使乘法阵列矩形化,易于VLSI的实现。此外,还需要定义一个前一部分积的符号状态标志F,它可由下式推得: 在这里,PPn,j为第j个部分积的符号位,Fj+1为第j个部分积的符号状态位。 设计完乘法器的结构后,首先用硬件描述语言Verilog描述,编写测试向量进行功能仿真,验证结构是否可行。仿真结果表明,本文所设计的BOOTH编码乘法器结构功能正确。 1.2 boo编码方案 乘法器的规模主要由BOOTH编码单元和压缩器单元决定。BOOTH编码单元所需MOS管的个数对整个乘法器的面积影响很大,这里采用了一种改进的编码方案。同以前的设计相比,新的编码器更易于VLSI实现,所需要的面积和延时都很小。BOOTH编码的门级电路的实现,如图2所示。考虑两个N位的乘法运算,乘数和被乘数分别用Xi和Yi来表示,表1为BOOTH编码算法的真值表。 表1中,Neg、Z、B1、B2是由3位相邻的乘数编码所得,Func为部分积。 1.3 hspity在乘法器设计中的应用 实现高速算术单元的低功耗设计,可以从体系结构、电路和版图3个不同的阶段进行优化设计。在电路级的设计中,常常基于延时和功耗两方面的考虑,来选择适当的逻辑电路(CPL、DPL、通用的CMOS及TG、TG-CPL等)。电路中很多重要的性能参数,例如功耗、开关电容、短路电容都与电路的逻辑风格密切相关。因此选择适当的电路逻辑是乘法器设计中至关重要的一步,它决定了乘法器的效率。在设计过过程中,利用HSPICE工具对各单元的不同逻辑实现进行仿真比较,选择最佳的设计。 本文以乘法器中非常关键的4:2压缩器的设计为例,对不同的逻辑风格下的电路性能进行了比较。压缩器为加法器树形结构中的主要单元,图3为4:2压缩器的原理图,它有5个输入,3个输出。每一个压缩器由两个全加器构成,可以把4个部分积压缩为两个部分积。表2为压缩器的参数和HSPICE的仿真结果。其中,延时是关键路径的传输延时,而功耗则是测量在不同输入向量下的平均值。 1.46 加法器结构特点 由于累加后的部分积到达加法器的延时路径是不同的,为了减小延时,更快的得到乘积结果,这里设计了一种高速64位二进制加法器。根据各部分积累加后到达加法器的时间,采用了一种选择进位加法器(CSA)和先行进位加法器(CLA)相结合的混合结构。在这里利用HSPICE工具对各个延时路径进行比较,根据实际的延时把64位加数分成几个不同长度的部分,分别送到先行进位加法器和选择进位加法器中相加,从而得到最小延时。 2 验证性测试系统设计 乘法器采用0.45μm双层金属的CMOS工艺实现,图4为Cadence Virtuoso下乘法器的版图,整个乘法器的规模为晶体管41 000管。版图的左边是输

文档评论(0)

xlwkyc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档