一种溢出并行检测低功耗乘加单元的研究.pdfVIP

一种溢出并行检测低功耗乘加单元的研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种溢出并行检测低功耗乘加单元的研究.pdf

中国电子学会电路与系统学会第_卜九届年会论文集 一种溢出并行检测低功耗乘加单元的研究 成学斌1 卢结成‘ 丁丁2 朱少华2 桂万如1 (中国科学技术大学电子科学与技术系 合肥 230026)1 (上海精致科技有限公司 上海 201203)2 摘要:提出了一种溢出并行检测的低功耗饱和乘加单元的新结构。采用这种单元一旦检测到结果溢出,就 立即停止最后一级的串行加法运算过程,采取饱和操作,把结果置成正的屉大值,保证以后无用的计算不要 35u 继续进行下去而消耗不必要的功耗。我们采用0 D部0s工艺实现该低功耗MAC单元,结果表明,尉传统 的MAc单元相比,计算溢出之后不但不用执行专门的饱和溢出指令,提高了砒c单元的运算速度,而且节省 了lo%~20%的功耗。 关键词:溢出检测饱和操作Wallace树乘加单元(MAC)DSP 一、引言 SignalProcessor)的需求提出了 随着对多媒体应用需求的增加,嵌入式设备对DSP(Digital 更高的要求,这些要求除了对传统的处理速度的要求如等待时间(1atency)和吞吐量 (throughput)之外,又对处理器的功耗提出了要求,因此低功耗成为DSP设计又一主要设 计目标。由于数字信号处理中乘加操作的频繁性,MAC(Multiply.AccumulateUnit)单元更是 SCl40t21更是有4个MAC单元。因此在对MAC单元进行设计的同时进行功耗优化是很有必 要的。另一方面,由于定点DSP的低价性和高速性,使得它成为用户的首选。然而,由于定 点DSP本身的缺陷性,使得用户不得不时时关心每次操作的溢出情况,据统计pJ,有三分之 一的时间浪费在对中间结果的溢出检测上。对于定点DSP的溢出,通常有三种措施【4J:采用 更高处理精度的运算单元;对结果进行移位操作;采取饱和操作。在一些数字信号处理和多 媒体应用中,如语音编解码,RGB颜色运算,图象阴影处理中,计算结果溢出之后,通常都 采用专门的饱和指令,进行饱和操作。因此,在一些通用的数字信号处理器和通用的处理器 上,都增加了专门的饱和指令,用于支持对这类运算的饱和操作p】【bJ【7¨…。然而,这些处理器 对于溢出检测和饱和操作的支持,通常都是独立于乘加操作的,因此,当需要饱和操作的时 候,需要在乘加操作的基础上再额外的执行一条特殊的饱和指令。如果溢出,则丢弃前面的 计算结果,再执行饱和操作。这样,实际前面的无用计算消耗的功耗是不必要的。基于以上 考虑,本文研究能并行地进行溢出检测,溢出之后能进行饱和操作的n-bit乘n.bit乘加单元 的低功耗设计。 我们研究两个16bit无符号数相乘、同时能并行地进行溢出检测、溢出之后能自动执行饱和 操作的MAC单元的低功耗设计与实现。为减小该部分的面积,加快运算速度,部分积的产 生采用并行产生的方式,通过用乘数的各位控制的选择器来实现,选择器则用传输门来组成, 这样不但可以加快运算的速度,还可以减小本模块的面积。加法单元则采用Wallance树”IJ 来实现,这样可以减少所需加法单元的级数,加快乘加单元的运算速度。另外就是饱和溢出 的检测,同文献[9]、[10]中的检测机制一样,对饱和溢出的检测是和运算同步进行的。由于 采用了Wallanee结构的加法器,因此最后需要一个串行进位的加法器来获得最后的结果,这 样,这一级单元的延迟是很大的,同样,它消耗的功耗也是很大的,因此,如果能及早地检 测到溢出,并且一旦检测到溢出,就停止本模块的计算,让各个功能单元都保持原有的状态, VⅡ一494 ——!里皇王芏垒皇堕芝墨竺兰叁苎±垄旦堡垒丝茎叁 从而减小整个MAC单元的功耗。这样,我们在Wallance树的各级都增加了一个并行的溢出 检测单元,在最后一级串行进位加法器的前面增加了一个锁存器(Latch),当前面各级一旦 检测到溢出,而且溢出检测允许,它们就会使最后一级的所有单元保持原有的状态,同时把 结果置成正的最大值,这样不但降低功耗,而且还加快了溢出情况下的运算速度。在不允许 溢出检测的情况下,Wallance树的最后结果通过两条旁路,直接进入最后的串行进位加法器 中,产生最后的计算结果,从而保证了MAC单元的单周期性以及

文档评论(0)

开心农场 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档