一种多数据、多精度、高效率的乘累加器设计.pdfVIP

一种多数据、多精度、高效率的乘累加器设计.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

摘要

随着深度学习领域的不断发展,传统的人工神经网络(artificialneuralnetwork,

ANN)渐渐地无法满足深度学习的性能需求。卷积神经网络(ConvolutionalNeural

Network,CNN)的出现及发展,逐渐与深度学习相融合。对于CNN的计算处理,

传统CPU会耗费较长时间,效率低下;传统GPU虽然能通过增加并行性的方式,

提高运算效率,但同时也会增加功耗,从成本的角度考虑,也不是好的选择;因

此,能够极大加快CNN运算速率、降低功耗、有着更高性能的乘累加器,会是深

度学习领域所需的强有力的帮手。

为此,本文提出了一种支持多数据类型、支持多精度类型、有着高运算效率

的乘累加器结构及其硬件设计。首先对CNN的基本原理以及关键算法进行了理论

分析,并提出对应的硬件实现方法:通过booth乘法器完成乘积运算;通过DW02tree

与gate完成乘积结果的融合与过滤;通过乘法复用理论实现多数据类型的相同硬

件计算,提高硬件利用率。针对传统乘累加器运算效率低,能耗大的问题,提出

了乘累加器阵列结构,能够充分利用硬件资源,实现CNN加速的目的。除此之外,

为了能够提高数据传输效率,本文还设计了数据缓存模块,核心组件为cache,通

过不同的针对性策略,保留有效数据、清除无效数据,实现数据的高效存储。接

着,本文阐述了验证的工作流程,并开发了能够一键生成验证环境的脚本工具,

来提高验证效率。通过该脚本工具生成验证平台,在该验证平台中完成了对本文

所设计的乘累加器的所有子模块的验证工作。

最后,在完成了对本文所设计的乘累加器结构的验证工作后,将传统CPU、

GPU、与本文设计的乘累加器,一起进行了性能仿真与综合,测试结果表明:在

完成相同的运算任务(5次15层卷积神经网络运算)、工作条件相同的前提下,

本文设计的运算效率能够达到GTX1060GPU的2倍之多;相较于传统CPU(例

如i38300),在运算效率近乎相同时,有着将近20倍的工作时钟频率节约。结

合验证结果与实验测试结果可以表明,本文设计的乘累加器的运算性能优异,且

硬件损耗远少于传统运算器件。

关键词:卷积神经网络,乘累加器,数字集成电路,验证方法学,功能验证

ABSTRACT

Withthecontinuousdevelopmentofdeeplearning,thetraditionalArtificialNeural

Network(ANN)graduallyfailstomeettheperformancerequirementsofdeeplearning.

TheemergenceanddevelopmentofConvolutionalNeuralNetworks(CNN)are

graduallyintegratedwithdeeplearning.ForthecalculationofCNN,thetraditional

CPUtakesalongtimeandhaslowefficiency.AlthoughthetraditionalGPUcan

improvethecomputingefficiencybyincreasingtheparallelism,itwillalsoincreasethe

powerconsumption,whichisnotagoodchoicefromtheperspectiveofcost.Therefore,

multiplicatorsthatcangreatlyspeeduptheCNNoperationrate,reducepower

consumption,andhavehigherperformancewillbeapowerfulhelperneededinthefield

ofdeeplearning.

文档评论(0)

精品资料 + 关注
实名认证
文档贡献者

温馨提示:本站文档除原创文档外,其余文档均来自于网络转载或网友提供,仅供大家参考学习,版权仍归原作者所有,若有侵权,敬请原作者及时私信给我删除侵权文

1亿VIP精品文档

相关文档