- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
摘要
随着深度学习领域的不断发展,传统的人工神经网络(artificialneuralnetwork,
ANN)渐渐地无法满足深度学习的性能需求。卷积神经网络(ConvolutionalNeural
Network,CNN)的出现及发展,逐渐与深度学习相融合。对于CNN的计算处理,
传统CPU会耗费较长时间,效率低下;传统GPU虽然能通过增加并行性的方式,
提高运算效率,但同时也会增加功耗,从成本的角度考虑,也不是好的选择;因
此,能够极大加快CNN运算速率、降低功耗、有着更高性能的乘累加器,会是深
度学习领域所需的强有力的帮手。
为此,本文提出了一种支持多数据类型、支持多精度类型、有着高运算效率
的乘累加器结构及其硬件设计。首先对CNN的基本原理以及关键算法进行了理论
分析,并提出对应的硬件实现方法:通过booth乘法器完成乘积运算;通过DW02tree
与gate完成乘积结果的融合与过滤;通过乘法复用理论实现多数据类型的相同硬
件计算,提高硬件利用率。针对传统乘累加器运算效率低,能耗大的问题,提出
了乘累加器阵列结构,能够充分利用硬件资源,实现CNN加速的目的。除此之外,
为了能够提高数据传输效率,本文还设计了数据缓存模块,核心组件为cache,通
过不同的针对性策略,保留有效数据、清除无效数据,实现数据的高效存储。接
着,本文阐述了验证的工作流程,并开发了能够一键生成验证环境的脚本工具,
来提高验证效率。通过该脚本工具生成验证平台,在该验证平台中完成了对本文
所设计的乘累加器的所有子模块的验证工作。
最后,在完成了对本文所设计的乘累加器结构的验证工作后,将传统CPU、
GPU、与本文设计的乘累加器,一起进行了性能仿真与综合,测试结果表明:在
完成相同的运算任务(5次15层卷积神经网络运算)、工作条件相同的前提下,
本文设计的运算效率能够达到GTX1060GPU的2倍之多;相较于传统CPU(例
如i38300),在运算效率近乎相同时,有着将近20倍的工作时钟频率节约。结
合验证结果与实验测试结果可以表明,本文设计的乘累加器的运算性能优异,且
硬件损耗远少于传统运算器件。
关键词:卷积神经网络,乘累加器,数字集成电路,验证方法学,功能验证
ABSTRACT
Withthecontinuousdevelopmentofdeeplearning,thetraditionalArtificialNeural
Network(ANN)graduallyfailstomeettheperformancerequirementsofdeeplearning.
TheemergenceanddevelopmentofConvolutionalNeuralNetworks(CNN)are
graduallyintegratedwithdeeplearning.ForthecalculationofCNN,thetraditional
CPUtakesalongtimeandhaslowefficiency.AlthoughthetraditionalGPUcan
improvethecomputingefficiencybyincreasingtheparallelism,itwillalsoincreasethe
powerconsumption,whichisnotagoodchoicefromtheperspectiveofcost.Therefore,
multiplicatorsthatcangreatlyspeeduptheCNNoperationrate,reducepower
consumption,andhavehigherperformancewillbeapowerfulhelperneededinthefield
ofdeeplearning.
原创力文档


文档评论(0)