- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
摘要
摘要
深度神经网络由于复杂的网络节点和连接导致模型结构臃肿、存储模型时
Flash容量的压力以及推理时存取对算力巨大开销,在嵌入式系统平台因为性能、存
储器和能耗束缚难以满足实际模型部署和应用。针对低算力、低功耗、低成本的“三
低”嵌入式平台,本文针多层感知机模型、卷积神经网络的网络的权值和激活函数
进行二值化算法硬件化的研究,完成两种二值神经网络加速器的设计,减少矩阵乘法、
二维卷积和批量归一化运算的复杂度以及网络权重的存储资源消耗,加速二值网络推
理速度的同时不仅保持了模型推理的性能,还降低了FPGA推理的能耗。
本文在开源的RISC-V软核处理器上引入了具有加速推理的二值神经网络加速器
的软硬件协同运算的异构平台。首先对多层感知机和卷积神经网络的原理和结构进行
分析,优化了在二值神经网络下的卷积层、批量归一化层、最大池化层的冗余运算的
问题,利用合并运算单元的方法减少了网络层运算之间的内存缓冲级数,使得二值神
经网络加速器更加高效,部署成本更低;其次在MNIST数据集上、自制TTG热成像手
势数据集训练了两种二值神经网络MLP-BNN、CNN-BNN,尤其分析了其中CNN-BNN模
型权重的数字特征,量化了标准差权重为9bit,减少了部分批量归一化层中均值权
重的消耗;然后根据以上可优化的地方,在Verilog仿真中利用并行加速和层次化设
计的思想设计了运算单元、缓冲单元、数据控制单元、权重单元、图像数据单元和最
大值比较单元等Verilog模块,并组成二值神经网络加速器的硬件系统结构,并将作
为协处理器单元挂载到开源的PicoRV32处理器的外设总线上,保证了硬件加速的通
用性;最后将两种加速器结合处理器分别部署在EP4CE10系列,XC7A100T系列的FPGA
硬件平台,在实际环境下验证其二值神经网络推理的性能,如推理速度、推理精度、
FPGA硬件资源消耗以及功耗等指标。
经实验验证可得本文在FPGA内部实现的二值神经网络加速器和RISC-V处理器在
前向推理的过程中,以FPGA平台能跑的最大系统时钟算,MLP-BNN每秒可推理66980
次,CNN-BNN则为9012次;MLP-BNN消耗85%的逻辑单元,CNN-BNN消耗48%的逻辑
单元;两个加速器在FPGA运行的功耗消耗分别是117.36mW和162.00mW;MLP-BNN加
速器的峰值计算能力为14.88GOPS,CNN-BNN加速器则为66.53GOPS。综上所述,本
文提出的二值神经网络加速器在能耗、FPGA内部资源使用率以及推理速度上优于现
有的FPGA加速方法。
关键词:深度神经网络;二值神经网络;FPGA;RISC-V;软硬件协同
I
Abstract
Abstract
Duetothecomplexnetworknodesandconnections,deepneuralnetworks
havebloatedmodelstructures,whichputspressureonFlashcapacitywhen
storingmodels,andrequiressignificantcomputationalpowerforinference.
Theseconstraintsmakeitdifficulttomeetthepracticalrequirementsof
modeldeploymentandapplicationonembeddedsystemplatformsdueto
performance,memory,andenergyconstraints.Toaddresstheneedsoflow-
power,low-computational,
您可能关注的文档
- 环境知识、环境价值观与小农户自觉生态生产行为研究.pdf
- 灰毡毛忍冬绿原酸生物合成关键基因LmMYB111的筛选及功能分析.pdf
- 饥饿胁迫对中国大鲵肠道生理生化及微生物的影响.pdf
- 机器故障扰动的柔性作业车间动态调度问题研究.pdf
- 基于“双减”背景下学分银行应用于课后体育延时服务的可行性研究.pdf
- 基于ARCS模型的小学高年级英语词汇游戏化教学研究.pdf
- 基于ARIMA-SVR模型优化的山东省玉米产量预测研究.pdf
- 基于BOPPPS教学模式在化学教学中的应用研究--以《化学反应与电能》为例.pdf
- 基于DFF-SHEKF的电动汽车电池组SOC预估研究.pdf
- 基于HPS理念的高中化学教学探析--以人教版必修二为例.pdf
最近下载
- n1级护士培训课件.pptx VIP
- “表外储层”挖潜研究与实践.doc VIP
- 2025年城市运行热线中心招聘面试题库附答案.doc VIP
- ISO 4892-3-2016 塑料 - 暴露在实验室光源下的方法 - 第3部分:荧光紫外线灯(中文版).pdf
- 智慧园区控制与管理--ICC平台课件与实验手册 5.1、智慧校园综合管理平台-DH-ICC-U8000-PRO.pdf VIP
- 2024-2025学年北京丰台区七年级初一(上)期末数学试卷(含答案).pdf
- 工程欠款欠条.doc VIP
- 2026年指挥中心面试题及答案.doc VIP
- 病理医生自我鉴定(精选6).docx VIP
- 连云港产业结构的动态演进与优化策略研究.docx
原创力文档


文档评论(0)