基于卷积神经网络的压缩与硬件加速方法研究.pdfVIP

下载本文档

23
0
约7.75万字
约 58页
2020-09-09 发布于江苏
举报
版权申诉

基于卷积神经网络的压缩与硬件加速方法研究.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

重庆大学硕士学位论文中文摘要摘要卷积神经网络（Convolution Neural Network, CNN ）在图像、语音、人脸识别等领域发展迅速，尤其在图像领域表现出色。现实中对传统算法的应用往往依托于体积小、功耗低的嵌入式平台，卷积神经网络的特点是参数庞大、网络模型复杂、卷积运算耗时过多，这使得卷积神经网络不易在嵌入式端流畅运行。本文针对卷积神经网络参数庞大、网络模型复杂的特点，提出网络裁剪和权值量化，对卷积神经网络进行压缩，同时针对卷积神经网络卷积运算耗时过多的特点，使用现场可编程门阵列(FPGA)对卷积过程进行加速。本文研究的卷积神经网络模型为Tiny-yolo ，首先，分析Tiny-yolo 网络连接关系，对权值较小的连接进行裁剪，减少权值数量，实现对网络的压缩；裁剪后的权值矩阵采用稀疏化存储方式，减少网络模型对内存的占用；对稀疏网络进行重训练，达到压缩目的的同时，保证网络在裁剪前后识别精度不会出现大幅下降；其次，对权值进行量化，本文将Tiny-yolo 原有数据类型进行量化，在保证精度误差范围内，进一步减小模型内存占用量和运算复杂度；最后，根据Tiny-yolo 网络结构特点提出了深度并行-流水的FPGA 加速优化方案，对数据缓存，以及卷积运算进行加速，最终实现Tiny-yolo 网络在嵌入式端流畅运行。通过实验验证，网络裁剪在保证网络识别精度的前提下，参数数量减少9 成，网络模型占用内存由63.5MB 变为4.55MB 。量化实现4 倍左右的压缩比率，网络精度有所损失，mAP 下降2 个百分点，但对最终检测结果影响不大。硬件加速优化，相比在最大频率为667MHZ 的ARM Cortex-A9 上运算实现了7 倍左右的运算加速。关键词：神经网络，压缩，硬件加速，FPGA I 重庆大学硕士学位论文英文摘要 ABSTRACT Convolution Neural Network (CNN) has developed rapidly in the fields of image, speech and face recognition, especially in the field of image. In reality, the application of traditional algorithms often relies on embedded platforms with small size and low power consumption. Convolutional neural networks are characterized by huge parameters, complex network models and large amount of computation. These characteristics make it difficult for convolutional neural networks to run fast in embedded end. In view of the huge parameters and complex network model of convolutional neural network, this paper proposes network tailoring and weight quantization to compress the network. At the same time, in vi