基于深度压缩的卷积神经网络压缩算法研究.pdfVIP

基于深度压缩的卷积神经网络压缩算法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要 摘要 深度学习近年来一直是人工智能领域的热门研究课题,卷积神经网络(Convolutional Neural Network ,CNN )作为深度学习的经典学习模型,在图像分类、目标检测、自然语 言处理等领域均取得了一系列重要突破。卷积神经网络模型具有参数量大,计算复杂度 高的特点,正是这种复杂的多层次网络结构使得模型具有很强的预测能力。 由于智能设备的普及,卷积神经网络移植到嵌入式设备上的需求日益增长,但是其 巨大的参数冗余以及计算成本限制了它在嵌入式设备尤其是移动设备上的部署,于是众 多的神经网络压缩算法应运而生,其中“深度压缩”算法以其突出的压缩性能被广泛应 用于大型神经网络的压缩。本文基于卷积神经网络压缩算法进行深入研究,并针对“深 度压缩”算法做出了一些改进,主要内容如下: (1)本文提出了基于“深度压缩”算法的动态剪枝和动态量化算法。“深度压缩” 算法对大型卷积神经网络的压缩具有令人瞩目的压缩效果,但是该算法在剪枝以及量化 过程中忽略了各层权重的不同数量级以及对输出的贡献度,针对此问题本文提出了动态 剪枝和动态量化算法,对不同权重数量级的层进行分类,并分别设置阈值和聚类数目, 在设置阈值时将简单的指定一个值改为按比例设定阈值,实验结果表明压缩效果要优于 传统的深度压缩算法。 (2 )本文提出了一种用于压缩复数卷积神经网络的改进的“深度压缩”算法。目 前许多研究工作都关注于实数卷积神经网络(Real Convolution Neural Network,Real CNN ) 的压缩,据我们所知,目前复数卷积神经网络(Complex Convolution Neural Network,Complex CNN )的压缩算法还没有论文涉及。与实数神经网络相比,复数神经网络更容易优化, 有更好的泛化能力和学习能力,并且对噪声更加鲁棒。本文将“深度压缩”算法从实数 域扩展到了复数域,提出了一种用于压缩复数卷积神经网络的改进的深度压缩算法。由 于复数卷积神经网络的权重是复数形式,考虑到其虚数部分和实数部分的相关性,我们 在剪枝、量化和哈夫曼编码过程中做出了以下改进:1)剪枝阶段:使用复数的模与阈 值进行比较;2 )量化阶段:使用二维K 均值聚类算法对复数权重进行聚类,聚类中心 即为共享权重;3 )哈夫曼编码:由于复数权重的虚数部分与实数部分的相关性不影响 哈夫曼编码的结果,将权重的实数部分与虚数部分分别进行编码。本文提出的压缩算法 可以将适合于CIFAR-10 数据集的卷积神经网络的参数量压缩8 倍,在没有重新训练的 情况下准确率损失在 3% 以内;将适合于IMAGENET 数据集的卷积神经网络的参数量 压缩16 倍,在没有重新训练的情况下准确率损失在2% 以内。 关键词:深度学习,复数卷积神经网络,压缩,深度压缩 I Abstract Abstract In recent years, deep learning has been a hot topic in the field of artificial intelligence. As a classical learning model of deep learning, convolutional neural network (CNN ) has achieved a series of excellent results in image classification, target detection, natural language processing and other fields. Convolutional neural network model has the characteristics of large number of parameters and high

文档评论(0)

136****6583 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档