联合量化与剪枝的深度神经网络压缩方法研究.pdf

下载文档

0
0
约7.86万字
约 66页
2024-12-26 发布于广东
举报
版权申诉
保障服务

联合量化与剪枝的深度神经网络压缩方法研究.pdf

1、本文档共66页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

摘要IV

ABSTRACTVI

第一章绪论1

1.1研究背景和意义1

1.2国内外研究现状2

1.3论文主要工作5

1.4论文组织结构6

第二章相关理论介绍8

2.1GPU体系结构8

2.1.1GPU硬件结构8

2.1.2GPU计算组织结构9

2.1.3GPU存储组织结构9

2.2深度神经网络剪枝10

2.2.1连接剪枝11

2.2.2通道剪枝12

2.2.3卷积核剪枝12

2.2.4网络层剪枝13

2.3深度神经网络量化13

2.3.1均匀量化14

2.3.2二次幂量化15

2.3.3二值量化16

2.3.4量化粒度16

第三章面向连接的剪枝加速方法研究18

3.1研究动机18

3.2在GPU上的稀疏卷积计算方法20

3.2.1卷积神经网络推理计算的全过程20

3.2.2ECR存储格式20

3.2.3加载和传输数据21

3.2.4针对卷积的稀疏矩阵向量乘22

3.2.5卷积神经网络向前计算的其他步骤23

3.3融合卷积和池化操作23

3.3.1卷积神经网络向前计算步骤24

3.3.2考虑到卷积和池化的稀疏存储格式24

3.3.3加载和传输数据25

3.3.4卷积和池化26

3.4实验26

3.4.1各种卷积层的加速比27

3.4.2对VGG、ResNet、DenseNet和RegNet的加速28

3.4.3对稀疏性的敏感性分析30

3.4.4对Batch大小的敏感性分析31

3.4.5对步长的敏感性分析31

3.4.6数据格式转换的比重32

3.5本章小结32

第四章联合神经网络结构搜索和混合量化的加速方法33

4.1研究动机33

4.1.1两阶段压缩框架的误差累计33

4.1.2静态剪枝后的单一结构35

4.1.3网络层的不均匀重要性36

4.1.4优化机会37

4.2动态神经网络结构搜索38

4.2.1对网络层剪枝结构的搜索38

4.2.2对通道的动态搜索39

4.2.3神经网络混合量化42

4.2.4基于TensorCore的推理加速43

4.3实验44

4.3.1对模型精度和计算量的分析45

4.3.2对每层网络剪枝比例的分析47

4.3.3混合量化对模型精度影响的分析47

4.3.4对TensorCore推理加速的分析48

4.4本章小结49

第五章总结与展望50

5.1本文工作总结50

5.2工作展望51

摘要

您可能关注的文档

文档评论（0）

论文资源 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

联合量化与剪枝的深度神经网络压缩方法研究.pdf