- 1、本文档共66页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
目录
摘要IV
ABSTRACTVI
第一章绪论1
1.1研究背景和意义1
1.2国内外研究现状2
1.3论文主要工作5
1.4论文组织结构6
第二章相关理论介绍8
2.1GPU体系结构8
2.1.1GPU硬件结构8
2.1.2GPU计算组织结构9
2.1.3GPU存储组织结构9
2.2深度神经网络剪枝10
2.2.1连接剪枝11
2.2.2通道剪枝12
2.2.3卷积核剪枝12
2.2.4网络层剪枝13
2.3深度神经网络量化13
2.3.1均匀量化14
2.3.2二次幂量化15
2.3.3二值量化16
2.3.4量化粒度16
第三章面向连接的剪枝加速方法研究18
3.1研究动机18
3.2在GPU上的稀疏卷积计算方法20
3.2.1卷积神经网络推理计算的全过程20
3.2.2ECR存储格式20
3.2.3加载和传输数据21
3.2.4针对卷积的稀疏矩阵向量乘22
3.2.5卷积神经网络向前计算的其他步骤23
3.3融合卷积和池化操作23
3.3.1卷积神经网络向前计算步骤24
3.3.2考虑到卷积和池化的稀疏存储格式24
3.3.3加载和传输数据25
3.3.4卷积和池化26
3.4实验26
3.4.1各种卷积层的加速比27
3.4.2对VGG、ResNet、DenseNet和RegNet的加速28
3.4.3对稀疏性的敏感性分析30
3.4.4对Batch大小的敏感性分析31
3.4.5对步长的敏感性分析31
3.4.6数据格式转换的比重32
3.5本章小结32
第四章联合神经网络结构搜索和混合量化的加速方法33
4.1研究动机33
4.1.1两阶段压缩框架的误差累计33
4.1.2静态剪枝后的单一结构35
4.1.3网络层的不均匀重要性36
4.1.4优化机会37
4.2动态神经网络结构搜索38
4.2.1对网络层剪枝结构的搜索38
4.2.2对通道的动态搜索39
4.2.3神经网络混合量化42
4.2.4基于TensorCore的推理加速43
4.3实验44
4.3.1对模型精度和计算量的分析45
4.3.2对每层网络剪枝比例的分析47
4.3.3混合量化对模型精度影响的分析47
4.3.4对TensorCore推理加速的分析48
4.4本章小结49
第五章总结与展望50
5.1本文工作总结50
5.2工作展望51
摘要
您可能关注的文档
- 几类分数阶阻尼动力系统解的存在性和可控性.pdf
- 济南市高校学生体质健康测试工作开展现状调查及优化研究.pdf
- 济南市土壤和地表灰尘重金属赋存特征、源解析与健康风险研究.pdf
- 济南市中学生乐团成长模式的多案例研究.pdf
- 家庭视角下山东省托育服务需求分析及供给对策研究.pdf
- 家长参与和5岁幼儿执行功能、入学准备的关系研究.pdf
- 甲状腺超声图像病灶区域自动分割算法研究.pdf
- 间歇时间再分配训练法对高校排球专选学生专项身体素质的影响研究.pdf
- 检测METTL3_14及端粒酶的荧光生物传感器的构建.pdf
- 检测生物组织中Flap核酸内切酶1和5-甲酰基胞嘧啶的生物传感器研究.pdf
- 某区纪委书记年度民主生活会“四个带头”个人对照检查材料.docx
- 某县纪委监委2024年工作总结及2025年工作计划.docx
- 某市场监督管理局2024年第四季度意识形态领域风险分析研判报告.docx
- 县委书记履行全面从严治党“第一责任人”职责情况汇报.docx
- 税务局党委书记2024年抓党建工作述职报告.docx
- 某市税务局副局长202X年第一季度“一岗双责”履行情况报告.docx
- 副县长在全县元旦春节前后安全生产和消防安全工作部署会议上的讲话.docx
- 某市委书记个人述职报告.docx
- 某县长在县委常委班子年度民主生活会个人对照检查材料1.docx
- 某县长在县委常委班子年度民主生活会个人对照检查材料.docx
文档评论(0)