- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘 要
摘 要
随着深度学习的不断发展和应用,深度神经网络算法己经在视觉、语音等多个领
域中发挥了重要作用。神经网络的规模日益庞大、计算愈发复杂造成网络加速器的高
能耗、低能效问题。而移动通信设备通常有低功耗、高能效的需求,这就对加速器芯
片应用于移动通信设备造成了困难。
针对以上问题和困难,本课题采用了二值化卷积神经网络(Binary Convolutional
Neural Networks ,BCNN ),针对混合国家标准与技术研究所数据库(Mixed National
Institute of Standards and Technology,MNIST )数据集,完成了基于模拟延时的神经网
络加速器设计。为实现低能耗、高能效的目标,首先,针对加速器的核心计算单元,
采用低功耗的模拟延时链组成的计算阵列替代了同或门配加法树的计算阵列;其次,
优化了批量归一化层的计算,节省了该层的硬件开销和能耗;然后,采用了有效的计
算模式,实现了有效的数据复用和卷积映射,计算阵列的利用率达到 100%;最后,提
出了基于池化的卷积稀疏算法,减少了 14.3%的计算周期、降低了卷积等计算的功耗。
本课题完成了两款加速器芯片的设计。其中第一款芯片是采用了模拟延时链、批
量归一化优化方法和计算模式优化的二值化卷积网络加速器芯片,并完成了流片验证
2
和测试。其采用了 TSMC 28nm CMOS 工艺,整个加速器芯片面积为 1.92×1.35mm 。
芯 片实测结果表明,其工作电压范围为 0.42V~0.9V ,对应工作频率范围为
25MHz~500MHz ,能效为基于池化的卷积稀疏算法。另一款二值化卷积网络加速器芯
片在第一款芯片基础上添加了基于池化的卷积稀疏算法,并完成了仿真验证。在
TSMC 28nm CMOS 工艺下仿真结果表明,其电压范围为 0.5V~0.9V,工作频率范围为
25MHz~500MHz ,能效可达 97.4TOPS/W~13.8TOPS/W 。与国内外同类成果的对比结果
表明,本课题的两款加速器芯片所采用的方法对加速器降低能耗、提高能效具有不错
的效果。
关键词:二值化卷积神经网络,加速器,模拟延时,计算模式,池化
I
Abstract
Abstract
With the development and application of deep learning, deep neural network have played
an important role in many fields. The increasing size of neural networks and the increasing
complexity of computing will inevitably lead to the problem that is high energy consumption
and low energy efficiency of network accelerators. Mobile communication devices often have
requirements of low power consumption and high energy efficiency, which makes it difficult to
apply accelerator chips to mobile communication devices.
This paper adopts a binary convolutional neural network and completes the neural network
accelerator design based on analog delay for the MNIST d
您可能关注的文档
- 基于滑模控制的SRM直接转矩控制.pdf
- 基于机器学习的网络舆情分析技术的研究与实现.pdf
- 基于机器学习的虚拟化网络故障诊断系统研究与实现.pdf
- 基于记忆性神经网络的谎言检测算法研究.pdf
- 基于监控视频的电梯轿厢内禁入目标检测算法研究与实现.pdf
- 基于建成环境的人数演化预测.pdf
- 基于角度补偿的RSSI测距系统设计与实现.pdf
- 基于纠删码的分布式存储系统中更新策略的研究与实现.pdf
- 基于卷积神经网络的肾脏肿瘤分割和分类研究.pdf
- 基于卷积神经网络的心脏CT图像配准与分割.pdf
- 2025至2030中国移动治疗台行业发展研究与产业战略规划分析评估报告.docx
- 2025至2030链激酶行业细分市场及应用领域与趋势展望研究报告.docx
- 2025至2030爆炸物探测扫描仪行业市场占有率及有效策略与实施路径评估报告.docx
- 2025至2030四川省智能制造行业细分市场及应用领域与趋势展望研究报告.docx
- 2026届高三二轮复习试题政治大单元突破练1生产资料所有制与分配制度含解析.docx
- 2026届高三二轮复习试题政治大单元突破练16哲学基本思想与辩证唯物论含解析.docx
- 2026届高三二轮复习试题政治大单元突破练2社会主义市场经济体制含解析.docx
- 浙江省衢州市五校联盟2025-2026学年高二上学期期中联考技术试题-高中信息技术含解析.docx
- 浙江省金丽衢十二校2026届高三上学期11月联考政治试题含解析.docx
- 2026届高三二轮复习试题政治大单元突破练7领导力量:中国共产党的领导含解析.docx
最近下载
- DB23T 1496.22-2021 劳动防护用品配备 第22部分:种植业生产人员.docx VIP
- TCL海外员工管理.docx VIP
- 神经内科DRGs病案首页诊断栏和手术操作栏填写要求.pdf VIP
- GB T 28896-2023 金属材料 焊接接头准静态断裂韧度测定的试验方法(OCR).pdf VIP
- 高中信息技术校本教材《计算机及网络简介》.pdf VIP
- 牛津树阅读绘本(适合2-8岁小童)A present for Mum【有书】.pdf VIP
- 《电击伤急救护理教程》课件.ppt VIP
- 浙江省杭州市滨江区杭二统考2024-2025学年高二上学期语文期末考试卷(含答案).docx VIP
- 工程廉政风险点及其防控措施表完整.docx VIP
- 河海大学《高等数学》 2017-2018学年第一学期期末试卷B卷.pdf VIP
原创力文档


文档评论(0)