- 6
- 0
- 约10.62万字
- 约 84页
- 2025-10-13 发布于江西
- 举报
摘要
随着深度学习的迅速发展,AI在端侧的应用从基础的图像分类延伸到现
在诸如图像降噪等复杂的下游任务,神经网络的计算量也在持续上升,基于
CPU后端的推理框架难以应对神经网络规模的膨胀。端侧设备相比于云端,其
需求及任务较为单一,因此可以使用领域专用加速器(DomainSpecific
Accelerator,DSA)代替CPU后端以应对神经网络规模膨胀的问题。但是现有
的端侧DSA对于神经网络的部署不友好,远不如基于CPU后端的推理框架快
速便捷。
本文主要是针对深度神经网络在端侧部署存在的上述问题,以FPGA加速
器NVDLA和端侧推理框架ncnn为基础,研究并设计实现了NVDLA作为
DSA后端集成到ncnn框架的方案,主要的研究内容与成果如下:
第一部分是针对NVDLA模型部署工具链仅支持部署Caffe模型的问题,
通过设计实现NVDLA编译器前端对接ncnn模型的方案,以ncnn框架作为中
间层,使得NVDLA能够对接PyTorch和TensorFlow2等更加现代的深度学习
框架。
第二部分是针对NVDLA支持算子有限以及ncnn框架只支持CPU等通用
处理器后端的问题,实现了NVDLA与ncnn框架协同推理的方案。使得ncnn
框架能够使用NVDLA作为后端加速硬件进行推理加速,在推理时遇到
NVDLA硬件不支持的算子,也可以让推理计算回滚到CPU上,复用ncnn框
架极致优化的CPU后端。在这一方案中还实现了ARM64指令集架构
(InstructionSetArchitecture,ISA)下的快速反量化算法,该算法在ARM主流
微架构Cortex-A76上的峰值性能可以达到原生算法的2倍。
最后,基于Xilinx官方评估板ZCU104,完成了NVDLA的FPGA映射以
及对应的Linux内核驱动等软件的移植,最终实现了该推理系统。在该推理系
统上推理ResNet18-CIFAR10网络,其吞吐量相比于NVDLA原生的模型部署
工具链提升了153%,相比于主流端侧推理框架MNN则提升了69%。除了性
能提升以外,该推理系统还提供了更强的模型兼容性,能以可观的速度推理原
生工具链不支持的目标检测网络。
关键词:推理框架,FPGA加速器,NVDLA
ABSTRACT
Withtherapidadvancementofdeeplearning,theapplicationofAIattheedge
hasevolvedfrombasicimageclassificationtomorecomplexdownstreamtaskssuch
asimagedenoising,leadingtoacontinuousincreaseinthecomputationaldemands
ofneuralnetworks.TheinferenceframeworksbasedonCPUbackendsstruggleto
copewiththeexpandingscaleofneuralnetworks.Comparedtocloudcomputing,
edgedevicesoftenhavemorespecificneedsandtasks,allowingfortheuseof
DomainSpecificAccelerators(DSAs)insteadofCPUbackendstoaddressthe
challengesposedbythescalingofneuralnetworkmodels.However,existingDSAs
for
您可能关注的文档
- 基于Transformer的强化学习序列决策方法.pdf
- 基于Transformer的情感音乐生成研究.pdf
- 基于Transformer的室内蓝牙定位系统设计与实现.pdf
- 基于Transformer和对比学习的消化道疾病分型的研究.pdf
- 基于UbD理论的“立体几何初步”单元教学设计研究.pdf
- 基于UbD模式的初中小说教学研究——以九年级上册第四单元为例.pdf
- 基于UE4的虚拟装配技术研究与实现.pdf
- 基于UHPC连续桥面板的延伸桥面无缝桥研究.pdf
- 基于UWB信号的车内目标探测技术研究.pdf
- 基于U形神经网络的胰腺肿瘤CT图像分割方法研究.pdf
- 伟明环保-市场前景及投资研究报告-境内业务稳健运行,印尼市场贡献边际增量.pdf
- 桂东县法院系统招聘考试真题2025.pdf
- 贵州省黔南布依族2026年中考三模物理试题及答案.pdf
- 贵州省黔南州2026年中考语文二模试卷附答案.pdf
- 贵州省铜仁市2026年中考语文二模试卷附答案.pdf
- 2026上半年安徽事业单位联考合肥市庐江县招聘36人备考题库及一套完整答案详解.docx
- 贵州省毕节市2026年中考语文一模试卷附答案.pdf
- 贵州省贵阳市南明区2026年中考语文一模试卷附答案.pdf
- 2026上半年安徽事业单位联考合肥市庐江县招聘36人备考题库及一套参考答案详解.docx
- 贵州省贵阳市白云区2026年中考二模物理试题附答案.pdf
最近下载
- 面向产业的算法治理研究(2025年).pptx
- 梵音入汉:佛经汉译对汉语演进的多维影响.docx
- 小学低段音乐课堂管理方法的研究课题资料(包含申请表、开题报告、实施方案、结题报告等).pdf VIP
- 2026《隧道贯通误差预计计算案例》4000字.docx
- 2022-2023学年北京市丰台区高二(下)期末数学试卷(附答案详解).docx VIP
- 5m盐酸溶液的配制 -回复.pdf VIP
- 2026年新疆工程学院辅导员招聘备考题库最新.docx VIP
- 2026年新疆财经大学辅导员招聘备考题库必考题.docx VIP
- 2026年新疆农业大学辅导员招聘备考题库附答案.docx VIP
- 现代金属凝固技术课件(9056KB).ppt VIP
原创力文档

文档评论(0)