第12章 基于鲲鹏智能计算平台的深度学习案例实践.pptx

第12章 基于鲲鹏智能计算平台的深度学习案例实践.pptx

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第12章 基于鲲鹏智能计算平台的深度学习案例实践

12.1鲲鹏智能计算平台12.2基于昇腾AI处理器的口罩检测案例实践学习要点

12.1.1昇腾AI处理器昇腾910处理器主要用于深度学习模型训练场景,可以为模型训练提供强大算力。昇腾910芯片采用7nm先进工艺,单芯片计算密度在业内领先,是同时代的英伟达TeslaV100GPU的两倍,16位浮点数(FP16)算力达到256TFLOPS,8位整数(INT8)算力达到512TOPS,同时支持128位通道全高清视频解码(H.264/H.265)。昇腾310处理器主要用于模型推理场景。推理场景对算力的需求相对较小,昇腾310芯片采用12nm制造工艺,最大能耗仅为8W,16位浮点数(FP16)算力达到8TFLOPS,8位整数(INT8)算力达到16TOPS,支持16位通道全高清视频解码,可以很好地满足边缘计算产品和移动端设备进行模型推理的算力需求。昇腾AI处理器910昇腾AI处理器310

12.1.1昇腾AI处理器昇腾AI处理器使用华为自研的达·芬奇架构,针对深度神经网络大量矩阵运算的特点,设计了高性能的3DCube矩阵计算单元,每个矩阵计算单元在一个时钟周期内可以完成4096次乘加计算,再结合向量计算单元和标量计算单元,可以非常灵活且高效地完成各种运算。达·芬奇架构使用了统一硬件架构,可以进行多核灵活扩展以适应不同应用场景。一次开发可支持多场景部署、迁移和协同,统一的架构提升了上层软件开发效率,也带来了能耗上的优势。达·芬奇架构可以支持能耗从几十毫瓦到几百瓦的芯片,可灵活应对不同场景,满足性能与能耗的需求。除搭载基于达·芬奇架构的AI加速模块外,昇腾AI处理器还搭载了硬件级别的图像处理模块,可以快速完成常见的图像预处理操作,如图片编/解码、缩放、色域转换等。此外,昇腾AI处理器还拥有高效的缓存系统和丰富的I/O接口,能灵活应对各场景下的计算需求,为各场景下的AI应用提供强劲的基础算力。

12.1.2鲲鹏AI计算服务器Atlas800训练服务器华为的Atlas800训练服务器(型号为9000)是基于鲲鹏920和昇腾910处理器的AI训练服务器,具有极强算力密度、超高能效与高速网络带宽等特点。该服务器广泛应用于深度学习模型开发和训练,适用于智慧城市、智慧医疗、天文探索、石油勘探等需要大算力的行业领域。Atlas800推理服务器Atlas800推理服务器(型号为3000)是基于鲲鹏920处理器的服务器,可支持8个Atlas300I推理卡(型号为3000),可提供强大的实时推理能力。

12.1.2鲲鹏AI计算服务器鲲鹏AI推理加速型实例kAi1s是以昇腾310芯片为加速核心的AI加速型云服务器;基于昇腾310芯片低能耗、高算力的特性,实现了能效比的大幅提升,助力AI推理业务的快速普及;通过鲲鹏AI推理加速型实例kAi1s将昇腾310芯片的计算加速能力在公有云上开放出来,方便用户快速、简捷地使用昇腾310芯片强大的处理能力。

鲲鹏智能计算平台基于昇腾AI处理器的口罩检测案例实践学习要点12.112.2

12.2.1任务概述训练并部署口罩检测模型对算力有较高需求,鲲鹏智能计算平台基于鲲鹏处理器和昇腾AI处理器提供灵活且高效的算力支持,可以方便高效地训练、部署口罩检测模型。本案例将探索基于昇腾AI服务器完成口罩检测模型的训练及部署。本案例包含以下两个任务。(1)基于Atlas服务器的口罩检测模型训练,模型训练部分对算力有较高的要求,搭载了鲲鹏920CPU和昇腾910AI处理器的Atlas系列训练服务器可以高效地完成训练过程。(2)基于kAi1s的口罩检测模型推理部署,边缘侧的AI模型推理部署需要平衡算力和能耗,搭载了鲲鹏920CPU和昇腾310AI处理器的kAi1s云服务器可以很好地满足推理部署对性能和能耗的要求。

12.2.2基于Atlas服务器的口罩检测模型训练环境准备01OPTION(1)安装驱动。要想在搭载鲲鹏处理器和昇腾AI处理器的服务器上训练深度学习模型,首先要安装相关的驱动、软件,具体可参考相应的产品文档。

12.2.2基于Atlas服务器的口罩检测模型训练环境准备01OPTION(2)获取训练环境下的Docker镜像驱动并安装完毕后,还需要安装TensorFlow等软件环境,昇腾社区提供内置训练环境的Docker镜像,可以通过Docker镜像启动训练环境。Docker镜像获取界面如图所示。

12.2.2基于Atlas服务器的口罩检测模型训练数据集准备02OPTION本案例使用已标注好的口罩检测数据集,其中包含500张已标注图片用于训练、验证,8张未标注图片用于在线测试。标签数据为

您可能关注的文档

文档评论(0)

释然 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档