【机器视觉】百度邓凯鹏:飞桨视觉技术解析与应用.docx

【机器视觉】百度邓凯鹏:飞桨视觉技术解析与应用.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【机器视觉】百度邓凯鹏:飞桨视觉技术解析与应用 人工智能论坛如今浩如烟海,有硬货、有干货的讲座却百里挑一。“AI未来说·青年学术论坛”系列讲座由中国科学院大学主办,百度全力支持,读芯术、paperweekly作为合作自媒体。承办单位为中国科学院大学学生会,协办单位为中国科学院计算所研究生会、网络中心研究生会、人工智能学院学生会、化学工程学院学生会、公共政策与管理学院学生会、微电子学院学生会。2020年4月26日,第14期“AI未来说·青年学术论坛”深度学习线上专场论坛以“线上平台直播+微信社群图文直播”形式举行。百度邓凯鹏带来报告《飞桨视觉技术解析与应用》。 百度邓凯鹏的报告视频 邓凯鹏,2017年本硕毕业于上海交通大学电子信息与电气工程学院,现于百度深度学习技术平台部从事CV方向模型研究和优化工作。PaddleDetection目标检测库和PaddleVideo视频库的核心设计者和开发者,两个模型库均是在工业端到端落地的优秀实践,支撑了大量线上业务,其中基于Paddle开发并优化的YOLOv3目标检测模型,在精度和速度上达到业界最优,通过裁剪蒸馏等方法压缩的YOLOv3模型在移动端精度和速度大幅领先于当前最优的SSDLite-MobileNetV3。Paddle 3D视觉方向负责人,完成Paddle 3D视觉方向的建设和推广,建设的Paddle 3D模型库支撑百度研究院发表论文10余篇。 报告内容:介绍飞桨视觉技术的发展现状,分析飞桨开源的各视觉模型库的特色和优势,并结合图像分类,目标检测和模型压缩及部署上端到端优化及应用案例,解读飞桨在视觉模型完备性和领先性上的已有建设工作,介绍视觉模型精度和预测速度优化上的方法技巧和实用效果,并分享飞桨在视觉模型选择,性能优化和部署应用上的优秀实践,解析飞桨视觉模型在工业应用实践上的优越性。 飞桨视觉技术解析与应用 首先,邓凯鹏老师介绍了当前飞桨框架以及视觉模型库CV的整体建设情况。飞桨框架是源自产业实践深度学习框架,同时支持静态图和动态图搭建网络,支持高效大规模分布式训练,同时推出了像PaddleSlim模型压缩还有安全加密的工具,以及在服务端和移动端进行预测部署一些引擎。基于飞桨框架,百度开源了自然语言处理、计算机视觉、推荐系统以及语音处理等模型库,在基础模型库之上又开源了一系列端到端开发套件,在端到端开发套件之上开源了一键式迁移学习工具PaddleHub,还有自动进行网络结构设计的AutoDL,另外还开源了定制化训练服务平台EasyDL以及一站式开发训练平台AI Studio。 接下来邓凯鹏老师列举了飞桨框架几大优势:(1)飞桨框架同时支持静态图和动态图,动态图组网和调试方便,静态图运行速度快、部署方便,同时支持静态图和动态图使开发更为便捷。(2)飞桨是支持超大规模深度学习并行模型的,在海量数据和模型快速迭代的场景中有很大的优势。(3)不仅使用和训练方便,飞桨框架和多端多平台推理部署基本上是无缝对接,并且有领先底层加速库,还有模型压缩工具针对服务器端和移动端的部署引擎。(4)在应用方面,飞桨推出经过实践验证的丰富应用模型库,开源了多个国际竞赛的冠军算法。 之后,邓凯鹏老师对计算机视觉进行了简要介绍。飞桨推出了工业级计算机视觉模型库,百度构建了图像分类、目标检测、图像分割、视频处理、图像生成、文字识别、度量学习以及3D视觉相关方面视觉能力,同时也构建了PaddleClas图像分类、PaddleDetection目标检测以及PaddleSeg图像分割这些端到端的开发套件,接下来邓凯鹏老师就主要基于PaddleClas和PaddleDetection应用介绍了飞桨在实际技术中建设。 (1)PaddleClas图像分类。图像分类的任务目标形象地说就是给计算机一张猫的图片,通过计算机实现算法或者模型让计算机准确判断这是只猫。图像分类的应用是十分广泛的。 飞桨团队技术开源了PaddleClas图像分类套件,这是为工业界和学术界打造图像分类任务的工具集,PaddleClas包含23个系列,多达117种分类模型,这也是当前丰富度最高的图像分类代码仓库。同时PaddleClas对于模型优化提供了最前沿的支持,比如,将ResNet50_vd精度优化到82.4%的SSLD知识蒸馏方案,也随着PaddleClas一起开源了。另外基于PaddleClas开源了多个特色应用以及工业级部署工具,在工业应用场景有非常好端到端的落地能力。 下面邓凯鹏老师具体地介绍了PaddleClas的优势。PaddleClas图像分类库解析与应用提供了服务器端模型和端侧模型两个系列模型来支撑不同的运用场景。 图像分类模型有大有小,应用场景各不相同,如果在云端、服务器端上面部署模型时,一般认为算力是足够的,更倾向于追求模型精度;而

文档评论(0)

火之舞 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档