8 CNN旷视研究院解读LightHead RCNN:平衡精准度和速度.docx

8 CNN旷视研究院解读LightHead RCNN:平衡精准度和速度.docx

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【CNN】旷视争辩院解读Light-Head R-CNN:平衡精准度和速度 量子位 2018-01-01 原文 主讲人:黎泽明 | 旷视争辩院争辩员 屈鑫 编辑整理 量子位 出品 | 公众号 QbitAI 12月20日晚,量子位·吃瓜社联合Face++论文解读系列第三期开讲,本期中旷视(Megvii)争辩院解读了近期发表的Light-Head R-CNN论文。 本篇论文所提出的Light-Head R-CNN,构造了轻量头部R-CNN网络,在COCO数据集上超越当前最好水准,同时还保持了很高的时间效率。 本期主讲人为旷视争辩院争辩员黎泽明,同时也是COCO 2017 Detection竞赛队主力队员、Light-Head R-CNN论文一作。 量子位应读者要求,将精彩内容整理如下: △?共享视频回放 Light-Head R-CNN这篇论文次要是探讨了R-CNN如何在物体检测中平衡精确度和速度。论文中提出了一种更好的two-stage detector设计结构,不只提升精度,同时使除去base model的那部分模型(head)的简约度变得愈加的机警和可控。 基于resnet101我们达到了新的state-of-the-art的结果40.6,超过了mask rcnn和retinanet。同时假如是用一个更小的网络,比如类似xception145M的小模型,light-head 达到了100+ FPS,30.7mmap,效率上超过了ssd和yolo。 我们首先尝试着去找出two-stage检测方法在速度上不够好的缘由。其实two-stage和single-stage都能达到格外高的精度。但在速度方面,single-stage往往更具有优势,比如ssd和yolo。在这篇论文中,我们想表明通过细心的设计,两阶段的物体检测器也能做到特殊快,而且精度可以做到更高。 回顾paper结果 相比state-of-the-art 算法拥有更高的精度和效率。 红色的三角形曲线对应论文跑出来的结果。横轴是inference time,就是你的物体检测器在testing时候的速度,单位是毫秒;纵轴是COCO的MMAP,从0.5到0.95,这个范围内取一个平均的Map。最左边这个红色的三角形是用一个小模型跑出来的结果,两头的这个三角形是用ResNet-50跑出来的结果,最上面的红色三角形是用ResNet-101跑出来的结果。可以看到不管是从精度还是效率,论文中所做出来效果达到了state-of-the-art。? 关于文章的标题:有网友热心的取了光头r-cnn的外号,我们的方法其实没有“琦玉老师”那么强,所以内部给它取了一个外号叫做子弹头。假如从这条结果曲线上来看的话,其实 Light-Head R-CNN它的速度和精度都是特殊高的。总结起来这个方法该当是一个快准狠的一个方法。 light-head r-cnn格外机警和通用,这个在后面讲我那个方法的结构的时候会有所体现。而且框架也格外统一,在light-head rcnn 的角度下,faster 和rfcn结构其实很类似。 另外需要留意的是,我们是在titan xp上测试的,相比老系列的titan x,我们的结果会慢一些,但照旧是在蓝色和绿色曲线的上方。 然后测试阶段使用1卡一batch。 物体检测的两大类 现在的物体检测比较通用的或许能分为两类:single stage的物体检测;two stage的物体检测方法。 two stage物体检测是基于proposal的,经典的就是R-CNN这一个系列的检测方法;而single stage不依靠于proposal,例如基于anchor的 SSD方法。所以single stage在结构上会少一个proposal的predictor。Two stage往往会引入额外的计算量来对proposal,也就是所谓的ROI进行回归和分类。 也就是说Two-stage的detector比one stage多了一步,对proposal的回归和分类器(R-CNN)。假如单纯说速度,two-stage 确定是慢于one-stage的.但是诸如retinanet和ssd的single-stage detector也存在一些问题,就是需要对每个anchor进行分类,想比two-stage的rpn而言,anchor猜想的channel数会添加。 而在two stage中,第一个stage只是做一个二分类,它的channel就不会很多。 同时假如我们降低其次个stage,也就是ROI猜想的部分的简约度,直到相比于前面的base model计算量达到可以忽视不计的程度,那是不是我们也能说其次个stage对网络的速度没有太大的影响。 这样在总体的简约度上就能和single s

文档评论(0)

小文文小库库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档