8 CNN旷视研究院解读LightHead RCNN：平衡精准度和速度.docx

下载文档 降价啦

0
0
约8.31千字
约 16页
2021-07-25 发布于湖南
举报
版权申诉
保障服务

8 CNN旷视研究院解读LightHead RCNN：平衡精准度和速度.docx

1、本文档共16页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

【CNN】旷视争辩院解读Light-Head R-CNN：平衡精准度和速度量子位 2018-01-01 原文主讲人：黎泽明 | 旷视争辩院争辩员屈鑫编辑整理量子位出品 | 公众号 QbitAI 12月20日晚，量子位·吃瓜社联合Face++论文解读系列第三期开讲，本期中旷视（Megvii）争辩院解读了近期发表的Light-Head R-CNN论文。本篇论文所提出的Light-Head R-CNN，构造了轻量头部R-CNN网络，在COCO数据集上超越当前最好水准，同时还保持了很高的时间效率。本期主讲人为旷视争辩院争辩员黎泽明，同时也是COCO 2017 Detection竞赛队主力队员、Light-Head R-CNN论文一作。量子位应读者要求，将精彩内容整理如下： △?共享视频回放 Light-Head R-CNN这篇论文次要是探讨了R-CNN如何在物体检测中平衡精确度和速度。论文中提出了一种更好的two-stage detector设计结构，不只提升精度，同时使除去base model的那部分模型(head)的简约度变得愈加的机警和可控。基于resnet101我们达到了新的state-of-the-art的结果40.6，超过了mask rcnn和retinanet。同时假如是用一个更小的网络，比如类似xception145M的小模型，light-head 达到了100+ FPS，30.7mmap，效率上超过了ssd和yolo。我们首先尝试着去找出two-stage检测方法在速度上不够好的缘由。其实two-stage和single-stage都能达到格外高的精度。但在速度方面，single-stage往往更具有优势，比如ssd和yolo。在这篇论文中，我们想表明通过细心的设计，两阶段的物体检测器也能做到特殊快，而且精度可以做到更高。回顾paper结果相比state-of-the-art 算法拥有更高的精度和效率。红色的三角形曲线对应论文跑出来的结果。横轴是inference time，就是你的物体检测器在testing时候的速度，单位是毫秒；纵轴是COCO的MMAP，从0.5到0.95，这个范围内取一个平均的Map。最左边这个红色的三角形是用一个小模型跑出来的结果，两头的这个三角形是用ResNet-50跑出来的结果，最上面的红色三角形是用ResNet-101跑出来的结果。可以看到不管是从精度还是效率，论文中所做出来效果达到了state-of-the-art。? 关于文章的标题：有网友热心的取了光头r-cnn的外号，我们的方法其实没有“琦玉老师”那么强，所以内部给它取了一个外号叫做子弹头。假如从这条结果曲线上来看的话，其实 Light-Head R-CNN它的速度和精度都是特殊高的。总结起来这个方法该当是一个快准狠的一个方法。 light-head r-cnn格外机警和通用，这个在后面讲我那个方法的结构的时候会有所体现。而且框架也格外统一，在light-head rcnn 的角度下，faster 和rfcn结构其实很类似。另外需要留意的是，我们是在titan xp上测试的，相比老系列的titan x，我们的结果会慢一些，但照旧是在蓝色和绿色曲线的上方。然后测试阶段使用1卡一batch。物体检测的两大类现在的物体检测比较通用的或许能分为两类：single stage的物体检测；two stage的物体检测方法。 two stage物体检测是基于proposal的，经典的就是R-CNN这一个系列的检测方法；而single stage不依靠于proposal，例如基于anchor的 SSD方法。所以single stage在结构上会少一个proposal的predictor。Two stage往往会引入额外的计算量来对proposal，也就是所谓的ROI进行回归和分类。也就是说Two-stage的detector比one stage多了一步，对proposal的回归和分类器（R-CNN）。假如单纯说速度,two-stage 确定是慢于one-stage的.但是诸如retinanet和ssd的single-stage detector也存在一些问题，就是需要对每个anchor进行分类，想比two-stage的rpn而言，anchor猜想的channel数会添加。而在two stage中，第一个stage只是做一个二分类，它的channel就不会很多。同时假如我们降低其次个stage，也就是ROI猜想的部分的简约度，直到相比于前面的base model计算量达到可以忽视不计的程度，那是不是我们也能说其次个stage对网络的速度没有太大的影响。这样在总体的简约度上就能和single s