金准人工智能智能监控场景下大规模并行化视频分析方法.docx

下载文档 降价啦

2
0
约6.2千字
约 25页
2018-06-09 发布于湖北
举报
版权申诉
保障服务

金准人工智能智能监控场景下大规模并行化视频分析方法.docx

1、本文档共25页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

金准人工智能智能监控场景下的大规模并行化视频分析方法前言深度学习在图像识别、智能视频分析技术方面的精度不断提升，使得安防成为了深度学习快速落地的最清晰方向之一，而计算力的发展，使得大规模的并行计算成为了可能。人工智能和机器人研究所借助双路Tesla P100 GPU强大的并行计算能力，基于大规模深度神经网络构建了智能视频分析系统，实现了对多路视频流的实时处理以及对大规模离线监控录像的高效分析，极大地加速了视频处理的运行效率。一、智能监控领域的应用背景以及行业进展目前来说，智能安防是智慧城市非常重要的一项组成部分。智能安防主要包括视频监控以及人脸识别这些已经落地的商业应用，此外，智能安防还和目前非常火爆的无人驾驶息息相关。?上图视频监控占整个安防行业的50%，而且呈现逐年上升的趋势。在其他方面，包括实体防护、出口控制、防盗报警等几项应用也瓜分了安防市场50%的份额，而近年来，中国安防行业市场规模也在逐年扩大，从2011年的2773亿直接涨到了2017年的6540亿，每年都有15%到20%增长率，是非常具有应用场景的一个行业。?智能监控都要做些什么呢？传统的监控领域，仅仅是用监控设备去拍一些监控视频，然后由人来对视频中一些敏感的目标进行分析。而智能视频监控，旨在通过视觉模式识别技术，对监控视频中目标、行为、事件等对象来进行智能识别和分析。比如我需要检测监控场景里面都有哪些目标，其中有人还是车，再分析监控场景中目标的行为，对监控视频中的一些敏感事件进行检测等。?随着深度学习技术的发展，智能监控所用到的检测、识别、跟踪等技术已经达到了非常高的精度，大家可以看图中从上到下分别是人脸检测与识别、行人检测与跟踪、行人姿态估计、车辆检测、车型识别以及交互识别等几大主要领域，而视频监控需要把这些领域的技术融合起来，然后对监控视频做各个维度的分析。二、基于深度学习的视频分析技术基于深度学习的视频分析技术概括。下图大致把目前最核心的几个技术给列了出来：?首先是目标检测，这个不用介绍，金准人工智能专家相信做过视觉的同行大都了解此领域。目标检测和图像分类是视觉技术中一个非常基础的任务，其目的就是跟踪场景中感兴趣的一些物体，包括常规的目标检测、人员检测以及车辆检测等等；目标检测完成以后，需要针对每个检测到的目标来计算其运动轨迹，根据目标的数量以及摄像头的数量，可以分为单目标跟踪、多目标跟踪，单摄像头跟踪、跨摄像头跟踪等；人脸识别又是另一个已经落地的商业应用，它主要是为了识别或验证场景中的人脸，包括人脸检测、关键点检测、属性分析、人脸比对以及检索等；而行为识别是为了识别人体动作以及人与物体之间的交互，现在做行为识别比较简单一点的任务，就是在一段视频中去判断里面是否发生了某个动作，稍微难一点的是做行为检测，需要从一段很长的视频中去找出每个动作所发生的时间段；而更难一些的还要识别出动作的主体、客体以及交互的对象、动作的状态等；还有一个应用领域是图像增强，也是最近进展比较快的。在我们监控到的视频中，它很容易受到环境和视频采集设备的影响。通常我们采集到的视频是不理想的，伴有噪音、运动模糊等，是需要进行视频方面的增强，比如做超分、去模糊、去抖动以及去雾、去雨雪之类的。1.目标检测目标检测需要把场景中所有感兴趣的目标逐个地给框出来，并识别出这个目标的类别，也是视频监控分析时所用到的第一步。?对于一个场景，常常需要把场景中的行人、车辆等目标挨个点出来，并且还需要把它们的边框准确的框出来，框出来以后才可以进行下一步再识别等任务。?目前检测领域主要分为两大方法：基于区域的检测算法和基于回归的检测算法。基于区域的检测方法，一般是通过两阶段的算法，分为区域候选阶段和区域检测阶段：区域候选阶段，就是通过候选框生成算法先从大图里面找到目标潜在的位置,比如传统的Selective Search、Edge?Boxes和基于CNN的RPN方法；区域检测阶段，就是从区域候选阶段得到候选框后再去做进一步精细的分类和定位，目前主流的方法包括R-CNN以及R-CNN的各种改进版。基于回归的检测方法是另一个流派，从YOLO开始，到之后的SSD做了进一步的定位优化，这种方法基本上采用的是单阶段直接回归检测框的思路。它比较显著的一个特点就是检测速度非常快，可以做到实时性，它的缺点是，相比基于区域的检测方法，其定位精度往往会差一些。?上图是目前最流行的基于区域的Faster R-CNN检测算法的示意图。?完成检测以后，我们仅仅是知道场景中有哪些目标以及它们的位置，如果需要做进一步分析，需要知道每个目标的ID是多少，同时还需要跟踪每个目标的运动轨迹来确定视频里面每一帧目标所属的ID。金准人工智能专家目前做行人的tracking需要较好的ID特征，通常先用Person ReID任务的数据集训练一个网络，然

您可能关注的文档

文档评论（0）

187****5045 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

金准人工智能智能监控场景下大规模并行化视频分析方法.docx