与智能视频监控有关的技术挑战.docVIP

下载本文档

0
0
约 5页
2016-12-17 发布于北京
举报
版权申诉

与智能视频监控有关的技术挑战.doc

1、本文档共5页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

与智能视频监控有关的技术挑战　　在大数据里，监控视频的数据占比较高，2010年差不多占到50%左右，到2015年可能会接近70%。当然，随着大数据越来越多，整个监控视频的比例会慢慢减少，但是即使减少，在2020年也能达到40%以上，所以这个数据处理的问题很重要。视频监控是一座城市安全的重要保障，在平安城市、数字城市建设中起着至关重要的作用。主要的挑战可概括为三个：存不下、找不到、看不清。这三个挑战具体涉及到的是三个技术问题，第一个存不下的问题，事实上是编码压缩的问题。第二个找不到实际上是搜索的问题，当然搜索的话，有的专家经过星期六在论坛上汤晓鸥教授的报告之后，大家就会清楚，我们是多摄像机网络，要想比较有效的搜索，光看一个摄像机的内容是不够的，摄像机和摄像机之间必须要联合起来一起看，所以这个就是在多摄像机网络里面的搜索问题。第三个挑战是所谓的看不清，现在的监控视频摄象头的质量是不行的，所以导致现在即使拍到了这张照片，但是人可能是看不清的。　　编码压缩的问题　　第一个存不下的问题，事实上是编码压缩的问题。视频编码的进展还是比较快的，但是技术的进步和数据增长的速度比起来，根本没有办法吻合，因为技术是每十年翻一倍，但是我们知道大数据，尤其是和监控有关的大数据，增长起来非常的快，所以靠传统技术的进步来解决数据本身增长量显然是不够的。具体说来，这个技术要解决是视频数据的编码效率问题，如果你有办法把这个视频数据很好的压缩了，那么传输、存储也可能不是大问题了。这个方面实际上我们是希望找到一个特别是对于监控视频比较有效的压缩方法。　　在视频编码里面，有三个技术是比较关键的，第一个技术是变换技术，就是把实滤的信号放在频率上处理，使得用一些数据工具能很好的进行编码压缩。第二个是预测技术，靠的是在同一帧和不同帧里找到相同的东西。第三个是商业编码，每一个东西都有信息商，如果用商业编码来表达就会更加有效率。所有的视频编码实际上是这三个技术的组合，这个技术实际上是有一个理论上限，我们现在可达到的成果离理论上限还有非常大的空间。　　面向监控视频，应该要用更好的技术，我们把它叫做Lone―termVirtual，是长时的、虚拟帧的参考技术。所谓长时，就是因为场景可以长时间的使用，所谓的帧其实不是一个真的帧，是算出来的，通过模型的方法来产生，用这样的方法效率就比较高。这种想法是不管拍自然景物，还是会议视频，实际上有很多东西是不变的，只有少部分是变的，如果把少部分变的东西检测出来，不变的东西可以一直在使用，这样就可以提高编码效率。这里最关键的问题是区分背景和前景，背景用长时间不用的东西表达，前景我用精细的编码表达。为了把背景找到，我们就提出了一个技术――基帧产生技术。有了这项技术就可以很容易把一个图像序列的前景、背景分离出来了。知道了前景和背景，有了这样的结构，接下来就是怎么编的问题了，这样比原来做的视频编码要简单得多。　　此外，还有一项技术不仅仅和监控视频有关，与互联网视频也有关，我们把它叫做Free―term编码结构，这个完全是面向大数据的。　　互联网上有非常多的视频和图像，从这些东西中可以提取出一个很好的缩影，可以利用这个缩影进行检索，也就是说有了这个大数据了，可以通过一些稀疏的表达来构造一个东西，然后利用这个东西来编辑编码，使编译效率更高。　　有效搜索的问题　　搜索的问题在这里面有这样的几个问题：对象能不能检测得到？检测的对象能不能跟得上？不同摄像机为了跟上，怎么切换？前两个问题是一般模式必须要解决的问题，里面有很多必须要解决的技术。　　到目前为止基本上是摄象头接收信息，把接收到的信息送回来，已经做了编码压缩，要在根上解开，然后再做分析。先有编码，然后是解码，然后再做检测。如果用前面说的这种想法，因为一开始我们有5分钟的前景和背景，你的对象一定是前景上，所以只在前景上找就可以了，这样检测的效率就非常高。　　另外是跟踪，多摄像机的网络跟踪，摄像机和摄像机之间，它的位置、朝向、时间切换点等等，把这些参数很好的结合在一起，这个问题也可以推进，但是到目前为止，这个问题做得并不好，大家可以做的也就是十几个到几十个摄像机的跟踪，一个城市做几千个，几万个，几十万个，目前根本做不到。　　我们希望原来把编码和分析像一个火车的两条轨道完全平衡，使得所做的技术融合在一起，集中在一个编码的框架下。如果有了这个东西，实际上在摄象头那一端抓回来的东西，前景直接可以进入到对象的描述和表达，可以基于前景来描述出相关的内容，比如说有哪些区域在前景上，然后把若干的图像和若干个摄象头的东西融合在一起，最后可以分析出来他的行为是什么，这样就可以直接进入到视频监控的环节，这个是很理想的状态。有了这个，视频监控才能够真正的融合到智慧城市里。