机器视觉期末作业.docVIP

下载本文档

132
0
约1.95万字
约 29页
2017-03-18 发布于江西
举报
版权申诉

机器视觉期末作业.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第一章绪论 1.1运动人体目标检测与跟踪理论综述 1.1.1概述人体的运动与跟踪是近年来计算机视觉领域的重要研究课题，它包括从图像序列中检测、识别、跟踪人体并对其行为进行理解和描述。由于该项技术在很多领域有着很广泛的应用，因此越来越受到国内外科研人员的重视。对运动人体进行实时跟踪(RTT)首先需要进行目标检测，即将运动目标从背景图像中分离出来，然后再对分割出的目标进行实时跟踪，并获得更多关于目标的相关信息，达到跟踪的目的。视觉跟踪问题按照不同的分类标准主要有以下几种分类[l]一[3]: 、按照摄像机是否运动: 根据摄像机是否运动可以将人体跟踪问题分为摄像机静止时的目标跟踪和摄像机运动时的目标跟踪。对于大多数的视频监视系统都是采用摄像机静止的方法[4][5]。在这种情况下，背景是静止的，而作为前景的运动目标是移动的，很多实验表明[7]，这时采用背景差分法进行目标检测，基本上可以得到检测目标。但是在很多情况下摄像机是运动的，运动的形式分为两种，一种是摄像机支架固定，但是摄像机角度可以偏转，焦距可以调整。另一种是摄像机装在某个可以移动的载体上。在这种情况下，由于摄像机和目标都是运动的，因此给目标的检测带来更多困难。本文只讨论当摄像机为静止时的运动目标跟踪。、按照摄像机的数目: 按照所使用摄像机的数目来分跟踪问题主要有单摄像机视觉跟踪和多摄像机视觉跟踪。目前主要研究的是单摄像机跟踪问题[4]一[6]，本论文也只讨论单摄像机的跟踪。但是在实际的视频监视系统中，单摄像机所监视的区域还是有限的，因此，在一些比较大的公共场合，更多的系统开始采用多摄像机用来扩大监视的范围[7]一[9]。另外，双目或多目视觉系统还可以获得运动目标的距离信息。在对运动目标跟踪过程中，往往会发生目标被遮挡或者暂时消失等问题，这也是视觉研究中的难点，此时用单摄像机也很难解决这类问题，而使用多摄像机在一定程度上是能够解决的[10]。但是使用多摄像机会带来更大的问题，即如何将多摄像机获得的不同视角的运动信息正确对应起来。解决这个问题的难度非常大，因此，在不同的场合可以考虑实际情况选择摄像机的数目。三、按照场景中运动目标的数目: 按照场景中运动目标的数目可以把跟踪问题分为单个目标跟踪和多个目标跟踪。由于噪声及光线变化等外界因素的影响，单个目标的检测也有一定的困难，如果不能准确检测出目标，会使跟踪失败。如果场景中有多个目标时，由于目标间还会发生遮挡，合并，分离等问题，使检测更为困难。本论文主要讨论以单个目标为主的跟踪。 1.1.2 国内外研究现状运动目标的检测和跟踪在高级人机交互、安全监控、视频会议、医疗诊断等方面具有广泛的应用前景和经济价值，因此激发了各国的研究人员的广泛研究兴趣，目前世界上有许多大型科研机构都在对这一领域进行研究，如在美国，英国等国家已经开展了大量的研究工作，在我国，该项工作最近得到重视。国内进行人体检测与跟踪研究的主要科研机构有中科院自动化所模式识别国家重点实验室等。 1.1.3 应用前景运动目标检测和跟踪具有广泛的应用前景，主要应用领域可以总结为如下几个方面: 三维重构 (3D Reconstruetion) 三维重构在医学上有着重要的使用价值。在获得人体器官切片的医学图像之后，通过对人体器官的三维重构能够为医生的准确诊断提供非常重要的帮助。智能监控 (smartsurveillanee) 智能监控广泛应用于银行、商场、停车场等对安全有较高要求的场所。这些场所普遍安装有摄像机，但是并没有发挥实时主动的监控作用，因为视频信号大多只是被保存在磁带、硬盘等存储设备上，当出现异常情况时可以回放观察已发生的事实，这样就失去了视频信号的实时意义。也就是说，在这些场所需要的是24小时的实时监控，系统能自动分析摄像机捕捉到的图像数据，当出现异常情况时，系统能自动向工作人员发出警报，从而减少安全隐患。另外，视频监控系统还可以用于基于人脸识别或手势识别叫的安全门锁，用于测量交通流量和人群拥挤程度等。图像压缩(Image compression) 在新的视频图像压缩编码中，提出了新的基于图像内容的压缩。在压缩编码过程中，视频中的场景被分割成若干个视频对象平面(VOP)，不同的视频平面根据其特点采用不同的编码策略。例如，场景中的背景在很多情况下基本上保持不变或只有很少部分的变化，这样就可以令连续的多帧图像中使用相同的编码或只有很少改动的编码来表示背景，从而大大提高了压缩效率。这种方法不仅具有很高的压缩比同时还具有良好的视觉效果，便于进行基于内容的交互和查询。但是在图像压缩编码中，要求对运动目标的分割和提取的精度非常高。 1.1.4本