基于光流与概率上下文无关文法人行为研究.docVIP

基于光流与概率上下文无关文法人行为研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于光流与概率上下文无关文法人行为研究

基于光流与概率上下文无关文法人行为研究   【摘 要】文中提出了一个基于光流和概率上下文无关文法的人的视频序列的运动行为的分析方法。首先,采用自适应混合高斯模型来提取背景,然后采用形态学方法确定目标前景的轮廓。使用光流确定视频序列中的关键帧,并对关键帧的前景轮廓进行概率上下文无关文法分析。 【关键词】人体行为识别 光流 概率上下文无关文法 一、引言 人的运动行为视觉分析是利用计算机技术,从包含人的视频图像序列中,检测、分类、跟踪人,并对其行为进行理解与描述[1]。由于其在视频监控,高级人机交互,虚拟现实,视频检索,体育运动分析,动画和游戏设计,医疗诊断等领域的广泛的应用前景,运动行为视觉分析已经成为当前计算机视觉的一个研究热点。 基于视频的行为分析主要包括行为的描述与识别两个基本问题[2]。行为描述方法根据分析对象的层次,可以分为基于低层图像信息的方法和基于高层人体结构的方法。基于底层图像信息的方法可以快速鲁棒地获取特征,但无法处理复杂的行为;基于高层人体结构的方法可以描述复杂的行为,但是特征获取比较困难。行为识别算法根据其处理方法的不同,分为基于模板匹配的算法和基于状态空间的算法。基于模板匹配的算法计算量少,但是对行为的时间间隔很敏感;基于状态空间的算法则需要复杂的模型训练。 目前,人的运行行为分析的研究仍然处于一个初级阶段,有很多困难难以解决,具体体现在[3,4]:复杂场景下行为的实时识别,上下境指导下的行为理解,多视角下行为的分析,不同系统的性能评估标准等方面。 本文提出了一个基于光流和概率上下文无关文法的人的视频序列的运动行为的分析方法。 二、算法描述 (一)背景的提取 在本系统中,采用自适应混合高斯模型来对背景建模。高斯背景模型是由Stauffer等人提出的经典的自适应混合高斯背景提取方法。根据视频序列中每个像素在时域上的分布情况,构建出各个像素的颜色分布模型,依次来达到背景建模的目的。混合高斯背景模型是有限个高斯函数的加权和,它能描述像素的多峰状态,适用于对复杂的背景进行准确建模[5-7]。 (二)通过前景轮廓的提取确定目标的姿态 自适应混合高斯背景提取出背景后,前景区域也可求出。不过,受噪声的影响,获得的前景区域不能直接使用,需要利用形态学的开闭操作减少前景噪声,并对现有的大量小区域进行前景连通,提取并合成轮廓,从而提取出感兴趣的目标轮廓区域,作为观测到的目标姿态[8]。 (三)行为的定义 在本文中,行为A被看作是特定场景下人的特定姿态的组合,其中为观测到的各种姿态。比如,“夹菜吃”这个行为,可以分解为以下一些姿态的有序组合:手握筷子――抬起手――筷子放到盘子上――筷子抬起――筷子放到嘴边――筷子放下。 在整个行为当中,描述筷子在空中这个阶段的视频帧很多,我们不必选取所有的帧,而只需要选择其中的关键帧,用于对行为的定义和描述。 (四)关键帧的提取 我们采用前景点的光流的平均值取极小值的那些视频帧作为关键帧[9]。对于视频帧,计算出它们对应的光流向量函数,定义前景点的平均光流偏差为: 其中是视频帧中前景点的数量,是视频帧中的平均光流向量。序列中的极小值对应的帧,即为关键帧。 光流是空间运动物体的像素运动的瞬时速度。光流法是利用图像序列中像素在时间域上的变化以及相邻帧之间的相关性来找到上一帧跟当前帧之间存在的对应关系,从而计算出相邻帧之间物体的运动信息的一种方法。对于前景点来说,运动的速度矢量变化越剧烈(表现为越大),表明前景物体的姿态越不稳定,处于过度阶段;运动的速度矢量变化越平缓(表现为越小),表明前景物体的姿态越稳定,该姿态在视频中占有的比例越大,也就越重要。因此,我们用的极小值作为关键帧选取的标准。 (五)概率上下文无关文法分析 对于一个行为A,假设它由K个关键帧的姿态构成,。其中,的前景轮廓为。我们要根据提取出来的关键帧中的前景轮廓,分析判断该行为是否存在。 假设关键帧有l个,分别为,对应的前景轮廓为。则对应于姿态的概率定义为 其中为两个轮廓的匹配函数,两个轮廓包含区域相交部分的面积占比越大,匹配值越接近于1。 我们真正感兴趣的概率是,即。根据贝叶斯法则,有 简单起见,假定所有的都相同。 事实上,是无法求出来的,而该概率只体现在一个全局常量因子的计算当中。因此,我们忽略到,用来代替。 这样我们就构建好了一个概率上下文无关文法[9]。 建立好概率上下文无关文法之后,我们可以通过句法分析方法,求出最大概率的行为分析结果。 三、实验结果及分析 采用本文提出的算法,与本人按照文献[9]中的实现的算法,对相同的视频做对比,得到以下实验结果。(视频

文档评论(0)

docman126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档