手势分割方法研究综述.docVIP

  • 7
  • 0
  • 约4.28千字
  • 约 7页
  • 2017-03-12 发布于北京
  • 举报
手势分割方法研究综述.doc

手势分割方法研究综述 摘 要:手势以其自然直观的特点成为人机交互的媒介。手势识别系统中至关重要的一个环节是手势分割,使用何种方法能够较好的获取目标手势,成为计算机视觉中的研究重点和研究难点,本文总结了手势分割技术的主要方法,并针对所需要获得的目标图像提供合适的分割方法。 关键词:手势分割;轮廓模型;运动分析;肤色提取 中图分类号:TP391.41 随着计算机技术的发展,出现了物联网、信息物理系统(CPS)等新概念、新技术,人机交互技术的重要性更加凸显并成为当前信息产业竞争中的一个焦点。与传统的交互方式相比,手势以其独有的简洁、直观、人性化、信息量丰富的特点成为与计算机交互的媒介。手势分割是整个手势识别系统中的起点和关键技术之一,其分割质量的好坏直接影响到后续操作如特征提取、目标识别的最终效果。手势分割[1]可以理解为从包含手势的图像中提取出有意义地手势区域的过程,其主要特点是选取如颜色,灰度等与无意义区域有明显差异的特征,将手势区域与无意义区域分离,致使二者之间存在更为明显差异。因此对于基于内容的图像检索,对象分析等提取有用信息,必须采用分割效果较好的分割方法。作为计算机视觉中的一个重要研究内容,手势分割技术在图像处理领域有着至关重要的地位。 1 基于活动轮廓模型的分割技术 活动轮廓模型的提出给传统的图像分割和边界提取技术带来了重大突破。活动轮廓模型是指在图像域上的曲线(曲面),在图像力(内力)和外部约束力共同作用下向物体边缘靠近的模型,外部约束力是由图像数据定义的。活动轮廓模型主要由模型的描述,模型的能量函数和模型的最小化组成。基于活动轮廓模型的分割方法是一种半自动的基于先验知识和用户交互的图像分割。根据使用方式、应用曲线的类型和图像能量项的选择等,将其划分为基于变分法的活动轮廓模型和几何活动轮廓模型的分割方法。 1.1 基于变分法的活动轮廓模型分割方法 在1987年Kass,Witkin和Terzopoulos提出了Snake模型[2] ,即基于变分法的活动轮廓模型,又称为参数活动轮廓模型。它是直接以不规则排列的不连续点构成曲线或基函数构成的曲面的参数形式显式地表达曲线/曲面的演化。其工作机制是首先为给定的模型构造所需的能量函数,其次利用变分法对该能量函数极小化,最后根据获得模型演化的偏微分方程,当轮廓线到达目标边界时,能量函数达到最小值而自动停止。该模型的优点是把图像分割问题转化成泛函数求极值问题,通过合适地初始化后轮廓线能够自主地收敛于能量极小值状态,从而获得正确的边界,同时保持了边界的光滑性,降低计算复杂度。但是Snakes模型的缺点是分割的最终效果与活动轮廓的初始位置有关,需要依赖其他方式将Snake放置在感兴趣图像特征周围;当靠近曲率高的边缘时,活动轮廓线有可能收敛到局部极值点,甚至发散;其拓扑结构不易改变。 1.2 几何活动轮廓模型分割方法 几何活动轮廓模型分割方法主要是基于曲线进化的思想和水平集方法共同描述曲线进化的过程,因为采用了水平集方法而隐含有拓扑变化的能力,使得更为复杂结构的图像分割成为可能。其原理是把平面闭合曲线隐性地表示为具有相同函数值的点集,然后根据曲面的进化过程来隐性求解曲线的进化过程,嵌入的曲面总是其零水平集,因此只要确定零水平集就能够确定移动界面演化的结果。由于几何活动轮廓模型的初始轮廓线与参数特性无关,无需对曲线重新进行参数化,它是在轮廓曲线(如曲率)的几何特性的推动下运动到目标边缘,这就弥补了基于变分法的活动轮廓模型的某些缺陷,比如因为水平集方法的引入,从而可以自然的处理拓扑结构的变化。对初始位置不敏感,避免了参数活动轮廓模型必须重复地参数化曲线,提供了稳定的数值算法等优点,基于上述优点,研究学者们把几何活动轮廓模型越来越广泛的应用到计算机视觉和图像处理领域。但该模型的不足之处是仅仅利用了图像区域的灰度信息,致使图像边缘定位的精确度不高。因此目前几何活动轮廓模型分割方法研究的重点和难点是如何求解出不同的轮廓曲线能量函数,获取所需的图像分割结果。 2 基于运动分析的分割技术 视频序列中的手势图像作为一种运动目标实体是手势识别系统的研究重点和难点。视频中的运动目标分割的是指在二维连续图像序列中,将感兴趣的运动目标实体从场景中提取的过程。但是由于视频场景的复杂性,如受到光照、阴影等因素的影响,使得运动目标的分割变得困难。针对不同运动视频场景而言,目前常用于视频图像序列中的手势分割方法主要有以下几种:基于背景减法的分割方法、基于帧间差阈值的方法、基于光流场的分割方法。 2.1 基于背景减法的分割方法 基于背景减法的分割方法原理是先选取多幅图像的平均构建一个背景图像,利用当前帧图像与背景帧图像相减,进行背景消去来获得差分图像,最后通过设定阈值进行目标提取的一种检测运动区域算法。这种方法的优点在于

文档评论(0)

1亿VIP精品文档

相关文档