基于视觉体感交互人体动作识别系统研究.docVIP

下载本文档

34
0
约3.81千字
约 9页
2018-08-30 发布于福建
举报
版权申诉

基于视觉体感交互人体动作识别系统研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于视觉体感交互人体动作识别系统研究

基于视觉体感交互人体动作识别系统研究　　摘要：基于视觉的体感交互人体动作识别是由图像处理、计算机视觉、模式识别、机器学习、人工智能等多个学科交叉组合而成的研究课题。该文通过采用改进创新的人体检测算法，模板匹配算法，在结合人体目标Meanshift跟踪算法的基础之上，通过模板匹配算法将所提取数据与虚拟环境对应创新人物模型取得关联，从而完成本系统的研究目标，达到人体基本动作识别，人动而虚拟环境模动的效果。　　关键词：虚拟环境；体感交互；计算机视觉；人体动作识别　　中图分类号：TP18 文献标识码：A 文章编号：1009-3044（2018）01-0193-02 　　随着计算机网络和视频图像采集设备的快速发展和普及，图像已经成为我们日常生活中的重要载体之一，同时图像的数据量呈现爆炸式的增长，时时刻刻都会有数以万计的新内容产生，所以，如何更加准确，更加迅速的获取图像中的各种信息，尤其是人体肢体动作信息以及其他相关领域的研究，就成为了一个亟待解决的关键性问题。　　人机交互技术也逐渐从过去以计算机为中心的键盘鼠标交互方式转变为如今以人为中心的新型交互模式，人机交互使得用户自身可以通过肢体动作直接与计算机进行互动，也让我们的计算机能够更加聪明，更加自然地去感知这个世界，本文系统的研究将人机交互技术与计算机视觉领域的图像处理有机结合，通过固定位置的视频图像采集设备，实时获取用户的肢体动作图像数据，通过人体检测，跟踪以及模板匹配相关算法，对所获取数据进行解释分析，以达到人体动作识别基本的功能需要。　　1 虚拟环境人体动作识别方法　　基于视觉的人体动作识别感应系统相应控制流程如图1所示，分为人体运动目标检测，人体运动目标跟踪，模板匹配以及虚拟环境模拟四个大的部分，目标检测部分采用基于二次连通域处理的人体检测方法，目标跟踪部分采用的是被广泛应用于计算机视觉和模式识别领域的Meanshift算法，图像模板匹配部分本系统采用改进SIFT算法，在虚拟环境交互部分，由虚拟现实引擎，如Denlta3D，Uity3D等对所接收到的人体动作模板匹配数据进行解释，然后发出相应控制命令，实现对虚拟环境的交互控制，达到人动模动，模拟真实用户动作的效果。　　2 人体动作感应识别系统原理综述　　2.1 图像人体运动目标获取检测　　对于图像而言，背景的复杂化会对人体检测产生干扰，如产生图像噪声，图像空洞等，由此本研究应用基于二次连通域处理的人体目标检测算法，整体上先用三帧差法来提取我们研究所需的运动目标，三帧差法公式：　　是当前帧对应的像素灰度值大小，满足上式的像素点我们就可以定义为运动的点，其中是算法设定的阈值。　　得到二值图像后，对二值图像进行膨胀腐蚀处理，针对腐蚀膨胀而言，转化为集合的运算算法较为简单，在硬件上易于实现的前提下，也更加的适合于并行处理，常常被应用于图像分割，边缘提取以及对二值图像进行细化等，我们不可以忽视的一点是，场合与探针并不一定总是一一对应，同理，结构和运算方法也不尽相同，场合不同，对应的我们设计的结构元素，运算方法也会不同，这也常常是影响待处理图像效果的关键。再就是运用连通域三次扫描标记法等来去除空洞的同时也将断开的区域相应的连接起来，简而言之，三次扫描标记法判断和标记进行的工作就是对各个点进行标记，逐个判断，如果是我们理论意义上的目标点，则查看标记并更新。　　那么如何来判断运动目标是我们系统研究所需要的人体，本研究采用的是HOG特征训练分类器，总的来说，它是一种基于梯度，基于边缘的直方图方法，相应的，直方图显示了方块内所有像素方向梯度，考察各个待测窗口，由BLOCK到CELL网格，再将得到的CELL图像梯度投影到各个方向，就能得到我们研究所需的方向直方图，最后将CELL直方图集合起来，再归一化处理，就能得到HOG特征向量。　　2.2 图像人体运动目标跟踪　　本文系统研究采用的是Mean Shift 跟踪算法，含义也就是我们通常所说的均值偏移向量。时代在进步，Mean Shift也逐渐演变为了一个具体的迭代过程，先通过计算，得到我们当前研究点均值偏移量，以其值大小来变换其位置，再将到达新位置的点作为我们计算中新的基准，继续进行我们的均值偏移的计算。对上述迭代过程进行不断重复，当结果达到我们实验所设定的预设界限时则停止，因为这种方法的核心特性是一种核函数密度估计的无参数估计，所以能够使概率密度沿着相应的梯度方向，高效的收敛。　　运用 Mean Shift 算法，首先应当选择适当的目标模型，同时，还要在候选目标区域中，正确的建立起候选模型，再计算上述两种模型的匹配系数，根据结果进行迭代，直到找到新的目标中心为止，达到我们跟踪的目的，流程简述如下：　　（1）读入视频，分析得出第一