基于全局和局部运动模式的人体行为识别研究-计算机应用技术专业论文.docx

基于全局和局部运动模式的人体行为识别研究-计算机应用技术专业论文.docx

  1. 1、本文档共57页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
研究生优秀毕业论文 3.1模型框架 3.1模型框架 19 3.1.1行为表示模型 一19 3.1.2分类器模型 一20 3.2全局运动模式法 2l 3.2.1时空兴趣点检测 ..22 3.2.2时空兴趣区域检测 ..23 3-2.3基于ROI预测的全局运动模式提取 23 3.2.4基于DTW的全局运动模式行为识别 ..27 3.3局部运动模式法 29 3.4本章小结 31 第4章实验结果与分析 33 4.1数据库 33 4.2实验结果 34 4.2.1 Weizmann库实验结果 34 4.2.2 UCF库实验Z.1#4口-果 .35 4.2.3 multiple cameras fall库实验结果 36 4.3算法时耗分析 37 4.4参数对实验结果的影响 38 4.5本章小结 40 第5章总结与展望 41 5.1总结 41 5.2展望 4l 参考文献 .43 致谢 .49 攻读硕士期问发表的论文 .51 Ⅱ 万方数据 摘要基于全局和局部运动模式的人体 摘要 基于全局和局部运动模式的人体 行为识别研究 计算机应用技术专业硕士研究生唐小琴 指导教师肖国强教授 摘要 随着计算机技术的迅速发展,图像和视频数据的海量增长推动着计算机视觉 研究和应用的不断发展,同时也促进了模式识别,人工智能和机器学习等相关领 域的发展。人体行为识别作为计算机视觉领域备受关注的研究方向,被广泛应用 于智能视频监控、病人监护系统、人机交互、虚拟现实、智能家居、智能安防和 运动员辅助训练等,具有广泛的应用价值和前景。尽管当前行为识别的研究取得 了一定进展,但由于人体行为识别的复杂性,如背景杂乱、摄像机快速移动,以 及人体外貌、姿势和尺度等变化,导致人体行为识别面临更大的困难和挑战。 传统基于兴趣点的行为识别方法通过提取底层特征(如HOF,HOG和 3D—SIFT等描述子)获取视频的局部信息,并构建基于语义的bag.ofwords模型用 于生成行为的特征向量。这种方法的优点是不需要对视频进行预处理提取运动对 象,进而不易受图像预处理结果的影响,且对噪声或干扰等因素不敏感,但其缺 点是计算复杂度高,特别在训练过程中需要耗费大量时间构造字典模型。本文关 注兴趣点的轮廓信信息和运动信息,提出一种基于运动模式的人体行为识别方法。 本文的主要工作包括:1)采用现有的兴趣点检测方法(Dollars角点检测方法)提 取视频中的时空兴趣点,采用本文方法提取运动模式(movement pattern.MP), 该运动模式包含顶层的全局运动模式(global pattern,GMP)和底层的局部运动模 式(10cal movement pattern,LMP);2)在基于GMP的方法中,通过提取视频立 方体中的时空兴趣区域(region ofinterest,ROI),采用kalman滤波对ROI进行预 测,提取全局运动模式,并进行动态时间规整(dynamic time warping,DTW)。 在模式匹配阶段使用字交叉参考模板(cross.words reference templates,CWRTs)方 法对训练模式进行规整生成参考模式并使用距离度量对其进行识别;3)在基于 LMP的方法中,ROI内的兴趣点轨迹与加权平均运动速度用于表示ROI的局部运动 模式,通过自适应层次聚类算法产生局部参考运动模式,并采用模式匹配方法对 其分类和识别。 在训练过程中,首先构建一个具有两层结构的分类器模型:顶层包含多个非 混淆行为分类器和混淆行为分类器,而底层则包含基于顶层每个混淆行为分类器 万方数据 西南大学硕士学位论文构建的多个非混淆行为分类器。非混淆行为分类器定义:只包含一类行为的分类 西南大学硕士学位论文 构建的多个非混淆行为分类器。非混淆行为分类器定义:只包含一类行为的分类 器定义为非混淆行为分类器。混淆行为分类器定义:分类器包含多类易混淆,相 似度高的行为,这样的分类器定义为混淆行为分类器。对于任何一个行为,首先 采用顶层的GMP描述方法及其识别方法对其进行识别,若识别结果为非混淆类, 则结束识别过程:若识别结果为混淆类,则继续采用底层的LMP描述方法及识 别方法对其进tf--次识别,从而将其识别为底层的非混淆类。 将本文的方法在标准视频库Weizmann库和UCF库中进行验证和测试,并在 multiple cameras fall视频库中对跌倒行为进行了识别,其识别率分别为93.O%、 88.4%和93.5%。实验表明本文的方法在保证识别率的前提下,较传统基于多种底 层特征(如HOF,HOG和3D.SIFT描述子)描述的bag.of-words方法计算量更小, 耗时更少,具有更好的实时性。论文最后对算法参数进行分析,讨论了三种不同 参数对实验结果的影响。 关键

您可能关注的文档

文档评论(0)

peili2018 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档