- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
万方数据
万方数据
南京邮电大学学位论文原创性声明
本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。 尽我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表或撰写过 的研究成果,也不包含为获得南京邮电大学或其它教育机构的学位或证书而使用过的材料。 与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了谢意。
本人学位论文及涉及相关资料若有不实,愿意承担一切相关的法律责任。
研究生签名: 日期:
南京邮电大学学位论文使用授权声明
本人授权南京邮电大学可以保留并向国家有关部门或机构送交论文的复印件和电子文 档;允许论文被查阅和借阅;可以将学位论文的全部或部分内容编入有关数据库进行检索; 可以采用影印、缩印或扫描等复制手段保存、汇编本学位论文。本文电子文档的内容和纸质 论文的内容相一致。论文的公布(包括刊登)授权南京邮电大学研究生院办理。
涉密学位论文在解密后适用本授权书。
研究生签名:
导师签名:
日期:
摘要
人体行为识别是计算视觉与模式识别领域中一个重要课题,在视频监控与视频检索中有 着广泛的应用。近年随着技术进步,廉价的 RGB-D 相机(如 Microsoft Kinect)能够捕获三 维场景中丰富的时空信息。研究者建模时空交互信息,可以更便捷地学习复杂人体行为结构。
人体行为识别的早期研究工作,通常以 2D 视频作为感知数据源;但是,2D 视频提供的 信息有限,即使在没有遮挡的情况下,也会导致相对较低的识别准确率。本文使用 RGB-D 传 感器捕获 RGB 视频和深度视频,以人体姿态与交互物体的共生关系和几何约束为基础来识别 人体行为动作。首先采用人体骨架来描述行为主体,以骨架中各个节点为中心划分局部区域 边界框,将各个边界框定义为人体的各个组成部分;然后分别对各个边界框区域提取 HOG-3D 特征,并将其作为人体姿态特征;最后将人体姿态特征、物体的位置与形状特征、行为主体 与物体交互特征等特征串联组合成最终的特征向量,并将此特征作为每个行为视频段对应的 观察数据。
线性链条件随机场(Linear-chain CRFs)作为一种判决模型,广泛应用于人体行为识别。由 于其能够在时间维上捕获目标状态之间的一阶或数阶相互依赖关系,因此在对时间序列进行 标注的工作中表现出良好的预测性能。但是现有的条件随机场模型无法捕获目标状态内部的 中间表示,以及状态之间的高阶相关性。而这些信息在对复杂的行为识别场景中通常会表现 出潜在的重要性和显著性。为克服这一难题,本文提出了一种深度递归分层条件随机场模型 (Deep Recursive and Hierarchical Conditional Random Fields, DR-HCRFs)模型。该 DR-HCRFs 模型能够目标状态内部丰富的语义信息,以及目标状态之间无穷阶的相关信息。同时,为精 确推理模型以及降低模型的计算复杂度,本文提出了一种基于平均场近似(mean-field-like)理 论的模型推理方法。
最后,本文分别使用割平面(Cutting-plane),弗兰克-沃尔夫(Frank-Wolfe, FW)算法和 块-坐 标原始-对偶弗兰克-沃尔夫(block-coordinate primal-dual Frank-Wolfe, BCFW)优化方法驱动的 结构化支持向量机(Structural-Support Vector Machine, SSVM)分类器学习关于人体行为序列的 判别分类模型。通过在 CAD-120 数据集上的实验可以发现,本文提出的人体行为识别框架相 比其他先进方法表现的更为出色,且面对不同数据具有较大的扩展性。
关键词: 线性链条件随机场,深度递归分层条件随机场,结构化支持向量机,平均场近似,
块-坐标原始-对偶弗兰克-沃尔夫算法
I
Abstract
Recognizing human activities from videos is an essential issue in computer vision and pattern recognition due to its significant applications in areas such as video surveillance and retrieval. Recently, inexpensive RGB-D cameras (such as Microsoft Kinect, etc) have enabled rearchers to model the rich spatio-temporal interactions in the 3D scene for
您可能关注的文档
- 基于微量润滑的切削环境空气质量检测与分析-机械制造及其自动化专业论文.docx
- 基于时间弹性的电力负荷管理优化问题研究-管理科学与工程专业论文.docx
- 基于物联网的水产养殖监控系统设计-控制科学与工程专业论文.docx
- 基于图像底层特征的图像型垃圾邮件识别研究-软件工程专业论文.docx
- 基于力觉修正的遥操作技术研究-机械设计及理论专业论文.docx
- 基于微卫星标记的中国鱚和少鳞鱚群体遗传学研究-水生生物学专业论文.docx
- 基于微型惯性传感器腿部康复动作捕捉系统研究-控制工程专业论文.docx
- 基于无线技术的煮糖测控系统研究与实现-控制理论与控制工程专业论文.docx
- 基于无线传感器网络的温室监测系统的研究与实现-检测技术与自动化装置专业论文.docx
- 基于区位的城市停车需求预测研究-交通运输工程专业论文.docx
- 基于文化定位的大学生饮酒现况调查分析-公共卫生专业论文.docx
- 基于颜色特征的家居设计图像情感语义分类-计算机科学与技术专业论文.docx
- 基于人类基因连接组的视网膜色素变异致病基因预测-计算机科学与技术专业论文.docx
- 基于特征信息提取的目标识别算法研究-通信与信息系统专业论文.docx
- 基于网络编码的HARQ的研究及其在LTE中的应用-通信与信息系统专业论文.docx
- 基于视频的公路卡口车辆检测技术研究与实现-交通信息工程及控制专业论文.docx
- 基于数字预失真的功放性能改善研究-电子与通信工程专业论文.docx
- 基于深度神经网络的脑脊液图像识别技术研究-软件工程专业论文.docx
- 基于内调制的紫外激光通信核心技术研究-光学工程专业论文.docx
- 基于全耦合法的菜园坝长江大桥疲劳评估-土木工程专业论文.docx
最近下载
- 事业单位考试题库:城市居民委员会组织法考点、重点及试题答案-综合应用能力.docx VIP
- 网络安全等级保护.ppt VIP
- 新教材高中地理第三章环境与国家安全第四节环境保护与国家安全学案中图版选择性必修3.pdf VIP
- 2025年高考语文作文热点素材.docx VIP
- 2025年全国小学数学奥数竞赛.pdf VIP
- 材料试验机 材料试验机如何操作.docx VIP
- 含硫化氢天然气井公众危害程度分级方法 AQ 2017—2008.pdf VIP
- 第二章 匀变速直线运动的研究(大单元教学解读课件)高一物理(人教版必修第一册).ppt
- 2025年广播电视播音员主持人资格考试题库附答案.doc VIP
- 大楼结构加固施工方案.doc VIP
文档评论(0)