信控学院-lw-高效的Hessian矩阵正则化稀疏编码下的动作识别研究.docxVIP

信控学院-lw-高效的Hessian矩阵正则化稀疏编码下的动作识别研究.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信控学院-lw-高效的Hessian矩阵正则化稀疏编码下的动作识别研究

高效的Hessian矩阵正则化稀疏编码下的动作识别研究王震指导教师:刘伟峰(信息与控制工程学院)摘要:近些年来,随着在线视频的迅速发展,视频中的动作识别问题引起了广泛的关注。因此,为了使视频中的大规模数据在更易进行计算,稀疏编码算法被应用于模式识别领域。其中,Laplacian矩阵正则化稀疏编码(LR)正是稀疏编码中具有代表性的一项工作。该方法使应用于分类的图形laplacian矩阵上的流形编码的条件分布变得光滑。然而,LR可能导致较差的泛化性能,因为它把分类函数视为了常量函数。在本论文中,本文提出了Hessian矩阵正则化稀疏编码(HR)来解决基于LR识别所存在的问题。特别地,HR方法控制分类函数能够随着数据流形呈线性变化,与LR方法相比,这能够在理论上提高算法的性能。在人类动作数据库(HMDB51)上进行了大量的实验,通过与几种基准算法比较来证实了HR方法的有效性,其中包括标准稀疏编码和LR稀疏编码。关键词:人类动作识别,稀释编码,Hessian矩阵Efficient Hessian regularized sparse coding for action recognitionZhen WangTutor:Weifeng LiuAbstract:With the rapid increase of online videos, the recognition in videos has received intensive attentions in recent years. Thus in order to make the videos’ large scale data dependent models more computationally tractable, the algorithm of sparse coding has been deployed in pattern recognition. And the Laplacian regularization sparse coding (LR) is one of representative works in sparse coding, which smoothes the conditional distribution for classification along the manifold encoded in the graph Laplacian. However, it may result in poor generalization by LR, because LR biases the classification function toward a constant function. In this paper, we propose Hessian regularization sparse coding (HR) to address the problem in LR-based video recognition. In particular, HR steers the classification function that varies linearly along the data manifold, which can improve the performance contrast to LR in theoretically. Extensive experiments on Human Motion Database (HMDB51) validate the effectiveness of HR by comparing it with baseline algorithms, including normal sparse coding and LR.Key words: Human action recognition;sparse coding;Hessian一、引言如今在因特网上有几十亿个视频可以获取,并且每分钟会有大约24小时时长的视频被上传到Youtube上。因此,研究对大规模数据进行组织,总结和检索的鲁棒算法很有必要。稀疏编码目的在于学习到一个字典,同时找到关于该字典中每个元素的一个线性组合来表达观察对象,比如一幅图像或者是图像的特征。因为该算法在计算机视觉应用,比如图像去噪或图像修复上有着灵活且很有潜力的性能,它逐渐受到持续的关注。然而为了训练一个鲁棒的模型而去标注大量的图像是很昂贵的,因此基于半监督学习(SSL)的流形假设[1]被用来融合少量的已标注图像和大量的未标注图像,从而提高图像标注的性能。流形正则化通过对沿流形的回归函数进行惩罚,努力探索数据内在概率分布的几何结构

文档评论(0)

zsmfjh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档