- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于双线性建模及隐马尔可夫模型步态识别算法
基于双线性建模及隐马尔可夫模型步态识别算法
摘要:针对存在两个未知隐含特性的步态识别问题提出了一种新的识别算法,将特性分别看作“内容”和“风格”,对图像序列以状态确定的连续HMM―EM估计“内容”类型,引入非对称双线性模型理论对结果建模,通过SVD和NN聚类实现对“风格”的归类判定。实验选择人体两侧轮廓到质心垂线距离作为步态特征,通过在CASIA步态库上的实验证明,该算法能有效提高判别率,对未知风格或内容类型判断有较好的适应性。同时对影响步态识别准确性的其他因素也做了讨论。
关键词:非对称双线性建模;期望值最大化;隐马尔可夫模型
中图分类号:TP391.4文献标识码:A
文章编号:1001-9081(2007)04-0897-04
0引言
步态识别旨在根据人们走路的姿势进行身份识别[1],具有难于隐藏性,可远距离、非接触性地识别,广泛适用于多种智能监控场合。
步态识别的研究可分为两类:一类主要依赖于运动人体轮廓形状所产生的统计时空模型,如文献[2,3]提出的利用步态序列图像光流的频率和相位信息进行步态识别。文献[4]利用人的二值化图像的侧面外轮廓宽度矢量作为图像的特征,利用K近邻方法进行步态的分类识别。文献[5]综合利用多种特征的融合进行步态识别的研究。文献[6]采用运动能量图像(MotionEnergyImages,MEI)和运动历史图像(MotionHistoryImages,MHI)来解释图像序列中人的运动。
另一类是基于人体模型和运动模型的,例如文献[7]的方法取了四个静态参数用于身份识别,即体长、躯干长、腿长和步长。文献[8,9]将人体分成7个部分,用椭圆对每一部分建模,对每一帧形成合计29个待定参数。通过图像序列中各帧特征参数获得步态特征。文献[10,11]将大腿建模为链接的钟摆,并从大腿移动及旋转得到倾斜角度信号的频率分量中获取步态特征。文献[12]通过层次化的人体形状及运动模型估计生成具有标准人体比例的通用形状模型。文献[13]综合人体静态与动态生物特性,结合两种特征表示提高身份识别性能。
两类方法各有利弊,基于模型的方法只利用了身体(或图像数据)的部分信息,而基于统计的方法则不能很好地表现出人类视觉对步态的感知。
文献[14,15]的研究表明,利用步态进行身份识别的方法中,涉及到计算机视觉的问题包括:人体时间特性匹配与比较、背景分割和人体形状提取、人体动作及动力学建模以及图像融合。好的人体建模方法能有效反映出人体步态的时间及空间特性,突出不同人之间的差异,提高识别率。
步态图像分析需要经过特征训练和数据判别两个步骤,步态数据受很多条件影响,如环境(室内/室外等)、行走姿态(慢走,快步走,跑步,持物体等)、拍摄角度以及光照等。目前提出的步态识别算法对多变环境得到的步态图像缺乏识别能力。本文借鉴并拓展了双线性建模思想,为步态图像序列含的两个隐含要素归类为“内容”和“风格”,通过固定状态的连续HMM估计内容类别,归类结果作为建立非对称双线性模型的依据,利用SVD分析风格参数,根据NN聚类对风格分类。实验选择人体轮廓两侧到质心垂线距离作为步态特征,通过在CASIA步态库上的实验证明该算法能有效提高判别准确性,对影响步态图像的因素如人体运动姿态、拍摄角度等,有较强的适应。
1双线性模型
1.1双线性建模理论
模式分析问题中,得到的观测数据常常是多个隐含要素共同作用的结果。例如特征识别过程对不同字体书写的文件进行识别,或对不同人在不同光照和不同角度条件下拍摄的人脸图像进行识别等。其中每个要素的数据在没有附加说明或进一步处理时,无法直接由数据获得。模式分析需要经过特征训练和数据判别两个步骤,在特征训练过程中,要想对所有隐含要素可能的组合结果作训练几乎是不可能的,但可以对每个要素单独进行训练。因此,需要找到一种从观测数据中分离出独立要素分别加以判别的方法。
文献[16,17]认为,图像多种要素及要素间可以建立关系数据模型(称为多线性模型―multilinearmodels),其中仅对两个要素及其相关性建立的模型称为双线性模型(bilinearmodels),两个互相独立的要素称为“内容”(content)和“风格”(style)。如不同字体(style)书写的不同的文字(content)、不同光照(style)下的不同人脸(content)等。每幅图像都是内容与风格的综合体现,用函数可表示如下:
Tenenbaum将这一理论成功应用于文字识别,实现了对类似旧字体书写的未知文字、已知文字采用的未知字体以及未知字体书写的未知文字的判别。此外他还将其理论应用于语音识别。
1.2理论推广
步态识别过程中,常常
文档评论(0)