- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
人脸识别技术大总结
人脸识别技术大总结——FaceDetectionAlignmentXX-04-08 搞了一年人脸识别,寻思着记录点什么,于是想写这么个系列,介绍人脸识别的四大块:Facedetection,alignment,verificationandidentification(recognization),本别代表从一张图中识别出人脸位置,把人脸上的特征点定位,人脸校验和人脸识别。在opencv中早就有直接能拿来用的haar分类器,基于Viola-Jones算法。但是毕竟是老掉牙的技术,Precision/Recall曲线渣到不行,在实际工程中根本没法给boss看,作为MSRA脑残粉,这里介绍一种MSRA在14年的最新技术:JointCascadeFaceDetectionandAlignment是给你一张脸,你给我找出我需要的特征点的位置,比如鼻子左侧,鼻孔下侧,瞳孔位置,上嘴唇下侧等等点的位置。如果觉得还是不明白,看下图: 图中红色框框就是在做detection,白色点点就是在做alignment。 如果知道了点的位置做一下位置驱动的变形,脸就成正的了,如何驱动变形不是本节的重点,在此省略。 首先介绍一下下面正文要写的东西,由于干货非常多所以可能会看着看着就乱了,所以给出框架图: ================================= 废话说了这么多,正文开始~ detection 作者建立了一个叫postclassifier的分类器,方法如下: 1.样本准备:首先作者调用opencv的Viola-Jones分类器,将recal阀值设到99%,这样能够尽可能地检测出所有的脸,但是同时也会有非常多的不是脸的东东被检测出来。于是,检测出来的框框们被分成了两类:是脸和不是脸。这些图片被resize到96*96。 2.特征提取:接下来是特征提取,怎么提取呢?作者采用了三种方法: 第一种:把window划分成6*6个小windows,分别提取SIFT特征,然后连接着36个sift特征向量成为图像的特征。 第二种:先求出一个固定的脸的平均shape,然后以这27个特征点为中心提取sift特征,然后连接后作为特征。第三种:用他们组去年的另一个成果FaceAlignmentat3000FPSviaRegressingLocalBinaryFeatures(CVPR14),也就是图中的3000FPS方法,回归出每张脸的shape,然后再以每张脸自己的27个shapepoints为中心做sift,然后连接得到特征。 3.分类:将上述的三种特征分别扔到线性SVM中做分类,训练出一个能分辨一张图是不是脸的SVM模型。 紧接着作者将以上三种方法做出的分类器和初始分类器进行比对,画了一个样本分布的图: 这个图从左到右依次是原始级联分类器得到的样本分类分布和第一种到第三种方法提取的特征得到的样本分类分布。可见做一下shapealignment可以得到一个更好的分类效果。但是问题来了:如果把所有的windows都做一下alignment,即使是3000facespersecond的速度一张图可能也要处理上1秒,这无法满足一般一秒30帧的实时需求。作者也说,用opencv分类器,参数设成99%的recall率将会带来很严重的效率灾难——一张图能找出来3000个框,处理一张图都要好几秒。 这么渣的效率可咋办呢?以上内容已经证明了alignment确实对detection的 preciseness有帮助,这就够啦,对下面的工作也是个启发——能不能在做detection的同时把alignment做了呢?alignment的中间结果是否能给detection带来一些帮助呢?后面慢慢讲。先说两个通用的面部检测和矫正的模型: 1.级联检测分类器:不失一般性,一个简单的级联分类器是这样的: 图中的Ci代表的是第i个弱分类器。x代表的是特征向量,f代表分类得分。每个Ci会根据自己的分类方法对x输出一个分类结果,比如是一张脸或者不是一张脸,而fn:这里介绍的是另一个人在10年发的文章:CascadedPoseRegression(CVPR10),给图像一个初始shape,然后通过一次一次的回归把shape回归到正确的地方。算法结构很简单,但是效果确实非常好: 回归过程如下:首先提取特征,原作者采用的是Pose-Indexedpointfeatures,然后根据特征训练回归函数,原作者采用了一个叫RandomFernRegressor的东西,这里翻译成随机蕨好了,然后假设蕨内特征是相关的,蕨间特征是独立的,这样从统计学上随机蕨是一个完整的把朴素贝叶斯分类器,让计算变
原创力文档


文档评论(0)