- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于改进AP聚类算法人脸标注技术研究
基于改进AP聚类算法的人脸标注技术研究
摘要: 利用网络新闻图像以及与图像相关的文字说明构造一个有人名标注的人脸库。人脸库中的人脸通过对新闻图像进行人脸检测得到,人名从与图像相关的文字说明中提取得到。通过一个聚类过程得到人脸与人名之间的对应关系,并通过一个合并聚类的过程可以识别出同一个人的不同名字。对AP聚类算法进行改进,实验表明相比于k-means与AP算法,改进的AP聚类算法能充分利用网络新闻图文互补的特性,从而得到更准确的人脸与人名对应关系。
关键词:
中图分类号: TP391.4 文献标识码:A 文章编号:2095-2163(2011)01-0035-04
0引言
现实世界中存在许多图像与文本相关联的数据,网络新闻是一个很典型的例子。在这种图文并茂的数据中,图像与相关联的文本是相互补充的,利用这种图文互补特性可以挖掘很多重要信息。如果能将网络新闻图像中出现的人物用其名字进行标注,就可以将图像检索[1-2]问题转化为文本检索[3]问题,从而可以很好地解决人物检索这一问题。采取手工标注的方法是有效的,但是多媒体和网络技术的迅速发展使得图像库越来越大,完全使用手工标注,工作量太大。网络新闻数据如图1所示,图像右侧是与此图像关联的文字说明。本文的基本任务是对新闻图像中出现的人脸用人名进行标注。
虽然人脸识别[4]的研究已经很成熟,但是很难对图1中的人脸进行识别。因为图1中的人脸图像来源于网络,人脸的姿势、表情、光照等情况以及图像采集设备差别很大,比实验室条件下采集的图像数据要复杂很多。而现有的人脸识别系统在实验室环境下性能较好,在真实世界环境中的性能却较差。此时可以利用与图像相关联的文字说明中出现的人名对人脸进行标注,但是从图1可以看出图像中可能出现多个人脸, 与图像相关的文字说明中也可能出现多个人名,并且图像中出现的人脸有可能没有人名与其对应,或者文字说明中出现的人名在图像中却没有人脸与其对应。
本文提出了一个可以很好解决此问题的方法。最终得到一个有人名准确标注的人脸图像数据库,对人脸图像的标注如图2所示。
对网络新闻数据处理的过程如图3所示。从新闻数据中提取出人脸图像与人名,经处理后,通过一个聚类过程,得到人脸与人名之间的对应关系。
Tamara L.Berg等人通过基于k-means聚类的方法[5]得到人脸与人名之间的对应关系。然而基于k-means聚类的方法在计算图像相似度时,完全根据图像内容信息提取特征进行相似度计算,忽略了与图像相关联的文本信息;同时k-means聚类需要事先指定聚类个数并且聚类结果受初始聚类中心选择的影响较大。本文对AP聚类算法进行改进,计算图像相似度时,不仅考虑到图像内容信息,还考虑到与图像相关的文本信息。结合图像内容信息与文本信息能够更准确地给出图像相似度,从而使聚类结果更准确。同时AP聚类算法将每个样本点都看作是候选的类代表点,且聚类前不需要指定聚类个数。实验证明处理图文并茂的数据时,协同使用图像与文本信息是很重要的,改进的AP聚类算法在处理此类问题时具有明显的优越性。
本文第一部分对从网络上获取的新闻数据进行预处理;第二部分通过改进的AP算法对人脸图像聚类,并且引入k近邻模型对聚类进行修剪;第三部分将聚类后的人脸图像用人名标注,并通过合并聚类识别出同一个人的不同名字;第四部分对实验结果进行了分析。
1新闻数据预处理
1.1人脸检测与人名提取
本文采用了Viola提出的积分图像的概念和基于Adaboost训练人脸检测分类器[6-8]的方法对网络新闻图像进行人脸检测。通过命名实体识别从与新闻图像相关的文字说明中提取出人名,得到一个人名词典。从新闻图像中检测出的每一个人脸都与若干个从对应的文字说明中提取出的人名有关。本文的任务是用正确的人名对每个人脸标注。
1.2人脸图像标准化
由于人脸图像来源于网络,其姿势、表情及光照变化较大。在对人脸图像进行特征提取之前,需要进行几何归一化与灰度归一化处理。几何归一化是指根据人脸定位结果,将图像中人脸变换到同一位置和同样大小。灰度归一化是指对图像进行光照补偿等处理,光照补偿能够一定程度上克服光照变化的影响。
1.2.1几何归一化
人脸部位在图像中的位置、大小、偏移情况不同,会影响人脸特征的提取以及后续的聚类工作,因而要对人脸进行校正,以使不同的人脸图像最后都统一到同样的大小,并使人脸的关键部位在图像中的位置也尽量保持一致。几何校正主要包括:大小校正、平移、旋转和翻转等。在进行人脸校正前,需要进行人脸关键点检测,尤其是人眼的定位。
根据垂直灰度投影与水平灰度投影,大体可以确定特征点的位置。确定特征点以后就可以进行几何校正。假定人脸图像左、右两眼
您可能关注的文档
最近下载
- 深发展银行黄金td业务开户流程 深发展银行贵金属递延业务开户流程_.ppt VIP
- 中国国家标准 GB/T 40344.3-2024真空技术 真空泵性能测量标准方法 第3部分:机械增压泵的特定参数.pdf
- 固定资产盘点流程和方案.docx VIP
- 第6章细菌的感染与免疫.ppt VIP
- 【医脉通•指南】左卡尼汀在男性不育中临床应用专家共识(2014版).pdf VIP
- 高考英语语法新视角(中级英语测试指导).doc VIP
- 2020年最新版下肢静脉曲张临床路径.docx VIP
- 教育行为模式识别-洞察及研究.docx VIP
- 第12课《鱼纹话吉祥》教学课件-2024-2025学年岭南美版(2024)初中美术七年级上册.pptx VIP
- 特种设备安全总监职责.doc VIP
文档评论(0)