- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
图像论文:基于多特征集成及图像自动标注方法研究
图像论文:基于多特征集成的图像自动标注方法研究
【中文摘要】随着数码设备和计算机网络的发展及广泛应用,数字图像在计算机中的存储量呈爆炸式的增长。为了实现计算机对海量图像的自动管理,图像检索特别是图像自动标注成为近年来研究的重点和热点。针对图像的多标注问题和“语义鸿沟”问题,本文研究使用多特征集成的图像自动标注方法,以进一步提高图像自动标注的性能。本文的主要研究内容和创新点如下:(1)为解决传统图像标注中标注词与图像区域之间缺乏对应关系的问题,本文在对未标注图像进行标注之前,引入分割算法将图像划分成若干个图像区域,并对每个图像区域分别进行图像自动标注的策略,使图像区域与标注词之间建立起一一对应的关系。(2)鉴于目前图像自动标注中只有少量已标注样本的实际情况,本文采用半监督学习方法思想来建立标注模型。该方法同时将已标注样本和未标注样本用于机器学习中,并利用图像底层视觉特征空间的分布信息,来度量未标注图像到各标注词之间的视觉特征距离,从而为未标注图像选择标注关键词。(3)针对图像自动标注系统多采用单个分类器,从而导致标注准确率较低问题,本文研究并提出基于多特征集成的图像自动标注算法EMDAIA。该算法将图像自动标注问题看作是图像的多分类问题,构造并集合多个分类器的分类结果,选择出现概率最大的预测词来对图像进行标注。EMDAIA使用LabelMe图像数据库进行实验,实验结果表明,EMDAIA比仅使用单一特征进行图像自动标注的准确率提高了约10%。(4)研究并提出一种基于感兴趣区域的图像自动标注方法ROIAIA,该方法在对未标注图像进行标注前,先采用Itti模型提取图像的感兴趣区域,然后对提取的感兴趣区域进行标注。实验表明,基于感兴趣区域的图像自动标注能有效地减少图像次要区域对主要区域的影响,将图像自动标注的注意力集中到用户感兴趣的图像区域。(5)研究了特征子集的选择对图像自动标注性能的影响,对提取的10种视觉特征选择后组合成10个不同的特征子集,在PASCAL VOC 2008图像数据库上进行实验,结果表明:使用多特征集成可以提高分类器的分类性能,8种视觉特征构造特征子集时图像标注的平均准确率最高,继续增加特征的种类反而会降低标注结果的准确率。
【英文摘要】With the development of digital equipment and computer network, the number of digital images is growing dramatically. In order to manage the large volumes of digital images automatically, various image retrieval techniques, especially image automatically annotation algorithms, draw a lot of attentions in recent years. Aiming at handling the problem of multiple annotations and搒emantic gap攐f images, this paper investigates how to utilize multiple visual descriptors to improve the performance of automatically image annotation.The major contents and contributions of this paper are:(1) In o rder to cope with the problem of lacking linkages between images regions and label keywords, this paper employs a Normalized Cuts algorithm to segment each image into image regions before annotation, and then uses an image annotation strategy on each image region respectively, so as to create one-VS-one linkages between image regions and label keywords.(2) As currently only limited labeled samples are available while a large amount of unlabeled samples exist in
文档评论(0)