- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于大数据内容标签近似图像搜索算法研究
基于大数据内容标签近似图像搜索算法研究
摘 要: 准确计算图像多特征距离成为大数据时代影响基于图像的内容标签的一个关键问题,对基于内容的图像检索技术至关重要。在借鉴欧氏距离和高斯归一化两种方法的优势的基础上,对高斯归一化算法进行改进,提出一种基于特征距离纠偏的多特征距离计算算法。该算法首先采用欧氏距离法计算定量特征距离,然后利用改进高斯归一化法完成距离纠偏,最后通过自由设定权重得到最终的图像多特征距离。与传统高斯归一化算法进行比较,实验结果表明,利用该算法既能有效得到特征间的定量距离,又能方便地把多个特征的地位均衡,从而达到提高相似图像搜索质量的目标。
关键词: 大数据; 内容标签; 图像检索; 高斯归一; 欧氏距离
中图分类号: TN919?34; TP391 文献标识码: A 文章编号: 1004?373X(2016)16?0058?03
Abstract: The accurate calculation of image’s multi?feature distance is a key problem in big data era, which influences on the image? based content label, and plays an important role in content?based image retrieval technique. On the basis of the advantages of Gaussian normalization method and Euclidean distance method, the Gaussian normalization method is improved, and a multi?feature distance calculation (C?GN) algorithm based on feature distance rectification is presented. The Euclidean distance method is used in the C?GN algorithm to calculate the quantitative feature distance, and then the improved Gaussian normalization method is used to rectify the distance. The image’s multi?feature distance is obtained through the free weight setting. The experimental results show that, the algorithm can not only effectively obtain the quantitative distance among the features, but balance the status of multi?features conveniently, which improve the search quality of similar images.
Keywords: big data; content label; image retrieval; Gaussian normalization; Euclidean distance
0 引 言
随着互联网和多媒体技术的迅速发展,大数据[1?2]时代已经到来,多媒体信息资源呈指数增长,基于内容的标签体系应运而生。为了从大量的图像信息中快速、准确地找到需要的内容,传统的基本文本的图像检索已经远远不能满足人们的需求,基于内容的图像检索技术[3?5]引起了国内外众多学者的关注。图像内容实质上就是图像中所包含对象的特征(如颜色,形状)等,这些特征决定了图像的特性,也成为区别其他图像的关键因素。相似图像区分的越精确,基于内容的图像检索准确度也就越高。因此,如何精准区分相似图像,准确计算图像多特征距离成为影响图像检索质量的一个关键问题。
通过对多个特征进行聚类[6?7]分析,使用K?mean等类似的聚类算法可以得到相似特征集合,但不能得到定量特征距离成为使用该方法的制约因素;直接使用广义欧氏计算公式[8?10]ED(Euclidean Distance) 进行多特征整合,虽然能定量得到特征的距离,但是,由于多个特征之间的地位不平等,需要进行大量的试验确定权重。使用高斯归一法GN(Gaussian Normalization)[11?13]计算多特征计算距离,是一种简单、高效的方法,但由于对特殊距离进行模糊
原创力文档


文档评论(0)