基于Hadoop分布式计算图像检索方法.docVIP

下载本文档

4
0
约5.04千字
约 10页
2018-08-28 发布于福建
举报
版权申诉

基于Hadoop分布式计算图像检索方法.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于Hadoop分布式计算图像检索方法

基于Hadoop分布式计算图像检索方法　　摘要：针对传统单节点的基于内容的图像检索方法计算速度较慢，检索效率不高的问题，提出了一种基于Hadoop分布式计算的图像检索方法。首先提取出图像的颜色、纹理和形状特征用于表示图像，在检索阶段将检索任务分配到各个Map子节点，所有的Map结果根据相似度非减进行排序，并将前N个结果进行输出。实验结果表明，该方法有效地利用了云计算平台的并行处理能力，相比较单节点的图像检索方法，提高了CBIR方法的运行效率。　　关键词：图像检索；分布式计算；Hadoop 　　中图分类号：TP393 文献标识码：A 文章编号：1009-3044（2015）17-0153-02 　　Image Retrieval Based on Hadoop Distributed Computing 　　LIANG Xin-ran1， LIANG Peng2， ZHOU Hai-tao1， ZHOU Jian-xiong1， ZHOU Yi-shu1， LAO Xue-li3 　　（1.China Mobile， South Base， Guangzhou 510640， China；2.School of Computer Science， GuangDong Polytechnic Normal University， Guangzhou 510665， China；3.Bingosoft Development Corporation Limited， Guangzhou 510663， China）　　Abstract： Aiming at the problem of inefficiently of traditional content based image retrieval method， this paper proposes an image retrieval method based on hadoop distributed computing. We first extract color features， texture features and sharp features from image dataset. Then， the retrieval job will be distributed to all map services and all retrieval results will be sorted according to matching results. Finally， the first N images will be sent back to user. The experimental result shows that our proposed method can improve the computing efficiency of traditional CBIR method. 　　Key words： image retrieval； distributed computing； hadoop 　　基于内容的图像检索（CBIR）是指根据图像内容而并非文字关键词对图像进行检索的方法，并在许多领域得到了广泛的使用[1-3]。CBIR检索方法首先提取出图像数据集的特征，用图像的特征代表图像，匹配时用测试图像特征与特征数据集进行比较，最后返回匹配程度较高的部分图像。然而当图像数据集数量增大时，检索性能和速度会急剧下降，如何提高CBIR检索方法的计算速度成为了一个迫切的研究问题。　　云计算是指将数据存储和检索任务分布在大量的分布式计算机上，而非本地计算机。Hadoop[6，7]是一个可扩展的分布式系统基础架构，并且对用户提供了开发接口，使得用户无需关注分布式底层的实现细节，很方便地搭建分布式计算平台；此外Hadoop技术支持在普通计算机上实现分布式计算架构，而无需服务器进行支撑，因此得到了广泛的应用[4，5，6]。　　为此，本文提出基于Hadoop分布式计算的图像检索方法，利用云计算平台的并行处理能力提高CBIR方法的运行效率，实验结果表明基于Hadoop分布式计算的图像检索方法减少了检索的时间，提高了检索的效率。　　1 Hadoop平台　　Hadoop平台是当今使用最广泛的分布式云计算平台，主要分为HDFS、MapReduce和Hbase三部分。HDFS提供了一个可以运行在普通硬件集群上的分布式文件系统，可以存储超大文件并使用流对文件进行高速读写。HDFS是由一个NameNode主服务器和多个DataNode块服务器组成的主从结构，NameNode用于管理文件系统的命名空间以及用户对文件的读写访问，其中包括