MapReduce框架下的优化高维索引与KNN查询.pdfVIP

  • 1
  • 0
  • 约2.8万字
  • 约 8页
  • 2019-08-11 发布于北京
  • 举报

MapReduce框架下的优化高维索引与KNN查询.pdf

第8期 电  子  学  报 Vol.44 No.8 2016年8月 ACTAELECTRONICASINICA Aug. 2016 MapReduce框架下的优化高维索引与KNN查询 1 2,3 1 1 梁俊杰 ,李凤华 ,刘琼妮 ,尹 利 (1.湖北大学计算机与信息工程学院,湖北武汉430062;2.中国科学院信息工程研究所信息安全国家重点实验室,北京 100093; 3.北京电子科技学院,北京 100070)   摘 要: 针对大规模高维数据近似查询效率低下的问题,利用 MapReduce编程模型在大规模集群上的数据与 任务的并行计算与处理优势,提出MapReduce框架下大规模高维数据索引及 KNN查询方法(iPBM),重点突破 Ma pReduce数据块(block)的优化划分与各数据块对计算的共同贡献两大难题,利用两阶段数据划分策略并依据相关性 与并行性原则将数据均匀分配到各数据块中,设计分布式的双层空间索引结构与并行KNN查询算法,检索时利用全 局索引、局部索引与二维位码索引实现三层数据过滤,大幅缩小搜索范围并降低高维向量计算代价,实验表明iPBM 对大规模高维数据的近似查询具有准确性、高效性和扩展性. 关键词: 云计算;MapReduce;KNN查询;高维索引 中图分类号: TP301   文献标识码: A   文章编号: 03722112(2016)08187308 电子学报URL:http://www.ejournal.org.cn  DOI:10.3969/j.issn.03722112.2016.08.015 OptimizedHighDimensionalIndexandKNNQueryinMapReduce 1 2,3 1 1 LIANGJunjie,LIFenghua ,LIUQiongni,YINLi (1.DepartmentofComputerScienceandTechnology,HubeiUniversity,Wuhan,Hubei430062,China; 2.StateKeyLaboratoryofInformationSecurity,InstituteofInformationEngineering,ChineseAcademyofSciences,Beijing100093,China; 3.BeijingElectronicScience&TechnologyInstitute,Beijing100070,China) Abstract: Toaddressthelowefficiencyproblemcausedbytheapproximatelargescalehighdimensionaldataquery, weproposeanovelhighdimensionalindexandKNNquerymethod,callediPBM,whichexploitstwomainproblems,inclu dingtheoptimaldivisionontheMapReduce’sdatablockandtheircontributionstothecomputing.Specifically,basedonthe principlesofrelativityandparallelity,iPBMemploysatwophasepartitioningschemeofclusteringandzoningtoequally splitthedatatothea

文档评论(0)

1亿VIP精品文档

相关文档