- 1
- 0
- 约2.8万字
- 约 8页
- 2019-08-11 发布于北京
- 举报
第8期 电 子 学 报 Vol.44 No.8
2016年8月 ACTAELECTRONICASINICA Aug. 2016
MapReduce框架下的优化高维索引与KNN查询
1 2,3 1 1
梁俊杰 ,李凤华 ,刘琼妮 ,尹 利
(1.湖北大学计算机与信息工程学院,湖北武汉430062;2.中国科学院信息工程研究所信息安全国家重点实验室,北京 100093;
3.北京电子科技学院,北京 100070)
摘 要: 针对大规模高维数据近似查询效率低下的问题,利用 MapReduce编程模型在大规模集群上的数据与
任务的并行计算与处理优势,提出MapReduce框架下大规模高维数据索引及 KNN查询方法(iPBM),重点突破 Ma
pReduce数据块(block)的优化划分与各数据块对计算的共同贡献两大难题,利用两阶段数据划分策略并依据相关性
与并行性原则将数据均匀分配到各数据块中,设计分布式的双层空间索引结构与并行KNN查询算法,检索时利用全
局索引、局部索引与二维位码索引实现三层数据过滤,大幅缩小搜索范围并降低高维向量计算代价,实验表明iPBM
对大规模高维数据的近似查询具有准确性、高效性和扩展性.
关键词: 云计算;MapReduce;KNN查询;高维索引
中图分类号: TP301 文献标识码: A 文章编号: 03722112(2016)08187308
电子学报URL:http://www.ejournal.org.cn DOI:10.3969/j.issn.03722112.2016.08.015
OptimizedHighDimensionalIndexandKNNQueryinMapReduce
1 2,3 1 1
LIANGJunjie,LIFenghua ,LIUQiongni,YINLi
(1.DepartmentofComputerScienceandTechnology,HubeiUniversity,Wuhan,Hubei430062,China;
2.StateKeyLaboratoryofInformationSecurity,InstituteofInformationEngineering,ChineseAcademyofSciences,Beijing100093,China;
3.BeijingElectronicScience&TechnologyInstitute,Beijing100070,China)
Abstract: Toaddressthelowefficiencyproblemcausedbytheapproximatelargescalehighdimensionaldataquery,
weproposeanovelhighdimensionalindexandKNNquerymethod,callediPBM,whichexploitstwomainproblems,inclu
dingtheoptimaldivisionontheMapReduce’sdatablockandtheircontributionstothecomputing.Specifically,basedonthe
principlesofrelativityandparallelity,iPBMemploysatwophasepartitioningschemeofclusteringandzoningtoequally
splitthedatatothea
您可能关注的文档
最近下载
- (民主生活会)2025年度班子成员相互批评意见清单+对照检查查摆问题清单+批评与自我批评意见建议.docx VIP
- 基于单片机的智能衣柜控制系统设计.docx VIP
- 原神家具负荷表及计算器说明书(多功能小鹏).docx VIP
- 2025 年大学轨道交通信号与控制(信号系统)试题及答案.doc VIP
- 生活中的化学.ppt VIP
- XX村新任支部书记任职发言稿.docx VIP
- 痛苦的缺席——试论苏童的《米》.pdf VIP
- 2024高端装备制造业技术升级改造合同.docx VIP
- 603A使用说明书.doc VIP
- 江苏图集-JS2016Q5 住宅厨卫组合变压式耐火排烟气道系统 江苏省工程建设企业标准设计图集.pdf VIP
原创力文档

文档评论(0)