一种有效的海量数据Top-k+Dominating查询算法.pdfVIP

  • 14
  • 0
  • 约4.32万字
  • 约 14页
  • 2017-08-17 发布于安徽
  • 举报

一种有效的海量数据Top-k+Dominating查询算法.pdf

第36卷第10期 计 算 机 学 报 voI.36No.10 2013年10月 CHINESEJOURNALOFCOMPUTERS Oct.2013 韩希先 李建中 高 宏 (哈尔滨工业大学计算机科学与技术学院哈尔滨 150001) 摘要在多准则决策支持等多个应用中,top一^dominating查询是一种十分实用的查询,它在潜在的巨大的数据 空间中返回女个支配分数最大的元组.现有算法,要么需要为特定的属性组合构建索引,要么需要较大的I/0费用 用以较小代价为每个属性构建的有序列表来有效返回海量数据上的top一女dominating查询结果.文中将TDEP算 法的执行明确地分为两个阶段:增长阶段和收缩阶段.在每个阶段,TDEP算法以round—robin方式读取涉及到的有 序列表并维护候选元组,直到满足结束条件.文中分析了两个阶段的执行行为,提出一种新的不需要重新读取有序 列表的支配分数计算方法.同时,文中还提出有效的早剪切操作,可以有效减少TDEP算法需要维护的候选元组数 量.实验结果表明:和现有算法相比,TDEP算法具有较大的性能优势. 关键词海量数据;top一^dominating查询;TDEP算法;有序列表;早剪切操作 中图法分类号TP311DOI号10.3724/SP.J.1016.2013.02132 An OnMassiVeDataTitle Efficient Top·忌DOminatingAlgorithm HANXi—XianLI GAO Jian—ZhongHong ScigncP口nd Injfif“£P 1 o,了■f^竹oZog,,H口r6i以50001) (DPp口r£,n删£o,Comp“£er TPc^nDzogy,Hdr6in AbstractIn likemulti—criteriadecision isa manyapphcations making,top一是dominatingpracti usefult001to withthe dominationscoresina data cally return忌tupleshighest potentiallyhuge The indexesbuiltonthe incur— attributes,or space. existingalgorithms,eitherrequiring specific I/Ocostor cost,cannot onmassivedataeffi— ringhigh memory processtop一是dominatingquery Inthis novel TDEPis toutilizesortedlistsbuiltforeach ciently. paper,a algorithm proposed attributewithlow—costtoreturn resultsonmassivedata top一是dominating

文档评论(0)

1亿VIP精品文档

相关文档