- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种有效的海量数据Top-k Dominating查询算法.pdf
第36卷第10期 计 算 机 学 报 V01.36No.10
COMPUTERS Oct.2013
2013年10月 CHINESEJOURNALOF
一种有效的海量数据Top—k
韩希先 李建中 高 宏
(哈尔滨工业大学计算机科学与技术学院 哈尔滨 150001)
摘要在多准则决策支持等多个应用中,top—kdominating查询是一种十分实用的查询,它在潜在的巨大的数据
空间中返回k个支配分数最大的元组.现有算法,要么需要为特定的属性组合构建索引,要么需要较大的I/O费用
或内存费用,从而无法有效处理海量数据上top-kdominating查询.文中提出一种新的查询算法TDEP,该算法利
用以较小代价为每个属性构建的有序列表来有效返回海量数据上的top—kdominating查询结果.文中将TDEP算
法的执行明确地分为两个阶段:增长阶段和收缩阶段.在每个阶段,TDEP算法以round—robin方式读取涉及到的有
序列表并维护候选元组,直到满足结束条件.文中分析了两个阶段的执行行为,提出一种新的不需要重新读取有序
列表的支配分数计算方法.同时,文中还提出有效的早剪切操作,可以有效减少TDEP算法需要维护的候选元组数
量.实验结果表明:和现有算法相比,TDEP算法具有较大的性能优势.
关键词 海量数据;top-k
dominating查询;TDEP算法;有序列表;早剪切操作
中图法分类号TP311DOI号10.3724/SP.J.1016.2013.02132
An
Efficient onMassiveDataTitle
Top—kDominatingAlgorithm
HANXi·-XianLI GAO
Jian——Zhong Hong
and
(Department Science Institute 150001)
ofComputer Technology,HarbinofTechnology,Harbin
In
Abstract likemulti—criteriadecision isa
manyapplications making,top—k practi—
dominating
usefultooltoreturnk withthe dominationscoresina data
cally tuples highest potentiallyhuge
indexesbuiltonthe attributes,orincur—
space.Theexistingalgorithms,eitherrequiring specific
cost
or cost,cannot onmassivedataeffi—
ringhighI/O memory process
top—kdominatingquery
this
原创力文档


文档评论(0)