- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
海量数据上的近似连接聚集操作 approximate join aggregate on massive data
第33卷第10期 计 算 机 学 报 v01.33No.10
2010年10月 CHINESE Oct.2010
JOURNALOFCOMPUTERS
海量数据上的近似连接聚集操作
韩希先” 杨东华∞ 李建中”
”(哈尔滨工业大学计算机科学与技术学院哈尔滨 150001)
2’(哈尔滨工业大学基础与交叉科学研究院高性能计算中心 哈尔滨 150001)
摘要连接聚集操作是一种常用并且非常耗时的数据库操作.相对于准确查询,满足用户给定置信区间的近似
结果由于其快得多的响应时间,更受用户的欢迎.作者分析发现现有的工作无法以既高效又满足给定的任意置信
区间方式来处理近似连接聚集,因此提出了一种新的算法——(P,£)一近似连接聚集查询(pe—AJA)来有效地返回满
足任意置信区间的近似连接聚集结果.文章提出且预计算两个数据结构:连接随机样本(JRS)和连接位置索引对
信区间,pe—AJA利用JPIPT获得更多的随机连接元组.文中提出一种采样算法来获得JPIPT给定数量的样本,并
且利用获得的JPIPT样本,该文提出的算法可通过对连接表的一遍顺序扫描获得连接元组.该文还提供了JPlPT
和JRS有效的构建和维护算法.实验结果表明:pE—AJA可以获得相对于准确查询1~5个数量级的加速,并且可以
有效地完成JPIPT和jRS的构建和维护操作.
关键词加一近似连接聚集;连接位置索引对表;连接随机样本;海量数据
中图法分类号TP311 DOI号:10.3724/SP.J.1016.2010.01919
Join onMassiveData
ApproximateAggregate
Xi—Xianl’YANG
HAN Dong—Hua∞LIJian—Zhon91’
”(School Scienceand Institute
Computer of 150001)
of Technology,HarbinTechnology,Harbin
2’(Center Fundamentaland Sciences。
forHighPerformanceComputing,Academyof Interdisciplinary
HarbinInstitute
ofTechnology,Harbin150001)
Abstract isa usedbut in
Join commonly
aggregate time—consumingoperationdatabase.Compa—
toexact results confidenceintervalsaremore
ring queries,approximatesatisfyinguser—specified
attractivefortheirmuchfaster ofthe workcan
responses.Noneprevious processapproximate
withboth andan confidenceinter
您可能关注的文档
- 专访惠普公司副总裁金卫东先生 a special interview with mr . jin weidong, the vice president of hp co ..pdf
- 基于局部修复的移动数据点delaunay三角化快速更新方法 a new algorithm for fast updating delaunay triangulation of moving points based on local fixing.pdf
- 一种关节角度测量系统的设计 one kind of the arthrosis angle measurement system design.pdf
- 发现维基百科文章相关图片 discovering images for wikipedia articles.pdf
- 基于随机函数的哈希函数 hash function based on random function.pdf
- 基于证书强指定验证者签名方案 certificate-based strong designated verifier signature scheme.pdf
- 认知网络体系结构研究新进展 review of architectures of cognitive network.pdf
- 考虑设备周期性维护的流水车间生产调度优化算法 flow shop scheduling optimization algorithm with periodical maintenance.pdf
- 基于快速梯度回波序列的氨基质子转移成像 amide proton transfer imaging with fast gradient echo sequence.pdf
- 压电能量收集器件基于有限元仿真比较和研究 comparison and study of finite element analysis for piezoelectric energy harvesting devices.pdf
- 基于云计算的在线考试系统 an online examination system based on cloud computing.pdf
- 基于 wifi 网络的可视化遥控搬运机器人设计 design of visual remote control handl ing robot based on wifi network.pdf
- 下一代互联网体系结构基础研究及探索 research and exploration of next-generation internet architecture.pdf
- 设计方法与精益研发质量管理.pdf
- 基于 etw 的 windows 系统性能监测技术 windows system performance monitoring technology based on etw.pdf
- 协同组编辑中基于地址空间转换的一致性维护方法 consistency maintenance based on the address space transformation technique in group editors.pdf
- 三维文物点云模型配准优化算法 registration optimization algorithm for 3d cultural relics point clouds model.pdf
- 图像目标类别检测综述 review on object class detection of images.pdf
- 基于h.264的快速帧间模式选择算法研究 fast inter frame mode selection algorithm based on h .264.pdf
- 自适应熵的投影聚类算法 adaptive entropy algorithm for projective clustering.pdf
最近下载
- 2025-2026年国家公务员考试《申论》真题及参考答案.doc VIP
- 川教版(2019)初中信息科技Python编程复习单.docx VIP
- DTII(A)带式输送机计算书(带表1-4)Ver1.2(95版)(2012.12.18).xls VIP
- 医疗器械经营财务管理培训.pptx VIP
- 麻醉前肺功能评估.ppt VIP
- 新课标体育与健康水平二教案.pdf VIP
- 贵州教育出版社小学五年级上册综合实践教案.pdf VIP
- 博物馆学概论课件:博物馆藏品管理历史、藏品意义与藏品研究.pptx VIP
- 2025高中政治部编版选择性必修二《法律与生活》必背法律条文.pdf VIP
- SEO培训课件教学课件.pptx VIP
文档评论(0)