分布式数据流关系查询技术研究.PDFVIP

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分布式数据流关系查询技术研究.PDF

网络出版时间:2015-10-20 13:01:53 网络出版地址:/kcms/detail/11.1826.TP1301.004.html 第38 卷 计 算 机 学 报 Vol.38 2015 论文在线出版号 No.104 CHINESE JOURNAL OF COMPUTERS Online Publishing No.104 分布式数据流关系查询技术研究 王春凯, 孟小峰 ( 中国人民大学信息学院,北京 100872) 摘 要 在线分析连续数据流的需求日益增多,用于实时处理海量、易变数据的数据流管理系统由此产生。大数据时代下, 随着开放式处理平台的发展,为处理大规模且多样化的数据流,出现了若干分布式流处理系统,如S4, Storm, Spark Streaming 等。然而,为提升处理系统的易用性和处理能力,需要在之上构建具有抽象查询语言的关系查询系统,以构筑完整的分布式 数据流管理系统。如何设计并实现高效易用的关系查询系统是一个亟待解决的问题。本文首先概述了分布式数据流查询处理 的典型应用、数据特征和实现目标。进而,提出了分布式数据流关系查询系统的基础架构,并基于此架构深入分析了用户自 定义函数查询、查询优化、驱动方式、编译技术、算子管理、调度管理和并行管理等关键技术。然后,对比分析了 SPL, StreamingSQL, Squall, DBToaster 四种具有代表性的查询系统实例。最后,指明了该技术在优化技术、执行策略、实时精准 查询和复杂查询分析等方面所面临的挑战和今后的研究工作。 关键词 大数据;数据流;流处理系统;流查询系统;关系查询技术 中图法分类号TP311 论文引用格式 王春凯, 孟小峰,分布式数据流关系查询技术研究,2015 ,Vol.38 :在线出版号No. 104 WANG Chun-Kai, MENG Xiao-Feng, Relational Query Techniques for Distributed Data Stream: A Survey, Chinese Journal of Computers,2015, Vol.38: Online Publishing No.104 Relational Query Techniques for Distributed Data Stream: A Survey WANG Chun-Kai, MENG Xiao-Feng (School of Information, Renmin University of China, Beijing 100872) Abstract The applications that require online processing continuous data stream are increasing. Data stream management systems which are used to deal with massive and variable data in real time have been produced. With the development of open processing platforms in the ear of big data, a number of distributed data stream

文档评论(0)

2752433145 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档