Rheem可扩展且易于使用的跨平台大数据分析系统.PDFVIP

Rheem可扩展且易于使用的跨平台大数据分析系统.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Rheem可扩展且易于使用的跨平台大数据分析系统.PDF

Rheem:可扩展且易于使用的跨平台大数据分析系统 Spark大数据博客 - Rheem:可扩展且易于使用的跨平台大数据分析系统 RHEEM是一个可扩展且易于使用的跨平台大数据分析系统,它在现有的数据处理平台之上提 供了一个抽象。它允许用户使用易于使用的编程接口轻松地编写数据分析任务,为开发者提供了 不同的方式进行性能优化,编写好的程序可以在任意数据处理平台上运行,这其中包括:Postgre SQL, Spark, Hadoop MapReduce或者Flink等;Rheem将选择经典处理框架的最佳配置来运行这 些程序。RHEEM抽象完全基于用户定义函数(UDF),允许用户专注于其应用程序逻辑而不是物 理细节。这就使得数据工程师和软件开发人员可以不去了解不同数据处理系统的API、优缺点以 及不同平台之前通信的复杂性等繁琐工作。从上面的特点可以看出,其目标和去年Google开源的 Apache Beam很类似。直到目前,Rheem内置支持以下的数据处理平台: Java 8 Streams Apache Spark GraphChi Postgres SQLite rheem的体系结构如下: 1 / 4 Rheem:可扩展且易于使用的跨平台大数据分析系统 Spark大数据博客 - 如果想及时了 解Spark、Hadoop或者Hbase相关的文章,欢迎关注微信公共帐号:iteblog_hadoop 如何使用Rheem Rheem需要我们安装好Java8,然后根据自己的需求在pom.xml文件里面引入下面的依赖: dependency groupIdorg.qcri.rheem/groupId artifactIdrheem-***/artifactId version0.2.1/version /dependency 2 / 4 Rheem:可扩展且易于使用的跨平台大数据分析系统 Spark大数据博客 - 注意上面的 ***,因为Rheem包含了很多个模块,我们需要根据自己的需求选择不同的模块,主 要模块介绍如下: rheem-core: 提供了核心数据结构和优化器,这个模块必须引入; rheem-basic: 提供了通用的运算符和数据类型; rheem-api: 提供了Java和Scala语言的API供大家使用; rheem-java, rheem-spark, rheem-graphchi, rheem-sqlite3, rheem-postgres: 适用于各种平台的适配器 rheem-profiler: provides functionality to learn operator and UDF cost functions from historical execution data 下面介绍如何使用RHEEM编写一个WordCount程序。这里以Scala API进行介绍: import org.qcri.rheem.api._ import org.qcri.rheem.core.api.{Configuration, RheemContext} import org.qcri.rheem.java.Java import org.qcri.rheem.spark.Spark object WordcountScala { def main(args: Array[String]) { // Settings val inputUrl = file:/tmp.txt // Get a plan builder. val rheemContext = new RheemContext(new Conf

文档评论(0)

tangtianbao1 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档