- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Rheem可扩展且易于使用的跨平台大数据分析系统.PDF
Rheem:可扩展且易于使用的跨平台大数据分析系统
Spark大数据博客 -
Rheem:可扩展且易于使用的跨平台大数据分析系统
RHEEM是一个可扩展且易于使用的跨平台大数据分析系统,它在现有的数据处理平台之上提
供了一个抽象。它允许用户使用易于使用的编程接口轻松地编写数据分析任务,为开发者提供了
不同的方式进行性能优化,编写好的程序可以在任意数据处理平台上运行,这其中包括:Postgre
SQL, Spark, Hadoop MapReduce或者Flink等;Rheem将选择经典处理框架的最佳配置来运行这
些程序。RHEEM抽象完全基于用户定义函数(UDF),允许用户专注于其应用程序逻辑而不是物
理细节。这就使得数据工程师和软件开发人员可以不去了解不同数据处理系统的API、优缺点以
及不同平台之前通信的复杂性等繁琐工作。从上面的特点可以看出,其目标和去年Google开源的
Apache Beam很类似。直到目前,Rheem内置支持以下的数据处理平台:
Java 8 Streams
Apache Spark
GraphChi
Postgres
SQLite
rheem的体系结构如下:
1 / 4
Rheem:可扩展且易于使用的跨平台大数据分析系统
Spark大数据博客 -
如果想及时了
解Spark、Hadoop或者Hbase相关的文章,欢迎关注微信公共帐号:iteblog_hadoop
如何使用Rheem
Rheem需要我们安装好Java8,然后根据自己的需求在pom.xml文件里面引入下面的依赖:
dependency
groupIdorg.qcri.rheem/groupId
artifactIdrheem-***/artifactId
version0.2.1/version
/dependency
2 / 4
Rheem:可扩展且易于使用的跨平台大数据分析系统
Spark大数据博客 -
注意上面的 ***,因为Rheem包含了很多个模块,我们需要根据自己的需求选择不同的模块,主
要模块介绍如下:
rheem-core: 提供了核心数据结构和优化器,这个模块必须引入;
rheem-basic: 提供了通用的运算符和数据类型;
rheem-api: 提供了Java和Scala语言的API供大家使用;
rheem-java, rheem-spark, rheem-graphchi, rheem-sqlite3, rheem-postgres:
适用于各种平台的适配器
rheem-profiler: provides functionality to learn operator and UDF cost functions from
historical execution data
下面介绍如何使用RHEEM编写一个WordCount程序。这里以Scala API进行介绍:
import org.qcri.rheem.api._
import org.qcri.rheem.core.api.{Configuration, RheemContext}
import org.qcri.rheem.java.Java
import org.qcri.rheem.spark.Spark
object WordcountScala {
def main(args: Array[String]) {
// Settings
val inputUrl = file:/tmp.txt
// Get a plan builder.
val rheemContext = new RheemContext(new Conf
您可能关注的文档
最近下载
- 吞咽障碍护理的ppt课件.pptx VIP
- PROTEUS-V8中文版介绍.ppt VIP
- 精准落实语文要素五策略 .pdf VIP
- 《第一单元 100以内数加与减(二)——图书角》教学设计-2024-2025学年二年级上册数学北师大版.docx VIP
- 中枢神经系统感染护理查房.ppt VIP
- 标准图集-20S515-钢筋混凝土及砖砌排水检查井.pdf VIP
- 规范、标准整理:TCSUS 17-2021 古道保护利用规划编制导则--------工程交流群加vx:gqq5616.pdf VIP
- 在2024年全市第四季度“12345”热线不满意工单分析研判会上的主持词.docx VIP
- 云南省重大项目办公室 云南省各地州市2015年重大建设项目.doc VIP
- 评标专家评标流程.pdf VIP
文档评论(0)