大数据技术与应用基础第9、10章流实时处理系统Storm、企业级、大数据流处理Apex.pptxVIP

大数据技术与应用基础第9、10章流实时处理系统Storm、企业级、大数据流处理Apex.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
能力要求CAPACITY了解Storm所包涵的基本概念及应用。熟悉Storm的安装。掌握简单的测试方法及基本使用方法。Storm概述Storm安装与配置一、Storm概述Storm是一个分布式实时计算系统,与Hadoop等批处理系统不同,Storm专注于流数据的处理,主要应用于实时分析、持续计算、在线机器学习、分布式远程调用以及数据抽取、转换和加载等领域。Storm的术语包括Stream、Spout、Bolt、Task、Worker、Stream Grouping和Topology。Storm主要特点简单的编程模型。可用各种编程语言。容错性。水平扩展。 计算是在多个线程、进程和服务器之间并行进行的。可靠的消息处理。 Storm保证每个消息至少能得到一次完整处理。任务 失败时,它会负责从消息源重试消息。快速。 系统的设计保证了消息能得到快速的处理,使用?MQ作为其 底层消息队列。本地模式。Storm概述Storm安装与配置二、Storm安装与配置检查python、Java、hosts的配置(1)下载ZooKeeper,命令如下。wget /apache/zookeeper/zookeeper-3.4.7/zookeeper-3.4.8.tar.gz (2)下载完毕后解压至/usr/local/目录下。sudo tar -zxf zookeeper-3.4.8.tar.gz -C /usr/local/(3)然后进入ZooKeeper文件夹下的conf下把zoo_sample.cfg复制并重命名为zoo.cfg。cd /usr/local/zookeeper-3.4.8/conf/cp–p zoo_sample.cfg zoo.cfgvim zoo.cfg直接用前面章节中Hadoop 的配置 ZooKeeper集群的搭建步骤如下:二、Storm安装与配置(4)按照下图9-4配置zoo.cfg文件 (5)手动创建dataDir文件夹。mkdir /home/hadoop/storage/zookeeper(6)在/home/hadoop/storage/zookeeper路径下创建文件myid并配置(zoo.cfg主机是serverX就写入数字X) 。vi myid(7)启动ZooKeeper。cd /usr/local/zookeeper-3.4.8/(8)查看Zookeeper-3.4.8所属于的用户权限 。chown -R hadoop /usr/local/zookeeper-3.4.8/(9)在ZooKeeper主目录下启动ZooKeeper。bin/zkServer.sh start启动成功后压缩文件夹发送给其他节点,创建dataDir文件夹更改相应的myid,并赋予相应的权限。二、Storm安装与配置(1)下载Storm并解压至/usr/local文件夹,命令如下:wget /apache/storm/apache-storm-0.10.0/apache-storm-0.10.0.tar.gz sudo tar -zxf apache-storm-0.10.0.tar.gz -C /usr/local/(2)配置Storm子目录conf的storm.yaml,如下图:vi conf/storm.yaml (注意配置不能顶格写)安装Storm二、Storm安装与配置(3)创建storm.local.dir目录,命令如下。mkdir /home/hadoop/aaamkdir /home/hadoop/aaa/workdir(4)启动Storm,命令如下 。cd /usr/local/apache-storm-0.10.0bin/storm nimbus bin/storm supervisor bin/storm ui 没有报错后打包解压至其他节点。进入Web界面进行查看:http://ip:8080/http://IP:8080,看到节点都正常即安装成功。安装Storm二、Storm安装与配置Maven是现在Java社区中最强大的项目管理和项目构建工具,这里我们使用借助Maven工具。(1)首先我们下载maven。sudo apt-get install maven(2)Storm安装目录自带的测试案例,所以进入Storm当前目录下的examples/storm-starter。cd /usr/local/apache-storm-0.10.0/examples/storm-starter(3)storm-starter下有一个test文件夹,接着执行如下命令。mvn test当提示BUILD SUCCESS则代表命令执行成功。此时执行下面命令运行主类中的main方法,命令如下:mvn exec:java -Ds

文档评论(0)

132****9295 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档