storm学习笔记.docx

下载文档 降价啦

12
0
约1.03万字
约 17页
2016-11-23 发布于湖北
举报
保障服务

storm学习笔记.docx

Storm对比Hadoop的批处理，Storm是个实时的、分布式以及具备高容错的计算系统。同Hadoop一样Storm也可以处理大批量的数据，然而Storm在保证高可靠性的前提下还可以让处理进行的更加实时；也就是说，所有的信息都会被处理。Storm同样还具备容错和分布计算这些特性，这就让Storm可以扩展到不同的机器上进行大批量的数据处理。他同样还有以下的这些特性：易于扩展。对于扩展，你只需要添加机器和改变对应的topology（拓扑）设置。Storm使用Hadoop Zookeeper进行集群协调，这样可以充分的保证大型集群的良好运行。每条信息的处理都可以得到保证。Storm集群管理简易。Storm的容错机能：一旦topology递交，Storm会一直运行它直到topology被废除或者被关闭。而在执行中出现错误时，也会由Storm重新分配任务。尽管通常使用Java，Storm中的topology可以用任何语言设计。当然为了更好的理解文章，你首先需要安装和设置Storm。需要通过以下几个简单的步骤：从Storm官方下载Storm安装文件将bin/directory解压到你的PATH上，并保证bin/storm脚本是可执行的。Storm组件Storm集群主要由一个主节点和一群工作节点（worker node）组成，通过 Zookeeper进行协调。主节点：主节点通常运行一个后台程序

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

storm学习笔记.docx