jstorm系列

发布时间：2016-01-28 17:00:06

一、 Storm整体介绍Storm 是一个类似Hadoop MapReduce的系统，用户按照指定的接口实现一个任务，然后将这个任务递交给JStorm系统，Jstorm将这个任务跑起来，并且按7 * 24小 ...

一、 Storm整体介绍

Storm 是一个类似Hadoop MapReduce的系统，用户按照指定的接口实现一个任务，然后将这个任务递交给JStorm系统，Jstorm将这个任务跑起来，并且按7 * 24小时运行起来，一旦中间一个Worker 发生意外故障，调度器立即分配一个新的Worker替换这个失效的Worker。

因此，从应用的角度，JStorm 应用是一种遵守某种编程规范的分布式应用。从系统角度， JStorm一套类似MapReduce的调度系统。从数据的角度，是一套基于流水线的消息处理机制。

实时计算现在是大数据领域中最火爆的一个方向，因为人们对数据的要求越来越高，实时性要求也越来越快，传统的Hadoop MapReduce，逐渐满足不了需求，因此在这个领域需求不断。

在Storm和JStorm出现以前，市面上出现很多实时计算引擎，但自Storm和JStorm出现后，基本上可以说一统江湖：究其优点：

开发非常迅速：接口简单，容易上手，只要遵守Topology、Spout和Bolt的编程规范即可开发出一个扩展性极好的应用，底层RPC、Worker之间冗余，数据分流之类的动作完全不用考虑
扩展性极好：当一级处理单元速度，直接配置一下并发数，即可线性扩展性能
健壮强：当Worker失效或机器出现故障时，自动分配新的Worker替换失效Worker
数据准确性：可以采用Ack机制，保证数据不丢失。如果对精度有更多一步要求，采用事务机制，保证数据准确。

参考文档：

https://github.com/alibaba/jstorm/wiki/%E5%A6%82%E4%BD%95%E5%AE%89%E8%A3%85

图中这种颜色标识的是storm中的基本组件，包括：

Topology，bolt，spout，worker，task，slot，stream，tuple

Storm的核心是topology，程序以topology作为一个整体提交到集群上

数据流入口：spout程序负责从数据源读入数据，然后发射出去，形成一个stream流，可以被多个bolt接受，形成多个流

数据的消费者，从stream流中读取数据，处理数据

可以从不同的流中读取数据

Spout发射的数据形成数据流，

可以理解为一个topology承包给多少个包工头（worker）

可以理解为工人，一个worker下面有多个task，每个task运行一个bolt或spout的实例

原标题：jstorm系列

关键词：JS

*特别声明：以上内容来自于网络收集，著作权属原作者所有，如有侵权，请联系我们： admin#shaoqun.com （#换成@）。

Apptopia：https://www.goluckyvip.com/tag/16065.html
app电商推广：https://www.goluckyvip.com/tag/16066.html
app数据分析工具：https://www.goluckyvip.com/tag/16067.html
app营销案例：https://www.goluckyvip.com/tag/16068.html
Apt2B：https://www.goluckyvip.com/tag/16069.html
如何做电商：https://www.goluckyvip.com/tag/1607.html
澳洲的物价什么样？跟团去澳大利亚旅游，如果：https://www.vstour.cn/a/403242.html
北京市公园年票包括哪些景点：https://www.vstour.cn/a/403243.html