Storm 学习之路（二）—— Storm核心概念详解

一、Storm核心概念

1.1 Topologies（拓扑）

一个完整的Storm流处理程序被称为Storm topology(拓扑)。它是一个是由Spouts 和Bolts通过Stream连接起来的有向无环图，Storm会保持每个提交到集群的topology持续地运行，从而处理源源不断的数据流，直到你将主动其杀死(kill)为止。

1.2 Streams（流）

Stream是Storm中的核心概念。一个Stream是一个无界的、以分布式方式并行创建和处理的Tuple序列。Tuple可以包含大多数基本类型以及自定义类型的数据。简单来说，Tuple就是流数据的实际载体，而Stream就是一系列Tuple。

1.3 Spouts

Spouts是流数据的源头，一个Spout 可以向不止一个Streams中发送数据。Spout通常分为可靠和不可靠两种：可靠的Spout能够在失败时重新发送 Tuple, 不可靠的Spout一旦把Tuple 发送出去就置之不理了。

1.4 Bolts

Bolts是流数据的处理单元，它可以从一个或者多个Streams中接收数据，处理完成后再发射到新的Streams中。Bolts可以执行过滤(filtering)，聚合(aggregations)，连接(joins)等操作，并能与文件系统或数据库进行交互。

1.5 Stream groupings（分组策略）

spouts和bolts在集群上执行任务时，是由多个Task并行执行(如上图，每一个圆圈代表一个Task)。当一个Tuple需要从Bolt A发送给Bolt B执行的时候，程序如何知道应该发送给Bolt B的哪一个Task执行呢？

这是由Stream groupings分组策略来决定的，Storm中一共有如下8个内置的Stream Grouping。当然你也可以通过实现 CustomStreamGrouping接口来实现自定义Stream分组策略。

Shuffle grouping
Tuples随机的分发到每个Bolt的每个Task上，每个Bolt获取到等量的Tuples。
Fields grouping
Streams通过grouping指定的字段(field)来分组。假设通过user-id字段进行分区，那么具有相同user-id的Tuples就会发送到同一个Task。
Partial Key grouping
Streams通过grouping中指定的字段(field)来分组，与Fields Grouping相似。但是对于两个下游的Bolt来说是负载均衡的，可以在输入数据不平均的情况下提供更好的优化。
All grouping
Streams会被所有的Bolt的Tasks进行复制。由于存在数据重复处理，所以需要谨慎使用。
Global grouping
整个Streams会进入Bolt的其中一个Task，通常会进入id最小的Task。
None grouping
当前None grouping 和Shuffle grouping等价，都是进行随机分发。
Direct grouping
Direct grouping只能被用于direct streams 。使用这种方式需要由Tuple的生产者直接指定由哪个Task进行处理。
Local or shuffle grouping
如果目标Bolt有Tasks和当前Bolt的Tasks处在同一个Worker进程中，那么则优先将Tuple Shuffled到处于同一个进程的目标Bolt的Tasks上，这样可以最大限度地减少网络传输。否则，就和普通的Shuffle Grouping行为一致。

二、Storm架构详解

2.1 Nimbus进程

也叫做Master Node，是Storm集群工作的全局指挥官。主要功能如下：

通过Thrift接口，监听并接收Client提交的Topology；
根据集群Workers的资源情况，将Client提交的Topology进行任务分配，分配结果写入Zookeeper;
通过Thrift接口，监听Supervisor的下载Topology代码的请求，并提供下载 ;
通过Thrift接口，监听UI对统计信息的读取，从Zookeeper上读取统计信息，返回给UI;
若进程退出后，立即在本机重启，则不影响集群运行。

2.2 Supervisor进程

也叫做Worker Node , 是Storm集群的资源管理者，按需启动Worker进程。主要功能如下：

定时从Zookeeper检查是否有新Topology代码未下载到本地，并定时删除旧Topology代码 ;
根据Nimbus的任务分配计划，在本机按需启动1个或多个Worker进程，并监控所有的Worker进程的情况；
若进程退出，立即在本机重启，则不影响集群运行。

2.3 zookeeper的作用

Nimbus和Supervisor进程都被设计为快速失败（遇到任何意外情况时进程自毁）和无状态（所有状态保存在Zookeeper或磁盘上）。这样设计的好处就是如果它们的进程被意外销毁，那么在重新启动后，就只需要从Zookeeper上获取之前的状态数据即可，并不会造成任何数据丢失。

2.4 Worker进程

Storm集群的任务构造者，构造Spoult或Bolt的Task实例，启动Executor线程。主要功能如下：

根据Zookeeper上分配的Task，在本进程中启动1个或多个Executor线程，将构造好的Task实例交给Executor去运行；
向Zookeeper写入心跳；
维持传输队列，发送Tuple到其他的Worker ；
若进程退出，立即在本机重启，则不影响集群运行。

2.5 Executor线程

Storm集群的任务执行者，循环执行Task代码。主要功能如下：

执行1个或多个Task；
执行Acker机制，负责发送Task处理状态给对应Spout所在的worker。

2.6 并行度

1个Worker进程执行的是1个Topology的子集，不会出现1个Worker为多个Topology服务的情况，因此1个运行中的Topology就是由集群中多台物理机上的多个Worker进程组成的。1个Worker进程会启动1个或多个Executor线程来执行1个Topology的Component(组件，即Spout或Bolt)。

Executor是1个被Worker进程启动的单独线程。每个Executor会运行1个Component中的一个或者多个Task。

Task是组成Component的代码单元。Topology启动后，1个Component的Task数目是固定不变的，但该Component使用的Executor线程数可以动态调整（例如：1个Executor线程可以执行该Component的1个或多个Task实例）。这意味着，对于1个Component来说，#threads<=#tasks（线程数小于等于Task数目）这样的情况是存在的。默认情况下Task的数目等于Executor线程数，即1个Executor线程只运行1个Task。

总结如下：

一个运行中的Topology由集群中的多个Worker进程组成的；
在默认情况下，每个Worker进程默认启动一个Executor线程；
在默认情况下，每个Executor默认启动一个Task线程；
Task是组成Component的代码单元。

参考资料

storm documentation -> Concepts
Internal Working of Apache Storm
Understanding the Parallelism of a Storm Topology
Storm nimbus 单节点宕机的处理