Storm集群的安装与配置

²/Nov 2014

Job

1. Infrastructure

3台流处理Server
- CPU : 3 Core
- Memory : 3G
- Disk : 300G
- OS : Ubuntu Server 12.04 64bit

2. Depended Software

built-essential
Python 2.7
Java 1.7.0_71(最低要求1.6)
Zookeeeper 3.4.6
ZeroMQ 4.0.5
jzmq github-master
Storm 0.9.1-incubating

3. Install && Config

几乎所有软件对集群中的机器来说，安装过程都是完全一致的，所有没有必要在每台机器重复安装过程，可以使用Puppet或者Docker这些工具来提高效率。但由于操作的集群网络环境受限，最终利用Xshell可以一次向多个会话发送命令的功能，做到了完全同步的安装和配置。

3.1 修改/etc/hosts

使用名称来代表机器会带来很多方便，在/etc/hosts中追加如下内容：

172.21.1.168	master
172.21.1.169	node1
172.21.1.170	node2

3.2 build-essential

build-essential作用是提供编译程序必须软件包的列表信息, 编译程序有了这个软件包, 才知道头文件和库函数的位置，还会下载依赖的软件包，组成一个基本的开发环境

  $ sudo apt-get install build-essential

3.3 安装JDK

$ tar zxvf jdk-7u71-linux-x86.tar.gz
# mv jdk1.7.0_71 /usr/lib/jvm
# sudo vim /etc/profile

追加内容：

export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_71
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:${JRE_HOME}/bin:$PATH

$source /etc/profile

3.4 安装Zookeeper 3.4.6

详细内容可以参考 Zookeeper 3.4.5分布式安装手册这篇文章，这里简要描述：

$ tar -zxvf zookeeper-3.4.6.tar.gz
$ cd zookeeper-3.4.6/conf/
$ cp zoo_sample.cfg zoo.cfg
$ vim zoo.cfg

将里面的默认配置修改为如下（具体配置可以根据你机器来定）：

tickTime=2000
# The number of ticks that the initial
# synchronization phase can take
initLimit=10
# The number of ticks that can pass between
# sending a request and getting an acknowledgement
syncLimit=5
# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just
# example sakes.
dataDir=/logs/zookeeper
# the port at which the clients will connect
clientPort=2181

server.1 = master:2888:3888
server.2 = node1:2888:3888
server.3 = node2:2888:3888

在刚刚zoo.cfg文件中dataDir属性指定的目录（本文中为/logs/zookeeper）下创建一个myid，在里面添加你指定的server编号，因为这台机器是master，而zoo.cfg中master编号为1(server.1=master:2888:3888)，所以myid内容只需要为1即可。

$ mkdir -p /logs/zookeeper
$ echo 1   > /logs/zookeeper/myid

这样就在master机器上配置好Zookeeper，接下来只需要将master配置好的Zookeeper整个目录打包分发到node1、node2机器中，解压到安装位置。

不要忘记在node1的/logs/zookeeper/myid文件中添加2。node2的/logs/zookeeper/myid文件中添加3。
将每个机器的zookeeper的路径添加到Path
在/etc/profile追加如下内容：

# zookeeper
export ZOOKEEPER_HOME=/packages/zookeeper-3.4.6
export PATH=${ZOOKEEPER_HOME}/bin:$PATH

不要忘记在三台机器 source /etc/profile 使之生效。

分别在master、node1、node2机器上启动Zookeeper相关服务：

$ZOOKEEPER_HOME/bin/zkServer.sh start
JMX enabled by default
Using config: /home/wyp/Downloads/zookeeper-3.4.5/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED

测试Zookeeper是否安装成功：
参见 Zookeeper 3.4.5分布式安装手册第7点。

3.5 安装ZMQ

默认安装在/usr/local/lib位置，后面会比较省劲：

$ tar -xzf zeromq-4.0.5.tar.gz
$ cd zeromq-4.0.5
$ ./configure
$ make
$ sudo make install

3.6 安装 jzmq

最开始装nathanmarz的分支，一直无法make，最后下载了zeromq的master分支。 make过程中提示安装libtool, pkg-config, autoconf几个工具:

$ sudo apt-get install libtool pkg-config autoconf
$ git clone https://github.com/zeromq/jzmq
$ cd jzmq
$ ./autogen.sh
$ ./configure
$ make
$ sudo make install

3.7 Storm install && config

安装之前的调研

在官网下载了storm-0.9.1-incubating 版本解压到安装位置。该版本的一大亮点是采用了Netty做消息传输层，在以前的版本里，Storm只能依赖ZeroMQ做消息的传输，但其实并不适合, 理由：

ZeroMQ是一个本地化的消息库，它过度依赖操作系统环境；
安装起来比较麻烦；(有了Netty可以不要ZeroMQ和jzmq)
ZeroMQ的稳定性在不同版本之间差异巨大，并且目前只有2.1.7版本的ZeroMQ能与Storm协调的工作(写文档才注意到这句话。。。后面需要测试一下)。

引入Netty的原因是：
- 平台隔离，Netty是一个纯Java实现的消息队列，可以帮助Storm实现更好的跨平台特性，同时基于JVM的实现可以让我们对消息有更好的控制；
- 高性能，Netty的性能要比ZeroMQ快两倍左右，让Storm飞专门比较了ZeroMQ和Netty的性能。
- 安全性认证，使得我们将来要做的 worker 进程之间的认证授权机制成为可能。

主要参考Storm集群安装部署步骤【详细版】和其他集群的经验对conf/storm.yaml进行如下配置：

storm.zookeeper.servers: Storm集群使用的Zookeeper集群地址，其格式如下：

storm.zookeeper.servers:
     - "172.21.1.168"
     - "172.21.1.169"
     - "172.21.1.170"

如果Zookeeper集群使用的不是默认端口，那么还需要storm.zookeeper.port选项。

storm.local.dir: Nimbus和Supervisor进程用于存储少量状态，如jars、confs等的本地磁盘目录，需要提前创建该目录并给以足够的访问权限。然后在storm.yaml中配置该目录，如：

storm.local.dir: "/logs/storm/workdir"

java.library.path: Storm使用的本地库(ZMQ和JZMQ)加载路径，默认为»/usr/local/lib:/opt/local/lib:/usr/lib»，一般来说ZMQ和JZMQ默认安装在/usr/local/lib 下，因此不需要配置即可。
nimbus.host: Storm集群Nimbus机器地址，各个Supervisor工作节点需要知道哪个机器是Nimbus，以便下载Topologies的jars、confs等文件，如：

nimbus.host: "172.21.1.168"

supervisor.slots.ports: 对于每个Supervisor工作节点，需要配置该工作节点可以运行的worker数量。每个worker占用一个单独的端口用于接收消息，该配置选项即用于定义哪些端口是可被worker使用的。默认情况下，每个节点上可运行4个workers，分别在6700、6701、6702和6703端口，我配置了80个：

supervisor.slots.ports:
    - 6700
    - 6701
    - 6702
    - 6703
     ......
    - 6780

storm UI端口

ui.port: 8088

如果要在Storm里使用Netty做传输层，只需要简单的把下面的内容加入到storm.yaml中，并根据你的实际情况调整参数即可：

storm.messaging.transport: "backtype.storm.messaging.netty.Context"
storm.messaging.netty.server_worker_threads: 1
storm.messaging.netty.client_worker_threads: 1
storm.messaging.netty.buffer_size: 5242880
storm.messaging.netty.max_retries: 100
storm.messaging.netty.max_wait_ms: 1000
storm.messaging.netty.min_wait_ms: 100

为了方便使用，可以将Storm位置加入到系统环境变量中

在/etc/profile追加如下内容：

# Storm
export STORM_HOME=/packages/zookeeper-3.4.6
export PATH=${STORM_HOME}/bin:$PATH

不要忘记在三台机器 source /etc/profile 使之生效。

启动Storm各个后台进程

最后一步，启动Storm的所有后台进程。和Zookeeper一样，Storm也是快速失败（fail-fast)的系统，这样Storm才能在任意时刻被停止，并且当进程重启后被正确地恢复执行。这也是为什么Storm不在进程内保存状态的原因，即使Nimbus或 Supervisors被重启，运行中的Topologies不会受到影响。

以下是启动Storm各个后台进程的方式：
- Nimbus: 在Storm主控节点上运行»bin/storm nimbus >/dev/null 2>&1 &«启动Nimbus后台程序，并放到后台执行；
- Supervisor: 在Storm各个工作节点上运行»bin/storm supervisor >/dev/null 2>&1 &«启动Supervisor后台程序，并放到后台执行；
- UI: 在Storm主控节点上运行»bin/storm ui >/dev/null 2>&1 &«启动UI后台程序，并放到后台执行，启动后可以通过http://{nimbus host}:8080观察集群的worker资源使用情况、Topologies的运行状态等信息。

注意事项：
- Storm后台进程被启动后，将在Storm安装部署目录下的logs/子目录下生成各个进程的日志文件。
- 经测试，Storm UI必须和Storm Nimbus部署在同一台机器上，否则UI无法正常工作，因为UI进程会检查本机是否存在Nimbus链接。

至此，Storm集群已经部署、配置完毕，可以向集群提交拓扑运行了。

向集群提交任务
- 启动Storm Topology：

storm jar allmycode.jar org.me.MyTopology arg1 arg2 arg3
- 停止Storm Topology：

storm kill {toponame}

Tags// storm, job,