Storm集群的安装与配置

1. Infrastructure

3台流处理Server
- CPU : 3 Core
- Memory : 3G
- Disk : 300G
- OS : Ubuntu Server 12.04 64bit

2. Depended Software

  • built-essential
  • Python 2.7
  • Java 1.7.0_71(最低要求1.6)
  • Zookeeeper 3.4.6
  • ZeroMQ 4.0.5
  • jzmq github-master
  • Storm 0.9.1-incubating

3. Install && Config

几乎所有软件对集群中的机器来说,安装过程都是完全一致的,所有没有必要在每台机器重复安装过程,可以使用Puppet或者Docker这些工具来提高效率。但由于操作的集群网络环境受限,最终利用Xshell可以一次向多个会话发送命令的功能,做到了完全同步的安装和配置。

3.1 修改/etc/hosts

使用名称来代表机器会带来很多方便,在/etc/hosts中追加如下内容:

172.21.1.168	master
172.21.1.169	node1
172.21.1.170	node2

3.2 build-essential

build-essential作用是提供编译程序必须软件包的列表信息, 编译程序有了这个软件包, 才知道 头文件和库函数的位置,还会下载依赖的软件包,组成一个基本的开发环境

  $ sudo apt-get install build-essential

3.3 安装JDK

$ tar zxvf jdk-7u71-linux-x86.tar.gz
# mv jdk1.7.0_71 /usr/lib/jvm
# sudo vim /etc/profile

追加内容:

export JAVA_HOME=/usr/lib/jvm/jdk1.7.0_71
export JRE_HOME=${JAVA_HOME}/jre
export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib
export PATH=${JAVA_HOME}/bin:${JRE_HOME}/bin:$PATH
$source /etc/profile

3.4 安装Zookeeper 3.4.6

详细内容可以参考 Zookeeper 3.4.5分布式安装手册 这篇文章, 这里简要描述:

$ tar -zxvf zookeeper-3.4.6.tar.gz
$ cd zookeeper-3.4.6/conf/
$ cp zoo_sample.cfg zoo.cfg
$ vim zoo.cfg
  • 将里面的默认配置修改为如下(具体配置可以根据你机器来定):
tickTime=2000
# The number of ticks that the initial
# synchronization phase can take
initLimit=10
# The number of ticks that can pass between
# sending a request and getting an acknowledgement
syncLimit=5
# the directory where the snapshot is stored.
# do not use /tmp for storage, /tmp here is just
# example sakes.
dataDir=/logs/zookeeper
# the port at which the clients will connect
clientPort=2181

server.1 = master:2888:3888
server.2 = node1:2888:3888
server.3 = node2:2888:3888
  • 在刚刚zoo.cfg文件中dataDir属性指定的目录(本文中为/logs/zookeeper)下创建一个myid,在里面添加你指定的server编号,因为这台机器是master,而zoo.cfg中master编号为1(server.1=master:2888:3888),所以myid内容只需要为1即可。
$ mkdir -p /logs/zookeeper
$ echo 1   > /logs/zookeeper/myid 
  • 这样就在master机器上配置好Zookeeper,接下来只需要将master配置好的Zookeeper整个目录打包分发到node1、node2机器中,解压到安装位置。

    不要忘记在node1的/logs/zookeeper/myid文件中添加2。node2的/logs/zookeeper/myid文件中添加3。

  • 将每个机器的zookeeper的路径添加到Path
    在/etc/profile追加如下内容:

# zookeeper
export ZOOKEEPER_HOME=/packages/zookeeper-3.4.6
export PATH=${ZOOKEEPER_HOME}/bin:$PATH

不要忘记在三台机器 source /etc/profile 使之生效。

  • 分别在master、node1、node2机器上启动Zookeeper相关服务:
$ZOOKEEPER_HOME/bin/zkServer.sh start
JMX enabled by default
Using config: /home/wyp/Downloads/zookeeper-3.4.5/bin/../conf/zoo.cfg
Starting zookeeper ... STARTED

3.5 安装ZMQ

默认安装在/usr/local/lib位置,后面会比较省劲:

$ tar -xzf zeromq-4.0.5.tar.gz
$ cd zeromq-4.0.5
$ ./configure
$ make
$ sudo make install

3.6 安装 jzmq

最开始装nathanmarz的分支,一直无法make,最后下载了zeromq的master分支。 make过程中提示安装libtool, pkg-config, autoconf几个工具:

$ sudo apt-get install libtool pkg-config autoconf
$ git clone https://github.com/zeromq/jzmq
$ cd jzmq
$ ./autogen.sh
$ ./configure
$ make
$ sudo make install

3.7 Storm install && config

  • 安装之前的调研

在官网下载了storm-0.9.1-incubating 版本解压到安装位置。 该版本的一大亮点是采用了Netty做消息传输层,在以前的版本里,Storm只能依赖ZeroMQ做消息的传输,但其实并不适合, 理由

  • ZeroMQ是一个本地化的消息库,它过度依赖操作系统环境;
  • 安装起来比较麻烦;(有了Netty可以不要ZeroMQ和jzmq)
  • ZeroMQ的稳定性在不同版本之间差异巨大,并且目前只有2.1.7版本的ZeroMQ能与Storm协调的工作(写文档才注意到这句话。。。后面需要测试一下)。

引入Netty的原因是:
- 平台隔离,Netty是一个纯Java实现的消息队列,可以帮助Storm实现更好的跨平台特性,同时基于JVM的实现可以让我们对消息有更好的控制;
- 高性能,Netty的性能要比ZeroMQ快两倍左右,让Storm飞 专门比较了ZeroMQ和Netty的性能。
- 安全性认证,使得我们将来要做的 worker 进程之间的认证授权机制成为可能。

主要参考Storm集群安装部署步骤【详细版】 和其他集群的经验对conf/storm.yaml进行如下配置:

  • storm.zookeeper.servers: Storm集群使用的Zookeeper集群地址,其格式如下:
storm.zookeeper.servers:
     - "172.21.1.168"
     - "172.21.1.169"
     - "172.21.1.170"

如果Zookeeper集群使用的不是默认端口,那么还需要storm.zookeeper.port选项。

  • storm.local.dir: Nimbus和Supervisor进程用于存储少量状态,如jars、confs等的本地磁盘目录,需要提前创建该目录并给以足够的访问权限。然后在storm.yaml中配置该目录,如:
storm.local.dir: "/logs/storm/workdir"
  • java.library.path: Storm使用的本地库(ZMQ和JZMQ)加载路径,默认为»/usr/local/lib:/opt/local/lib:/usr/lib»,一般来说ZMQ和JZMQ默认安装在/usr/local/lib 下,因此不需要配置即可。

  • nimbus.host: Storm集群Nimbus机器地址,各个Supervisor工作节点需要知道哪个机器是Nimbus,以便下载Topologies的jars、confs等文件,如:

nimbus.host: "172.21.1.168"
  • supervisor.slots.ports: 对于每个Supervisor工作节点,需要配置该工作节点可以运行的worker数量。每个worker占用一个单独的端口用于接收消息,该配置选项即用于定义哪些端口是可被worker使用的。默认情况下,每个节点上可运行4个workers,分别在6700、6701、6702和6703端口,我配置了80个:
supervisor.slots.ports:
    - 6700
    - 6701
    - 6702
    - 6703
     ......
    - 6780
  • storm UI端口
ui.port: 8088
  • 如果要在Storm里使用Netty做传输层,只需要简单的把下面的内容加入到storm.yaml中,并根据你的实际情况调整参数即可:
storm.messaging.transport: "backtype.storm.messaging.netty.Context"
storm.messaging.netty.server_worker_threads: 1
storm.messaging.netty.client_worker_threads: 1
storm.messaging.netty.buffer_size: 5242880
storm.messaging.netty.max_retries: 100
storm.messaging.netty.max_wait_ms: 1000
storm.messaging.netty.min_wait_ms: 100
  • 为了方便使用,可以将Storm位置加入到系统环境变量中

在/etc/profile追加如下内容:

# Storm
export STORM_HOME=/packages/zookeeper-3.4.6
export PATH=${STORM_HOME}/bin:$PATH

不要忘记在三台机器 source /etc/profile 使之生效。

  • 启动Storm各个后台进程

最后一步,启动Storm的所有后台进程。和Zookeeper一样,Storm也是快速失败(fail-fast)的系统,这样Storm才能在任意时刻被停止,并且当进程重启后被正确地恢复执行。这也是为什么Storm不在进程内保存状态的原因,即使Nimbus或 Supervisors被重启,运行中的Topologies不会受到影响。

以下是启动Storm各个后台进程的方式:
- Nimbus: 在Storm主控节点上运行»bin/storm nimbus >/dev/null 2>&1 &«启动Nimbus后台程序,并放到后台执行;
- Supervisor: 在Storm各个工作节点上运行»bin/storm supervisor >/dev/null 2>&1 &«启动Supervisor后台程序,并放到后台执行;
- UI: 在Storm主控节点上运行»bin/storm ui >/dev/null 2>&1 &«启动UI后台程序,并放到后台执行,启动后可以通过http://{nimbus host}:8080观察集群的worker资源使用情况、Topologies的运行状态等信息。

注意事项
- Storm后台进程被启动后,将在Storm安装部署目录下的logs/子目录下生成各个进程的日志文件。
- 经测试,Storm UI必须和Storm Nimbus部署在同一台机器上,否则UI无法正常工作,因为UI进程会检查本机是否存在Nimbus链接。

至此,Storm集群已经部署、配置完毕,可以向集群提交拓扑运行了。

  • 向集群提交任务

    • 启动Storm Topology:

storm jar allmycode.jar org.me.MyTopology arg1 arg2 arg3
- 停止Storm Topology:

storm kill {toponame}

Tags// , ,
More Reading
Older// 人性化排序