zookeeper集群和kafka集群

文章
林里克斯

Linux 下安装 zookeeper 集群和 kafka 集群

它是一个分布式消息系统,由 linkedin 使用 scala 编写,用作 LinkedIn 的活动流(Activity Stream)和运营数据处理管道(Pipeline)的基础。具有高水平扩展和高吞吐量。

zookeeper集群和kafka集群


一: 实验平台:CentOs 6.5

二: Java版本:jdk-8u111-linux-x64.tar.gz

三: kafka版本:kafka_2.10-0.10.1.1.tgz

四: zookeeper版本:zookeeper-3.4.9.tar.gz

五: 所用IP地址为:192.168.7.223

六: zookeeper所用端口是:2181 2182 2183

七: kafka所用端口是:9001 9002 9003


步骤:


一、环境搭建


  1. jdk环境的搭建
$ mkdir /ane/java
$ tar -xzvf jdk-8u111-linux-x64.tar.gz -C /ane/java #解压缩

添加 Java 环境变量。添加并编辑 /etc/profile.d/jdk.sh

$ vim /etc/profile.d/jdk.sh

JAVA_HOME=/usr/java/jdk1.7.0_67
JAVA_BIN=$JAVA_HOME/bin
PATH=$PATH:$JAVA_BIN
CLASSPATH=$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export  JAVA_HOME JAVA_BIN PATH CLASSPATH
$ source /etc/profile
#使环境变量立即生效
$ java -version  #查看jdk版本

java version "1.8.0_111"
Java(TM) SE Runtime Environment (build 1.8.0_111-b14)
Java HotSpot(TM) 64-Bit Server VM (build 25.111-b14, mixed mode)

二、zookeeper 集群安装


1.zookeeper下载地址

http://zookeeper.apache.org/releases.html

2.解压安装

$ mkdir /ane
$ tar -xf zookeeper-3.4.9.tar.gz -C /ane
#解压到/ane目录下
$ mv zookeeper-3.4.9 zookeeper
#规范名字
$ cd /ane/zookeeper
$ mkdir zk{1,2,3}
#为集群创建必要目录
$ cd conf/
$ cp -p zoo_sample.cfg /ane/zookeeper/zk1/zoo.cfg
#拷贝配置文件

修改zoo.cfg

$ vim /ane/zookeeper/zk1/zoo.cfg

dataDir=/ane/zookeeper/zk1
#数据目录
clientPort=2181
#端口号
server.1=192.168.7.221:2888:3888
#新增
server.2=192.168.7.221:4888:5888
#新增
server.3=192.168.7.221:6888:7888
#新增

server.1 这个1是服务器的标识也可以是其他的数字, 表示这个是第几号服务器,用来标识服务器,这个标识要写到快照目录下myid文件里 192.168.7.221为集群里的IP地址,第一个端口是master和slave之间的通信端口,默认是2888,第二个端口是leader选举的端口,集群刚启动的时候选举或者leader挂掉之后进行新的选举的端口默认是3888

配置信息详解

tickTime:
这个时间是作为 Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个 tickTime 时间就会发送一个心跳。
initLimit:
这个配置项是用来配置 Zookeeper 接受客户端(这里所说的客户端不是用户连接 Zookeeper 服务器的客户端,而是 Zookeeper 服务器集群中连接到 Leader 的 Follower 服务器)初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 5个心跳的时间(也就是 tickTime)长度后 Zookeeper 服务器还没有收到客户端的返回信息,那么表明这个客户端连接失败。总的时间长度就是 5*2000=10 秒
syncLimit:
这个配置项标识 Leader 与Follower 之间发送消息,请求和应答时间长度,最长不能超过多少个 tickTime 的时间长度,总的时间长度就是5*2000=10秒
dataDir:
快照日志的存储路径
dataLogDir:
事物日志的存储路径,如果不配置这个那么事物日志会默认存储到dataDir制定的目录,这样会严重影响zk的性能,当zk吞吐量较大的时候,产生的事物日志、快照日志太多
clientPort:
这个端口就是客户端连接 Zookeeper 服务器的端口,Zookeeper 会监听这个端口,接受客户端的访问请求。修改他的端口改大点

复制配置文件到另外两个文件里

$ cp -p /ane/zookeeper/zk1/zoo.cfg /ane/zookeeper/zk2/zoo.cfg
$ cp -p /ane/zookeeper/zk1/zoo.cfg /ane/zookeeper/zk3/zoo.cfg

修改两个的端口号

$ vim /ane/zookeeper/zk2/zoo.cfg

dataDir=/ane/zookeeper/zk2
clientPort=2182
$ vim /ane/zookeeper/zk3/zoo.cfg

dataDir=/ane/zookeeper/zk3
clientPort=2183
myid文件和server.myid  在快照目录下存放的标识本台服务器的文件,他是整个zk集群用来发现彼此的一个重要标识。
zoo.cfg 文件是zookeeper配置文件 在conf目录里。
log4j.properties文件是zk的日志输出文件 在conf目录里用java写的程序基本上有个共同点日志都用log4j,来进行管理。

创建myid节点文件

$ echo "1" > /ane/zookeeper/zk1/myid
$ echo "2" > /ane/zookeeper/zk2/myid
$ echo "3" > /ane/zookeeper/zk3/myid

3.启用zookeeper集群

$ /ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk1/zoo.cfg
$ /ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk2/zoo.cfg
$ /ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk3/zoo.cfg

编写zookeeper集群的快捷启动脚本

$ vim /ane/startZK.sh

/ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk1/zoo.cfg &
/ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk2/zoo.cfg &
/ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk3/zoo.cfg &

查看zookeeper集群进程

$ ps -ef | grep java

/ane/jdk/jdk1.7.0_67/bin/java -Dzookeeper.log.dir=. -Dzookeeper.root.logger=INFO,CONSOLE -cp /ane/zookeeper/bin/../build/classes:/ane/zookeep
/ane/jdk/jdk1.7.0_67/bin/java -Dzookeeper.log.dir=. -Dzookeeper.root.logger=INFO,CONSOLE -cp /ane/zookeeper/bin/../build/classes:/ane/zookeep
/ane/jdk/jdk1.7.0_67/bin/java -Dzookeeper.log.dir=. -Dzookeeper.root.logger=INFO,CONSOLE -cp /ane/zookeeper/bin/../build/classes:/ane/zookeep
zkServer.sh和zkEnv.sh
#zkServer.sh 主的管理程序文件
#zkEnv.sh 是主要配置,zookeeper集群启动时配置环境变量的文件

三、kafka集群


1.下载地址:

http://kafka.apache.org/downloads

2.安装 解压

$ tar zxf kafka_2.12-0.10.1.1.tgz -C /ane/
$ mv kafka_2.12-0.10.1.1 kafka
$ cd /ane/kafka

3.创建kafka规范目录

$ mkdir server{0,1,2}

4.修改配置文件server.properties

$ pwd
/ane/kafka/config
$ vim server.properties

broker.id=0     #集群唯一标识,不能相同
port=9001       #新增 默认为9000
log.dirs=/ane/logs/kafka0-logs      #修改日志存放路径
zookeeper.connect=192.168.7.221:2181,192.168.7.221:2182,192.168.7.221:2183      #增加zookeeper地址

5.配置信息详情

broker.id=0     #当前机器在集群中的唯一标识,和zookeeper的myid性质一样
port=19092      #当前kafka对外提供服务的端口默认是9092
host.name=192.168.7.100     #这个参数默认是关闭的,在0.8.1有个bug,DNS解析问题,失败率的问题。
num.network.threads=3       #这个是borker进行网络处理的线程数
num.io.threads=8        #这个是borker进行I/O处理的线程数
log.dirs=/opt/kafka/kafkalogs/      #消息存放的目录,这个目录可以配置为“,”逗号分割的表达式,上面的num.io.threads要大于这个目录的个数这个目录,如果配置多个目录,新创建的topic他把消息持久化的地方是,当前以逗号分割的目录中,那个分区数最少就放那一个
socket.send.buffer.bytes=102400     #发送缓冲区buffer大小,数据不是一下子就发送的,先回存储到缓冲区了到达一定的大小后在发送,能提高性能
socket.receive.buffer.bytes=102400      #kafka接收缓冲区大小,当数据到达一定大小后在序列化到磁盘
socket.request.max.bytes=104857600      #这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数,这个值不能超过java的堆栈大小
num.partitions=1        #默认的分区数,一个topic默认1个分区数
log.retention.hours=168     #默认消息的最大持久化时间,168小时,7天
message.max.byte=5242880        #消息保存的最大值5M
default.replication.factor=2        #kafka保存消息的副本数,如果一个副本失效了,另一个还可以继续提供服务
replica.fetch.max.bytes=5242880     #取消息的最大直接数
log.segment.bytes=1073741824        #这个参数是:因为kafka的消息是以追加的形式落地到文件,当超过这个值的时候,kafka会新起一个文件
log.retention.check.interval.ms=300000      #每隔300000毫秒去检查上面配置的log失效时间(log.retention.hours=168 ),到目录查看是否有过期的消息如果有,删除
log.cleaner.enable=false        #是否启用log压缩,一般不用启用,启用的话可以提高性能
zookeeper.connect=192.168.7.100:12181,192.168.7.101:12181,192.168.7.107:1218 #设置zookeeper的连接端口

6.拷贝配置文件到三个server目录下

$ cp -p /ane/kafka/config/server.properties /ane/kafka/server0/
$ cp -p /ane/kafka/config/server.properties /ane/kafka/server1/
$ cp -p /ane/kafka/config/server.properties /ane/kafka/server2/

7.修改server目录下的比修改参数

$ vim /ane/kafka/server1/server.properties

broker.id=1
port=9002
log.dirs=/ane/kafka/logs/kafka1-logs
$ vim /ane/kafka/server2/server.properties

broker.id=2
port=9003
log.dirs=/ane/kafka/logs/kafka2-logs

8..启动kafka

$ /ane/kafka/bin/kafka-server-start.sh /ane/kafka/server0/server.properties &
$ /ane/kafka/bin/kafka-server-start.sh /ane/kafka/server1/server.properties &
$ /ane/kafka/bin/kafka-server-start.sh /ane/kafka/server2/server.properties &

9.编写kafka快捷启动脚本

$ vim /ane/startkafka.sh

/ane/kafka/bin/kafka-server-start.sh /ane/kafka/server0/server.properties &
sleep 10
/ane/kafka/bin/kafka-server-start.sh /ane/kafka/server1/server.properties &
sleep 10
/ane/kafka/bin/kafka-server-start.sh /ane/kafka/server2/server.properties &

10.启动kafka服务器

$ ./startkafka.sh

三、验证


1.查看进程

zookeeper集群和kafka集群

2.查看端口

zookeeper集群和kafka集群

kafka是基于zookeeper的正常才能启动的。
启动kafka之前需要zookeeper启动正常才能启动kafka

3.创建主题

$ /ane/kafka/bin/kafka-topics.sh --create --zookeeper 10.113.128.24:2181,10.113.128.24:2182,10.113.128.24:2183 --topic test --partitions 3 --replication-factor 1

4.向主题中写入内容

$ /ane/kafka/bin/kafka-console-producer.sh --broker-list 10.113.128.24:9090,10.113.128.24:9091,10.113.128.24:9092 --topic test

5.消费消息

$ /ane/kafka/bin/kafka-console-consumer.sh --bootstrap-server 10.113.128.24:9090 --topic test --from-beginning

Over~

版权协议须知!

本篇文章来源于 Uambiguous ,如本文章侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意

1361 0 2017-01-09


分享:
icon_mrgreen.gificon_neutral.gificon_twisted.gificon_arrow.gificon_eek.gificon_smile.gificon_confused.gificon_cool.gificon_evil.gificon_biggrin.gificon_idea.gificon_redface.gificon_razz.gificon_rolleyes.gificon_wink.gificon_cry.gificon_surprised.gificon_lol.gificon_mad.gificon_sad.gificon_exclaim.gificon_question.gif
博主卡片
林里克斯 博主大人
一个致力于Linux的运维平台
运维时间
搭建这个平台,只为分享及记载自己所遇之事和难题。

现在时间 2025-01-18

今日天气
站点统计
  • 文章总数:241篇
  • 分类总数:29个
  • 评论总数:14条
  • 本站总访问量 365527 次

@svmuvwpuqi 真棒!

@smdxydrauu 博主太厉害了!

@奥奥

@Wong arrhenius 牛比

@MakerFace 厉害了!