zookeeper集群和kafka集群
在 Linux
下安装 zookeeper
集群和 kafka
集群
它是一个分布式消息系统,由 linkedin 使用 scala 编写,用作 LinkedIn 的活动流(Activity Stream)和运营数据处理管道(Pipeline)的基础。具有高水平扩展和高吞吐量。
一: 实验平台:CentOs 6.5
二: Java版本:jdk-8u111-linux-x64.tar.gz
三: kafka版本:kafka_2.10-0.10.1.1.tgz
四: zookeeper版本:zookeeper-3.4.9.tar.gz
五: 所用IP地址为:192.168.7.223
六: zookeeper所用端口是:2181 2182 2183
七: kafka所用端口是:9001 9002 9003
步骤:
一、环境搭建
jdk
环境的搭建
$ mkdir /ane/java
$ tar -xzvf jdk-8u111-linux-x64.tar.gz -C /ane/java #解压缩
添加 Java
环境变量。添加并编辑 /etc/profile.d/jdk.sh
$ vim /etc/profile.d/jdk.sh
JAVA_HOME=/usr/java/jdk1.7.0_67
JAVA_BIN=$JAVA_HOME/bin
PATH=$PATH:$JAVA_BIN
CLASSPATH=$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export JAVA_HOME JAVA_BIN PATH CLASSPATH
$ source /etc/profile
#使环境变量立即生效
$ java -version #查看jdk版本
java version "1.8.0_111"
Java(TM) SE Runtime Environment (build 1.8.0_111-b14)
Java HotSpot(TM) 64-Bit Server VM (build 25.111-b14, mixed mode)
二、zookeeper 集群安装
1.zookeeper
下载地址
http://zookeeper.apache.org/releases.html
2.解压安装
$ mkdir /ane
$ tar -xf zookeeper-3.4.9.tar.gz -C /ane
#解压到/ane目录下
$ mv zookeeper-3.4.9 zookeeper
#规范名字
$ cd /ane/zookeeper
$ mkdir zk{1,2,3}
#为集群创建必要目录
$ cd conf/
$ cp -p zoo_sample.cfg /ane/zookeeper/zk1/zoo.cfg
#拷贝配置文件
修改zoo.cfg
$ vim /ane/zookeeper/zk1/zoo.cfg
dataDir=/ane/zookeeper/zk1
#数据目录
clientPort=2181
#端口号
server.1=192.168.7.221:2888:3888
#新增
server.2=192.168.7.221:4888:5888
#新增
server.3=192.168.7.221:6888:7888
#新增
server.1 这个1是服务器的标识也可以是其他的数字, 表示这个是第几号服务器,用来标识服务器,这个标识要写到快照目录下myid文件里 192.168.7.221为集群里的IP地址,第一个端口是master和slave之间的通信端口,默认是2888,第二个端口是leader选举的端口,集群刚启动的时候选举或者leader挂掉之后进行新的选举的端口默认是3888
配置信息详解
tickTime:
这个时间是作为 Zookeeper 服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个 tickTime 时间就会发送一个心跳。
initLimit:
这个配置项是用来配置 Zookeeper 接受客户端(这里所说的客户端不是用户连接 Zookeeper 服务器的客户端,而是 Zookeeper 服务器集群中连接到 Leader 的 Follower 服务器)初始化连接时最长能忍受多少个心跳时间间隔数。当已经超过 5个心跳的时间(也就是 tickTime)长度后 Zookeeper 服务器还没有收到客户端的返回信息,那么表明这个客户端连接失败。总的时间长度就是 5*2000=10 秒
syncLimit:
这个配置项标识 Leader 与Follower 之间发送消息,请求和应答时间长度,最长不能超过多少个 tickTime 的时间长度,总的时间长度就是5*2000=10秒
dataDir:
快照日志的存储路径
dataLogDir:
事物日志的存储路径,如果不配置这个那么事物日志会默认存储到dataDir制定的目录,这样会严重影响zk的性能,当zk吞吐量较大的时候,产生的事物日志、快照日志太多
clientPort:
这个端口就是客户端连接 Zookeeper 服务器的端口,Zookeeper 会监听这个端口,接受客户端的访问请求。修改他的端口改大点
复制配置文件到另外两个文件里
$ cp -p /ane/zookeeper/zk1/zoo.cfg /ane/zookeeper/zk2/zoo.cfg
$ cp -p /ane/zookeeper/zk1/zoo.cfg /ane/zookeeper/zk3/zoo.cfg
修改两个的端口号
$ vim /ane/zookeeper/zk2/zoo.cfg
dataDir=/ane/zookeeper/zk2
clientPort=2182
$ vim /ane/zookeeper/zk3/zoo.cfg
dataDir=/ane/zookeeper/zk3
clientPort=2183
myid文件和server.myid 在快照目录下存放的标识本台服务器的文件,他是整个zk集群用来发现彼此的一个重要标识。
zoo.cfg 文件是zookeeper配置文件 在conf目录里。
log4j.properties文件是zk的日志输出文件 在conf目录里用java写的程序基本上有个共同点日志都用log4j,来进行管理。
创建myid节点文件
$ echo "1" > /ane/zookeeper/zk1/myid
$ echo "2" > /ane/zookeeper/zk2/myid
$ echo "3" > /ane/zookeeper/zk3/myid
3.启用zookeeper
集群
$ /ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk1/zoo.cfg
$ /ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk2/zoo.cfg
$ /ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk3/zoo.cfg
编写zookeeper
集群的快捷启动脚本
$ vim /ane/startZK.sh
/ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk1/zoo.cfg &
/ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk2/zoo.cfg &
/ane/zookeeper/bin/zkServer.sh start /ane/zookeeper/zk3/zoo.cfg &
查看zookeeper
集群进程
$ ps -ef | grep java
/ane/jdk/jdk1.7.0_67/bin/java -Dzookeeper.log.dir=. -Dzookeeper.root.logger=INFO,CONSOLE -cp /ane/zookeeper/bin/../build/classes:/ane/zookeep
/ane/jdk/jdk1.7.0_67/bin/java -Dzookeeper.log.dir=. -Dzookeeper.root.logger=INFO,CONSOLE -cp /ane/zookeeper/bin/../build/classes:/ane/zookeep
/ane/jdk/jdk1.7.0_67/bin/java -Dzookeeper.log.dir=. -Dzookeeper.root.logger=INFO,CONSOLE -cp /ane/zookeeper/bin/../build/classes:/ane/zookeep
zkServer.sh和zkEnv.sh
#zkServer.sh 主的管理程序文件
#zkEnv.sh 是主要配置,zookeeper集群启动时配置环境变量的文件
三、kafka集群
1.下载地址:
http://kafka.apache.org/downloads
2.安装 解压
$ tar zxf kafka_2.12-0.10.1.1.tgz -C /ane/
$ mv kafka_2.12-0.10.1.1 kafka
$ cd /ane/kafka
3.创建kafka
规范目录
$ mkdir server{0,1,2}
4.修改配置文件server.properties
$ pwd
/ane/kafka/config
$ vim server.properties
broker.id=0 #集群唯一标识,不能相同
port=9001 #新增 默认为9000
log.dirs=/ane/logs/kafka0-logs #修改日志存放路径
zookeeper.connect=192.168.7.221:2181,192.168.7.221:2182,192.168.7.221:2183 #增加zookeeper地址
5.配置信息详情
broker.id=0 #当前机器在集群中的唯一标识,和zookeeper的myid性质一样
port=19092 #当前kafka对外提供服务的端口默认是9092
host.name=192.168.7.100 #这个参数默认是关闭的,在0.8.1有个bug,DNS解析问题,失败率的问题。
num.network.threads=3 #这个是borker进行网络处理的线程数
num.io.threads=8 #这个是borker进行I/O处理的线程数
log.dirs=/opt/kafka/kafkalogs/ #消息存放的目录,这个目录可以配置为“,”逗号分割的表达式,上面的num.io.threads要大于这个目录的个数这个目录,如果配置多个目录,新创建的topic他把消息持久化的地方是,当前以逗号分割的目录中,那个分区数最少就放那一个
socket.send.buffer.bytes=102400 #发送缓冲区buffer大小,数据不是一下子就发送的,先回存储到缓冲区了到达一定的大小后在发送,能提高性能
socket.receive.buffer.bytes=102400 #kafka接收缓冲区大小,当数据到达一定大小后在序列化到磁盘
socket.request.max.bytes=104857600 #这个参数是向kafka请求消息或者向kafka发送消息的请请求的最大数,这个值不能超过java的堆栈大小
num.partitions=1 #默认的分区数,一个topic默认1个分区数
log.retention.hours=168 #默认消息的最大持久化时间,168小时,7天
message.max.byte=5242880 #消息保存的最大值5M
default.replication.factor=2 #kafka保存消息的副本数,如果一个副本失效了,另一个还可以继续提供服务
replica.fetch.max.bytes=5242880 #取消息的最大直接数
log.segment.bytes=1073741824 #这个参数是:因为kafka的消息是以追加的形式落地到文件,当超过这个值的时候,kafka会新起一个文件
log.retention.check.interval.ms=300000 #每隔300000毫秒去检查上面配置的log失效时间(log.retention.hours=168 ),到目录查看是否有过期的消息如果有,删除
log.cleaner.enable=false #是否启用log压缩,一般不用启用,启用的话可以提高性能
zookeeper.connect=192.168.7.100:12181,192.168.7.101:12181,192.168.7.107:1218 #设置zookeeper的连接端口
6.拷贝配置文件到三个server
目录下
$ cp -p /ane/kafka/config/server.properties /ane/kafka/server0/
$ cp -p /ane/kafka/config/server.properties /ane/kafka/server1/
$ cp -p /ane/kafka/config/server.properties /ane/kafka/server2/
7.修改server
目录下的比修改参数
$ vim /ane/kafka/server1/server.properties
broker.id=1
port=9002
log.dirs=/ane/kafka/logs/kafka1-logs
$ vim /ane/kafka/server2/server.properties
broker.id=2
port=9003
log.dirs=/ane/kafka/logs/kafka2-logs
8..启动kafka
$ /ane/kafka/bin/kafka-server-start.sh /ane/kafka/server0/server.properties &
$ /ane/kafka/bin/kafka-server-start.sh /ane/kafka/server1/server.properties &
$ /ane/kafka/bin/kafka-server-start.sh /ane/kafka/server2/server.properties &
9.编写kafka
快捷启动脚本
$ vim /ane/startkafka.sh
/ane/kafka/bin/kafka-server-start.sh /ane/kafka/server0/server.properties &
sleep 10
/ane/kafka/bin/kafka-server-start.sh /ane/kafka/server1/server.properties &
sleep 10
/ane/kafka/bin/kafka-server-start.sh /ane/kafka/server2/server.properties &
10.启动kafka
服务器
$ ./startkafka.sh
三、验证
1.查看进程
2.查看端口
kafka
是基于zookeeper
的正常才能启动的。
启动kafka
之前需要zookeeper
启动正常才能启动kafka
3.创建主题
$ /ane/kafka/bin/kafka-topics.sh --create --zookeeper 10.113.128.24:2181,10.113.128.24:2182,10.113.128.24:2183 --topic test --partitions 3 --replication-factor 1
4.向主题中写入内容
$ /ane/kafka/bin/kafka-console-producer.sh --broker-list 10.113.128.24:9090,10.113.128.24:9091,10.113.128.24:9092 --topic test
5.消费消息
$ /ane/kafka/bin/kafka-console-consumer.sh --bootstrap-server 10.113.128.24:9090 --topic test --from-beginning
Over~
版权协议须知!
本篇文章来源于 Uambiguous ,如本文章侵犯到任何版权问题,请立即告知本站,本站将及时予与删除并致以最深的歉意
1361 0 2017-01-09
博主卡片
运维时间
搭建这个平台,只为分享及记载自己所遇之事和难题。
现在时间 2025-01-18
今日天气
站点统计
- 文章总数:241篇
- 分类总数:29个
- 评论总数:14条
- 本站总访问量 365527 次
@svmuvwpuqi 真棒!
@smdxydrauu 博主太厉害了!
@xiaozi 最后的分享的镜像下载地址打不开 服务器没有开机吗?
@yuanyuan 为什么我的4b安装centos7.9 插上tf卡 显示不兼...
@Wong arrhenius 牛比
@MakerFace 厉害了!
@TongSir 老哥 更新下我的友链链接 https://blog.ton...