转载

Redis Cluster学习笔记1

Redis在3.0版正式引入了集群这个特性。Redis集群是一个分布式(distributed)、容错(fault-tolerant)的 Redis内存K/V服务, 集群可以使用的功能是普通单机 Redis 所能使用的功能的一个子集(subset),比如Redis集群并不支持处理多个keys的命令,因为这需要在不同的节点间移动数据,从而达不到像Redis那样的性能,在高负载的情况下可能会导致不可预料的错误。

Redis集群的几个重要特征:

(1).Redis 集群的分片特征在于将键空间分拆了16384个槽位,每一个节点负责其中一些槽位。

(2).Redis提供一定程度的可用性,可以在某个节点宕机或者不可达的情况下继续处理命令.

(3).Redis 集群中不存在中心(central)节点或者代理(proxy)节点, 集群的其中一个主要设计目标是达到线性可扩展性(linear scalability)。

1. Redis的数据分片(Sharding)

Redis 集群的键空间被分割为 16384 (2^14)个槽(slot), 集群的最大节点数量也是 16384 个(推荐的最大节点数量为 1000 个),同理每个主节点可以负责处理1到16384个槽位。

当16384个槽位都有主节点负责处理时,集群进入”稳定“上线状态,可以开始处理数据命令。当集群没有处理稳定状态时,可以通过执行重配置(reconfiguration)操作,使得每个哈希槽都只由一个节点进行处理。

重配置指的是将某个/某些槽从一个节点移动到另一个节点。一个主节点可以有任意多个从节点, 这些从节点用于在主节点发生网络断线或者节点失效时, 对主节点进行替换。

集群的使用公式CRC16(Key)&16383计算key属于哪个槽:

HASH_SLOT = CRC16(key) mod 16384

CRC16其结果长度为16位。

2. Redis集群节点

部分内容摘自附录2。Redis 集群中的节点不仅要记录键和值的映射,还需要记录集群的状态,包括键到正确节点的映射。它还具有自动发现其他节点,识别工作不正常的节点,并在有需要时,在从节点中选举出新的主节点的功能。

为了执行以上列出的任务, 集群中的每个节点都与其他节点建立起了“集群连接(cluster bus)”, 该连接是一个 TCP 连接, 使用二进制协议进行通讯。

节点之间使用 Gossip 协议 来进行以下工作:

a).传播(propagate)关于集群的信息,以此来发现新的节点。

b).向其他节点发送 PING 数据包,以此来检查目标节点是否正常运作。

c).在特定事件发生时,发送集群信息。

除此之外, 集群连接还用于在集群中发布或订阅信息。

集群节点不能前端代理命令请求, 所以客户端应该在节点返回 -MOVED 或者 -ASK 转向(redirection)错误时, 自行将命令请求转发至其他节点。

客户端可以自由地向集群中的任何一个节点发送命令请求, 并可以在有需要时, 根据转向错误所提供的信息, 将命令转发至正确的节点, 所以在理论上来说, 客户端是无须保存集群状态信息的。但如果客户端可以将键和节点之间的映射信息保存起来, 可以有效地减少可能出现的转向次数, 籍此提升命令执行的效率。

每个节点在集群中由一个独一无二的 ID标识, 该 ID 是一个十六进制表示的 160 位随机数,在节点第一次启动时由 /dev/urandom 生成。节点会将它的 ID 保存到配置文件, 只要这个配置文件不被删除, 节点就会一直沿用这个 ID 。一个节点可以改变它的 IP 和端口号, 而不改变节点 ID 。 集群可以自动识别出IP/端口号的变化, 并将这一信息通过 Gossip协议广播给其他节点知道。

下面是每个节点都有的关联信息, 并且节点会将这些信息发送给其他节点:

a).节点所使用的 IP 地址和 TCP 端口号。

b).节点的标志(flags)。

c).节点负责处理的哈希槽。

b).节点最近一次使用集群连接发送 PING 数据包(packet)的时间。

e).节点最近一次在回复中接收到 PONG 数据包的时间。

f).集群将该节点标记为下线的时间。

g).该节点的从节点数量。

如果该节点是从节点的话,那么它会记录主节点的节点 ID 。 如果这是一个主节点的话,那么主节点 ID 这一栏的值为 0000000。

在了解Redis Cluster的集群基本特征后,我们首先搭建出这个Redis Cluster集群。

3. 安装Redis 3.0.x

当前最新版为3.0.1

wget http://download.redis.io/releases/redis-3.0.1.tar.gz tar xvzf redis-3.0.1.tar.gz cd redis-3.0.1/ make -j #apt-get install tcl make test ###将redis安装到/usr/local/redis3上 #cd src && make PREFIX=/usr/local/redis3 install ###创建符号链接  #ls /usr/local/redis3/bin/redis-* /usr/local/redis3/bin/redis-benchmark  /usr/local/redis3/bin/redis-check-dump  /usr/local/redis3/bin/redis-sentinel /usr/local/redis3/bin/redis-check-aof  /usr/local/redis3/bin/redis-cli         /usr/local/redis3/bin/redis-server #for i in `cd /usr/local/redis3/bin; ls redis-*` do ln -s /usr/local/redis3/bin/$i /usr/local/bin/$i done; #mkdir -p /usr/local/redis3/conf #ln -sf /usr/local/redis3/conf /etc/redis3 ###检查版本信息 redis-cli -v redis-cli 3.0.1

4. Redis Cluster配置

运行在集群模式的Redis实例与普通的Redis实例有所不同,集群模式需要通过配置启用cluster特性,开启集群模式后的Redis实例便可以使用集群特有的命令和特性了.下面是一个最少选项的集群的配置文件:

port 7001 cluster-enabled yes cluster-config-file nodes.conf cluster-node-timeout 5000 appendonly yes

文件中的 cluster-enabled 选项用于开实例的集群模式, 而 cluster-conf-file 选项则设定了保存节点配置文件的路径, 默认值为 nodes.conf。该节点配置文件无须人为修改,它由Redis集群在启动时自动创建, 并在有需要时自动进行更新。

若要让集群正常运作至少需要三个主节点,我们的环境中,每个主节点附带一个从节点,所以一共六个节点。端口为7001-7006。

在/app/redis3, 并创建六个以端口号为名字的子目录, 稍后我们在将每个目录中运行一个 Redis 实例:

cd /app/redis3 mkdir 7001 7002 7003 7004 7005 7006  cp /etc/redis3/conf/redis.conf  /app/redis3/7001/ ...... cp /etc/redis3/conf/redis.conf  /app/redis3/7006/

将redis.conf里的端口号修改为对应的端口。下面我们打开对应的目录,启动redis实例即可。

cd /app/redis3/7001;nohup redis-server redis.conf & cd /app/redis3/7002;nohup redis-server redis.conf & ......

实例打印的日志显示, 因为 nodes.conf 文件不存在, 所以每个节点都为它自身指定了一个新的 ID ,

/app/redis3/7006# tail -f nohup.out 27040:M 09 May 22:53:50.197 * No cluster configuration found, I'm 1984c27297c6ef50bbfcbd35c11b93cc40ba17e4 /app/redis3/7006# cat nodes.conf  d2b437ca8b9007dcdb63ac16210f6540860361e3 :0 myself,master - 0 0 0 connected vars currentEpoch 0 lastVoteEpoch 0

现在我们已经有了六个正在运行中的 Redis 实例, 接下来我们需要使用这些实例来创建集群。通过使用 Redis 集群命令行工具 redis-trib , 编写节点配置文件的工作可以非常容易地完成: redis-trib 位于 Redis 源码的 src 文件夹中, 它是一个 Ruby 程序, 这个程序通过向实例发送特殊命令来完成创建新集群, 检查集群, 或者对集群进行重新分片(reshared)等工作。这里通过create命令来创建集群,指定replicas=1,即每一个主实例有一个从实例。redis-trib 会打印出一份预想中的配置给你看, 如果你觉得没问题的话, 就可以输入 yes , redis-trib 就会将这份配置应用到集群当中,让各个节点开始互相通讯,最后可以得到如下信息

~/redis-3.0.1/src# apt-get install ruby gem ~/redis-3.0.1/src# gem sources -a http://ruby.taobao.org/ ~/redis-3.0.1/src# gem install redis ~/redis-3.0.1/src# cp redis-trib.rb /usr/local/redis3/bin/ ~/redis-3.0.1/src# ln -sf /usr/local/redis3/bin/redis-trib.rb /usr/bin/redis-trib.rb ~/redis-3.0.1/src# redis-trib.rb create --replicas 1  127.0.0.1:7001 127.0.0.1:7002 127.0.0.1:7003 127.0.0.1:7004 127.0.0.1:7005 127.0.0.1:7006 M: 1984c27297c6ef50bbfcbd35c11b93cc40ba17e4 127.0.0.1:7001    slots:0-5460 (5461 slots) master M: 481e256be4c724f5a2c64a761e52b4be61ca45b4 127.0.0.1:7002    slots:5461-10922 (5462 slots) master M: b5b652fa02d9999861e66c843b01fd2700c02adf 127.0.0.1:7003    slots:10923-16383 (5461 slots) master S: 821ec823dc0c2d4f65319e84fe74157fb1014155 127.0.0.1:7004    replicates 1984c27297c6ef50bbfcbd35c11b93cc40ba17e4 S: b3b8541b9520d707180d56a2fb3cf3ee6895ed10 127.0.0.1:7005    replicates 481e256be4c724f5a2c64a761e52b4be61ca45b4 S: d2b437ca8b9007dcdb63ac16210f6540860361e3 127.0.0.1:7006    replicates b5b652fa02d9999861e66c843b01fd2700c02adf Can I set the above configuration? (type 'yes' to accept): [OK] All nodes agree about slots configuration. >>> Check for open slots... >>> Check slots coverage... [OK] All 16384 slots covered.

以上信息的其中一部分可以通过向集群中的任意节点(主节点或者从节点都可以)发送 CLUSTER NODES 命令来获得。该命令还可以获得节点 ID , IP 地址和端口号, 标志(flag), 最后发送 PING 的时间, 最后接收 PONG 的时间, 连接状态, 节点负责处理的槽。

redis-cli -p 7001 cluster nodes 481e256be4c724f5a2c64a761e52b4be61ca45b4 127.0.0.1:7002 master - 0 1431186119174 2 connected 5461-10922 b3b8541b9520d707180d56a2fb3cf3ee6895ed10 127.0.0.1:7005 slave 481e256be4c724f5a2c64a761e52b4be61ca45b4 0 1431186120677 5 connected d2b437ca8b9007dcdb63ac16210f6540860361e3 127.0.0.1:7006 slave b5b652fa02d9999861e66c843b01fd2700c02adf 0 1431186119174 6 connected b5b652fa02d9999861e66c843b01fd2700c02adf 127.0.0.1:7003 master - 0 1431186118673 3 connected 10923-16383 821ec823dc0c2d4f65319e84fe74157fb1014155 127.0.0.1:7004 slave 1984c27297c6ef50bbfcbd35c11b93cc40ba17e4 0 1431186120176 4 connected 1984c27297c6ef50bbfcbd35c11b93cc40ba17e4 127.0.0.1:7001 myself,master - 0 0 1 connected 0-5460

5. 连接Redis集群

通过上面的输出,我们可以看出Redis三个主节点的slot范围。一个 Redis 客户端可以向集群中的任意节点(包括从节点)发送命令请求。我们首先连接第一个节点:

redis-cli -p 7001 127.0.0.1:7001> set a 1  (error) MOVED 15495 127.0.0.1:7003 127.0.0.1:7001> get a (error) MOVED 15495 127.0.0.1:7003 127.0.0.1:7001> set b 1 OK

节点会对命令请求进行分析和key的slot计算,并且会查找这个命令所要处理的键所在的槽。如果要查找的哈希槽正好就由接收到命令的节点负责处理, 那么节点就直接执行这个命令。

另一方面, 如果所查找的槽不是由该节点处理的话, 节点将查看自身内部所保存的哈希槽到节点 ID 的映射记录, 并向客户端回复一个 MOVED 错误。上面的错误信息包含键 x 所属的哈希槽15495, 以及负责处理这个槽的节点的 IP 和端口号 127.0.0.1:7003 。

虽然我们用Node ID来标识集群中的节点, 但是为了让客户端的转向操作尽可能地简单, 节点在 MOVED 错误中直接返回目标节点的 IP 和端口号, 而不是目标节点的 ID 。客户端应该记录槽15495由节点127.0.0.1:7003负责处理“这一信息, 这样当再次有命令需要对槽15495执行时, 客户端就可以加快寻找正确节点的速度。这样,当集群处于稳定状态时,所有客户端最终都会保存有一个哈希槽至节点的映射记录,使得集群非常高效: 客户端可以直接向正确的节点发送命令请求, 无须转向、代理或者其他任何可能发生单点故障(single point failure)的实体(entiy)。

^^

参考:

http://www.redis.cn/topics/cluster-tutorial.html

http://redis.readthedocs.org/en/latest/topic/cluster-spec.html

https://github.com/HunanTV/redis-cerberus/wiki/Redis-%E9%9B%86%E7%BE%A4%E4%BB%A3%E7%90%86%E5%9F%BA%E6%9C%AC%E5%8E%9F%E7%90%86%E4%B8%8E%E4%BD%BF%E7%94%A8
正文到此结束
Loading...