转载

Redis Cluster学习笔记1

Redis在3.0版正式引入了集群这个特性。Redis集群是一个分布式（distributed）、容错（fault-tolerant）的 Redis内存K/V服务，集群可以使用的功能是普通单机 Redis 所能使用的功能的一个子集（subset），比如Redis集群并不支持处理多个keys的命令,因为这需要在不同的节点间移动数据,从而达不到像Redis那样的性能,在高负载的情况下可能会导致不可预料的错误。

Redis集群的几个重要特征：

(1).Redis 集群的分片特征在于将键空间分拆了16384个槽位，每一个节点负责其中一些槽位。

(2).Redis提供一定程度的可用性,可以在某个节点宕机或者不可达的情况下继续处理命令.

(3).Redis 集群中不存在中心（central）节点或者代理（proxy）节点，集群的其中一个主要设计目标是达到线性可扩展性（linear scalability）。

1. Redis的数据分片（Sharding）

Redis 集群的键空间被分割为 16384 （2^14)个槽（slot），集群的最大节点数量也是 16384 个（推荐的最大节点数量为 1000 个），同理每个主节点可以负责处理1到16384个槽位。

当16384个槽位都有主节点负责处理时，集群进入”稳定“上线状态，可以开始处理数据命令。当集群没有处理稳定状态时，可以通过执行重配置（reconfiguration）操作，使得每个哈希槽都只由一个节点进行处理。

重配置指的是将某个/某些槽从一个节点移动到另一个节点。一个主节点可以有任意多个从节点，这些从节点用于在主节点发生网络断线或者节点失效时，对主节点进行替换。

集群的使用公式CRC16（Key）&16383计算key属于哪个槽：

HASH_SLOT = CRC16(key) mod 16384

CRC16其结果长度为16位。

2. Redis集群节点

部分内容摘自附录2。Redis 集群中的节点不仅要记录键和值的映射，还需要记录集群的状态，包括键到正确节点的映射。它还具有自动发现其他节点，识别工作不正常的节点，并在有需要时，在从节点中选举出新的主节点的功能。

为了执行以上列出的任务，集群中的每个节点都与其他节点建立起了“集群连接（cluster bus）”，该连接是一个 TCP 连接，使用二进制协议进行通讯。

节点之间使用 Gossip 协议来进行以下工作：

a).传播（propagate）关于集群的信息，以此来发现新的节点。

b).向其他节点发送 PING 数据包，以此来检查目标节点是否正常运作。

c).在特定事件发生时，发送集群信息。

除此之外，集群连接还用于在集群中发布或订阅信息。

集群节点不能前端代理命令请求，所以客户端应该在节点返回 -MOVED 或者 -ASK 转向（redirection）错误时，自行将命令请求转发至其他节点。

客户端可以自由地向集群中的任何一个节点发送命令请求，并可以在有需要时，根据转向错误所提供的信息，将命令转发至正确的节点，所以在理论上来说，客户端是无须保存集群状态信息的。但如果客户端可以将键和节点之间的映射信息保存起来，可以有效地减少可能出现的转向次数，籍此提升命令执行的效率。

每个节点在集群中由一个独一无二的 ID标识，该 ID 是一个十六进制表示的 160 位随机数，在节点第一次启动时由 /dev/urandom 生成。节点会将它的 ID 保存到配置文件，只要这个配置文件不被删除，节点就会一直沿用这个 ID 。一个节点可以改变它的 IP 和端口号，而不改变节点 ID 。集群可以自动识别出IP/端口号的变化，并将这一信息通过 Gossip协议广播给其他节点知道。

下面是每个节点都有的关联信息，并且节点会将这些信息发送给其他节点：

a).节点所使用的 IP 地址和 TCP 端口号。

b).节点的标志（flags）。

c).节点负责处理的哈希槽。

b).节点最近一次使用集群连接发送 PING 数据包（packet）的时间。

e).节点最近一次在回复中接收到 PONG 数据包的时间。

f).集群将该节点标记为下线的时间。

g).该节点的从节点数量。

如果该节点是从节点的话，那么它会记录主节点的节点 ID 。如果这是一个主节点的话，那么主节点 ID 这一栏的值为 0000000。

在了解Redis Cluster的集群基本特征后，我们首先搭建出这个Redis Cluster集群。

3. 安装Redis 3.0.x

当前最新版为3.0.1

wget http://download.redis.io/releases/redis-3.0.1.tar.gz tar xvzf redis-3.0.1.tar.gz cd redis-3.0.1/ make -j #apt-get install tcl make test ###将redis安装到/usr/local/redis3上 #cd src && make PREFIX=/usr/local/redis3 install ###创建符号链接  #ls /usr/local/redis3/bin/redis-* /usr/local/redis3/bin/redis-benchmark  /usr/local/redis3/bin/redis-check-dump  /usr/local/redis3/bin/redis-sentinel /usr/local/redis3/bin/redis-check-aof  /usr/local/redis3/bin/redis-cli         /usr/local/redis3/bin/redis-server #for i in `cd /usr/local/redis3/bin; ls redis-*` do ln -s /usr/local/redis3/bin/$i /usr/local/bin/$i done; #mkdir -p /usr/local/redis3/conf #ln -sf /usr/local/redis3/conf /etc/redis3 ###检查版本信息 redis-cli -v redis-cli 3.0.1

4. Redis Cluster配置

运行在集群模式的Redis实例与普通的Redis实例有所不同，集群模式需要通过配置启用cluster特性，开启集群模式后的Redis实例便可以使用集群特有的命令和特性了.下面是一个最少选项的集群的配置文件:

port 7001 cluster-enabled yes cluster-config-file nodes.conf cluster-node-timeout 5000 appendonly yes

文件中的 cluster-enabled 选项用于开实例的集群模式，而 cluster-conf-file 选项则设定了保存节点配置文件的路径，默认值为 nodes.conf。该节点配置文件无须人为修改，它由Redis集群在启动时自动创建，并在有需要时自动进行更新。

若要让集群正常运作至少需要三个主节点，我们的环境中，每个主节点附带一个从节点，所以一共六个节点。端口为7001-7006。

在/app/redis3，并创建六个以端口号为名字的子目录，稍后我们在将每个目录中运行一个 Redis 实例：

cd /app/redis3 mkdir 7001 7002 7003 7004 7005 7006  cp /etc/redis3/conf/redis.conf  /app/redis3/7001/ ...... cp /etc/redis3/conf/redis.conf  /app/redis3/7006/

将redis.conf里的端口号修改为对应的端口。下面我们打开对应的目录，启动redis实例即可。

cd /app/redis3/7001;nohup redis-server redis.conf & cd /app/redis3/7002;nohup redis-server redis.conf & ......

实例打印的日志显示，因为 nodes.conf 文件不存在，所以每个节点都为它自身指定了一个新的 ID ,

/app/redis3/7006# tail -f nohup.out 27040:M 09 May 22:53:50.197 * No cluster configuration found, I'm 1984c27297c6ef50bbfcbd35c11b93cc40ba17e4 /app/redis3/7006# cat nodes.conf  d2b437ca8b9007dcdb63ac16210f6540860361e3 :0 myself,master - 0 0 0 connected vars currentEpoch 0 lastVoteEpoch 0

现在我们已经有了六个正在运行中的 Redis 实例，接下来我们需要使用这些实例来创建集群。通过使用 Redis 集群命令行工具 redis-trib ，编写节点配置文件的工作可以非常容易地完成： redis-trib 位于 Redis 源码的 src 文件夹中，它是一个 Ruby 程序，这个程序通过向实例发送特殊命令来完成创建新集群，检查集群，或者对集群进行重新分片（reshared）等工作。这里通过create命令来创建集群，指定replicas=1，即每一个主实例有一个从实例。redis-trib 会打印出一份预想中的配置给你看，如果你觉得没问题的话，就可以输入 yes ， redis-trib 就会将这份配置应用到集群当中,让各个节点开始互相通讯,最后可以得到如下信息

~/redis-3.0.1/src# apt-get install ruby gem ~/redis-3.0.1/src# gem sources -a http://ruby.taobao.org/ ~/redis-3.0.1/src# gem install redis ~/redis-3.0.1/src# cp redis-trib.rb /usr/local/redis3/bin/ ~/redis-3.0.1/src# ln -sf /usr/local/redis3/bin/redis-trib.rb /usr/bin/redis-trib.rb ~/redis-3.0.1/src# redis-trib.rb create --replicas 1  127.0.0.1:7001 127.0.0.1:7002 127.0.0.1:7003 127.0.0.1:7004 127.0.0.1:7005 127.0.0.1:7006 M: 1984c27297c6ef50bbfcbd35c11b93cc40ba17e4 127.0.0.1:7001    slots:0-5460 (5461 slots) master M: 481e256be4c724f5a2c64a761e52b4be61ca45b4 127.0.0.1:7002    slots:5461-10922 (5462 slots) master M: b5b652fa02d9999861e66c843b01fd2700c02adf 127.0.0.1:7003    slots:10923-16383 (5461 slots) master S: 821ec823dc0c2d4f65319e84fe74157fb1014155 127.0.0.1:7004    replicates 1984c27297c6ef50bbfcbd35c11b93cc40ba17e4 S: b3b8541b9520d707180d56a2fb3cf3ee6895ed10 127.0.0.1:7005    replicates 481e256be4c724f5a2c64a761e52b4be61ca45b4 S: d2b437ca8b9007dcdb63ac16210f6540860361e3 127.0.0.1:7006    replicates b5b652fa02d9999861e66c843b01fd2700c02adf Can I set the above configuration? (type 'yes' to accept): [OK] All nodes agree about slots configuration. >>> Check for open slots... >>> Check slots coverage... [OK] All 16384 slots covered.

以上信息的其中一部分可以通过向集群中的任意节点（主节点或者从节点都可以）发送 CLUSTER NODES 命令来获得。该命令还可以获得节点 ID ， IP 地址和端口号，标志（flag），最后发送 PING 的时间，最后接收 PONG 的时间，连接状态，节点负责处理的槽。

redis-cli -p 7001 cluster nodes 481e256be4c724f5a2c64a761e52b4be61ca45b4 127.0.0.1:7002 master - 0 1431186119174 2 connected 5461-10922 b3b8541b9520d707180d56a2fb3cf3ee6895ed10 127.0.0.1:7005 slave 481e256be4c724f5a2c64a761e52b4be61ca45b4 0 1431186120677 5 connected d2b437ca8b9007dcdb63ac16210f6540860361e3 127.0.0.1:7006 slave b5b652fa02d9999861e66c843b01fd2700c02adf 0 1431186119174 6 connected b5b652fa02d9999861e66c843b01fd2700c02adf 127.0.0.1:7003 master - 0 1431186118673 3 connected 10923-16383 821ec823dc0c2d4f65319e84fe74157fb1014155 127.0.0.1:7004 slave 1984c27297c6ef50bbfcbd35c11b93cc40ba17e4 0 1431186120176 4 connected 1984c27297c6ef50bbfcbd35c11b93cc40ba17e4 127.0.0.1:7001 myself,master - 0 0 1 connected 0-5460

5. 连接Redis集群

通过上面的输出，我们可以看出Redis三个主节点的slot范围。一个 Redis 客户端可以向集群中的任意节点（包括从节点）发送命令请求。我们首先连接第一个节点：

redis-cli -p 7001 127.0.0.1:7001> set a 1  (error) MOVED 15495 127.0.0.1:7003 127.0.0.1:7001> get a (error) MOVED 15495 127.0.0.1:7003 127.0.0.1:7001> set b 1 OK

节点会对命令请求进行分析和key的slot计算，并且会查找这个命令所要处理的键所在的槽。如果要查找的哈希槽正好就由接收到命令的节点负责处理，那么节点就直接执行这个命令。

另一方面，如果所查找的槽不是由该节点处理的话，节点将查看自身内部所保存的哈希槽到节点 ID 的映射记录，并向客户端回复一个 MOVED 错误。上面的错误信息包含键 x 所属的哈希槽15495，以及负责处理这个槽的节点的 IP 和端口号 127.0.0.1:7003 。

虽然我们用Node ID来标识集群中的节点，但是为了让客户端的转向操作尽可能地简单，节点在 MOVED 错误中直接返回目标节点的 IP 和端口号，而不是目标节点的 ID 。客户端应该记录槽15495由节点127.0.0.1:7003负责处理“这一信息，这样当再次有命令需要对槽15495执行时，客户端就可以加快寻找正确节点的速度。这样，当集群处于稳定状态时，所有客户端最终都会保存有一个哈希槽至节点的映射记录，使得集群非常高效：客户端可以直接向正确的节点发送命令请求，无须转向、代理或者其他任何可能发生单点故障（single point failure）的实体（entiy）。

参考：

http://www.redis.cn/topics/cluster-tutorial.html

http://redis.readthedocs.org/en/latest/topic/cluster-spec.html

https://github.com/HunanTV/redis-cerberus/wiki/Redis-%E9%9B%86%E7%BE%A4%E4%BB%A3%E7%90%86%E5%9F%BA%E6%9C%AC%E5%8E%9F%E7%90%86%E4%B8%8E%E4%BD%BF%E7%94%A8

正文到此结束