即时聊天(IM)存储方案
单位即时聊天改版了.
正好趁着这次机会踢了MongoDB.
大家都拍手叫好..可见MongoDB这玩意多么的不得人心...都觉得不好用..
场景描述:
我们的IM软件有PC端和手机端.
同时在线的用户,通过长连接转发,并且存储消息.
接收方不在线,存储消息.
用户打开电脑端软件或者手机端网络掉线重新连接,都需要获取未读消息数量.当用户点击未读消息的时候,提供消息正文.
经过抽象,JAVA这块需要提供两个接口
1.获取用户的未读消息列表
2.给定发送方ID和接收方ID,返回消息内容.
发送方用户ID srcid
接收方用户ID destid
每个会话的当前消息ID mid(针对每个发送方和接收方,自增)
1.发送方用户通过电脑将消息发送至Web服务器.消息主要内容(srcid,destid,msg)
2.Web服务器根据srcid,destid获取会话的mid(会话状态的自增ID)
3.将消息放入持久化队列,并且更新redis未读消息列表
首先将(srcid,destid,mid,msg)放入持久化队列.
然后更新redis的用户未读消息列表.
未读消息列表在Redis的存储结构如下.
在接收方ID的前面增加一个前缀,表明是手机未读消息还是PC未读消息.这个作为key
value是一个HashMap.这个HashMap的key是发送方ID,value是未读消息数量.
一旦用户登录,直接拉取该用户的HashMap内容展示.
这部分内容是有过期时间的,假如用户长时间未使用.这个PC-destid和Mobile-destid的条目将被删除.
如果程序发现这个条目不存在.则去数据库中查询未读消息列表.
假如我的ID是1000,老板的ID是1001,老板给我发送了三条消息,但是我一直没有在线.
程序将做如下操作.
127.0.0.1:6379> HINCRBY pc-1000 1001 1
(integer) 1
127.0.0.1:6379> HINCRBY pc-1000 1001 1
(integer) 2
127.0.0.1:6379> HINCRBY pc-1000 1001 1
(integer) 3
127.0.0.1:6379> HINCRBY mobile-1000 1001 1
(integer) 1
127.0.0.1:6379> HINCRBY mobile-1000 1001 1
(integer) 2
127.0.0.1:6379> HINCRBY mobile-1000 1001 1
(integer) 3
如果我登录手机客户端,点击未读消息.则对Redis操作如下,删除对应条目
127.0.0.1:6379> hdel mobile-1000 1001
(integer) 1
127.0.0.1:6379>
并且回写数据库一个状态标识(已读的最大mid).这个回写数据库的过程,也是异步的,每隔30s回写一次数据库状态.
这个时候,我登录PC端,还是可以查看未读消息数量的.这个业务要求有点奇怪.但是要求就是这么做.
4.如果发送方的其他设备在线,或者接收方的设备在线,则转发消息.
5.JAVA从队列中异步获取消息,然后批量Insert到数据库.
数据库存储设计
初始设计使用4台MySQL分库.使用(发送方用户ID+接收方用户ID) mod 64
这样的好处是,A用户发送B用户和B用户发送A用户的消息,都会落在同一个底层数据库.
这样获取A,B之间的聊天内容,使用一个SQL查询即可.
聊天消息表,本身也是按照时间进行分区
- create table chat_msg(
- id bigint auto_increment,
- srcid bigint not null,
- destid bigint not null,
- mid bigint not null,
- msg TEXT,
- ts timestamp not null default current_timestamp,
- hashvalue tinyint not null,
- primary key (id,ts)
- )partition by range(UNIX_TIMESTAMP(ts))
- (
- partition p201511 VALUES LESS THAN(UNIX_TIMESTAMP('2015-11-01 00:00:00')),
- partition p201512 VALUES LESS THAN(UNIX_TIMESTAMP('2015-12-01 00:00:00')),
- partition p201601 VALUES LESS THAN(UNIX_TIMESTAMP('2016-01-01 00:00:00'))
- );
用户状态表
sessionId是聊天双方,(较小的ID在前,较大的ID在后) 的会话状态信息
pcMid是用户pc端已读的最大消息ID
mobileMid是用户手机端已读的最大消息ID
hashvalue是(发送方用户ID+接收方用户ID) mod 64 计算后的值.暂时没有用.
- create table read_chat_mid(
- id bigint primary key auto_increment,
- uid bigint not null,
- sessionId varchar(45) not null,
- pcMid bigint not null default 0,
- mobileMid bigint not null default 0,
- hashvalue tinyint not null,
- ts timestamp not null default current_timestamp on update current_timestamp
- );
获取用户未读消息的SQL如下.
- create index inx_1 on chat_msg(ts,srcid,destid,mid);
-
- create unique index inx_2 on read_chat_mid(uid,sessionId);
-
查询用户1,2之间的聊天内容
- select mid,srcid,destid,msgpb,ts from im_0.chat_msg_3 where id in (
- select t.id from(
- select t1.id from
- (
- (select id from im_0.chat_msg_3 where srcid=1 and destid=2
- and ts>now()-interval '1' month
- and mid>ifnull((select mobileMid from im_0.read_chat_mid_3 where sessionId='1,2' and uid=1),0) order by ts desc limit 200)
- union all
- (select id from im_0.chat_msg_3 where srcid=2 and destid=1
- and ts>now()-interval '1' month
- and mid>ifnull((select mobileMid from im_0.read_chat_mid_3 where sessionId='1,2' and uid=1),0) order by ts desc limit 200)
- ) as t1 order by id desc limit 200
- ) as t
- ) order by mid desc;
系统性能评估
MySQL基本配置
innodb_buffer_pool_size=512m
innodb_flush_log_at_trx_commit =0
sync_binlog=0
innodb_support_xa=0
log_bin=master
下面是工作环境测试,在生产服务器上使用raid10,IO能力还会进一步提升.
每个月每台数据库服务器 在200w记录之前,使用Load File接口,每秒Insert可以达到 1.7w左右
每个月每台数据库服务器 在800w记录之前,使用Load File接口,每秒Insert可以达到 1.1w左右
可以认为系统每秒Insert至少在4w以上.
理论上的系统最大处理能力至少在每秒64w以上.
仅仅是四台数据库的情况,对于我们的业务.5年之内应该都不用考虑扩容的问题.
让DBA做架构设计的好处是,不会把坑留在数据库层面坑自己...
正文到此结束