分库分表的时候,仍然有多维度查询的需求,这个时候,常见方式是做索引表,索引表有多种实现方式,可以用redis, 可以用mysql binlog 实现等等,当用redis 实现索引表,我们怎么去设计?我们要主要哪些要点呢?比如我们以外卖订单为例,用district 分表,分别建立商户的索引表和乘客的索引表。

  1. 我们的查询需求有哪些?
  2. 用redis 做索引表,我们用什么数据结构合适?怎么设计?
  3. 索引表与主库怎么保证一致性?

我们有哪些需求?

查询需求主要有来自订单id 的,来自商家id,来自买家id的需求,同时,还有查询商家历史订单,查询买家历史订单。然后,我们全国的订单,默认如果按照地区分表,这里商家id 和买家id 如果跟订单id 和地区映射起来?同时,历史订单,涉及了时间维度,如何设计索引数据结构?

如何用redis 做索引表?

使用redis 如果满足上面的索引需求?这里zset 是非常合适的。

新建订单

zadd salerId timestamp OrderId+district;
zadd buyerId timestamp OrderId+district;

查询商家历史订单

zrange salerId  timestamp1 timestamp2
select * from table where order_id =xxx;

查询买家历史订单

zrange buyerId  timestamp1 timestamp2
select * from table where order_id =xxx;

索引表表和主库的一致性如何保证?

索引表需要跟主库订单表是强一致的,这里有几个问题。写的时候是先写redis 还是先写mysql ,读的时候redis 没读到,但是mysql 有改如果处理? 其实比较好处理,写先写redis,读的时候读不到直接返回。强一致需要redis 和 mysql 定时对账,然后redis 为了防止被开发误操作,需要权限校验,key 审核,要在codis 层过滤一遍key,过滤掉flush 等指令。

综上,利用redis 做mysql 的二级索引其实是可行的方案,在一些大公司也有过一些实践。使用redis 做索引表有什么缺陷呢?毕竟redis 是内存结构,如果发生数据丢失,索引重构是非常恶心的。

09-01 20:53