「这样看,没啥问题」。我们再看第二个流程图,如下:
OK,酱紫,就有问题了吧,老数据入到缓存了,「每次读都是老数据啦,缓存与数据与数据库数据不一致了」。
缓存维护方案二
上个方案是一读一写,如果是双写操作,「先操作缓存,在操作数据库」,会怎么样呢?
「这样看,也没啥问题。」,但是有时候可能事与愿违,我们再看第二个流程图,如下:
执行完后,缓存保存的是B操作后的数据,数据库是A操作后的数据,「缓存和数据库数据不一致」。
缓存维护方案三
一写(线程A)一读(线程B)操作,「先操作数据库,再操作缓存」。
这种方案「没有明显的并发问题」,但是有可能「步骤二删除缓存失败」,虽然概率比较小,「优于方案一和方案二」,平时工作中也是使用方案三。
综上对比,我们一般采用方案三,但是有没有完美全解决方案三的弊端的方法呢?
缓存维护方案四
这个是方案三的改进方案,都是先操作数据库再操作缓存,我们来看一下流程图:
通过数据库的「binlog」来「异步淘汰key」,以mysql为例可以「使用阿里的canal将binlog日志采集发送到MQ队列」里面,然后「通过ACK机制确认处理」 这条更新消息,删除缓存,保证数据缓存一致性。
但是呢还有个问题,「如果是主从数据库呢」?
缓存维护方案五
主从DB问题:因为主从DB同步存在延时时间。如果删除缓存之后,数据同步到备库之前已经有请求过来时,「会从备库中读到脏数据」,如何解决呢?解决方案如下流程图:
缓存维护总结
综上所述,在分布式系统中,缓存和数据库同时存在时,如果有写操作的时候,「先操作数据库,再操作缓存」。如下: