当前位置：首页 > 黑客教程 > 正文内容

redis和mysql数据同步原理（redis保证和数据库事务一致）

访客3年前 (2022-03-22)黑客教程754

作者：sinxu，腾讯 CSIG 后台开发工程师

1. 什么是数据的一致性

“数据一致”一般指的是：缓存中有数据，缓存的数据值 = 数据库中的值。

但根据缓存中是有数据为依据，则”一致“可以包含两种情况：

缓存中有数据，缓存的数据值 = 数据库中的值（需均为最新值，本文将“旧值的一致”归类为“不一致状态”）缓存中本没有数据，数据库中的值 = 最新值（有请求查询数据库时，会将数据写入缓存，则变为上面的“一致”状态）

”数据不一致“：缓存的数据值 ≠ 数据库中的值；缓存或者数据库中存在旧值，导致其他线程读到旧数据

2. 数据不一致情况及应对策略

根据是否接收写请求，可以把缓存分成读写缓存和只读缓存。

只读缓存：只在缓存进行数据查找，即使用 “更新数据库+删除缓存” 策略；

读写缓存：需要在缓存中对数据进行增删改查，即使用 “更新数据库+更新缓存”策略。

2.1 针对只读缓存（更新数据库+删除缓存）

只读缓存：新增数据时，直接写入数据库；更新（修改/删除）数据时，先删除缓存。后续，访问这些增删改的数据时，会发生缓存缺失，进而查询数据库，更新缓存。

新增数据时，写入数据库；访问数据时，缓存缺失，查数据库，更新缓存（始终是处于”数据一致“的状态，不会发生数据不一致性问题)

更新（修改/删除）数据时，会有个时序问题：更新数据库与删除缓存的顺序（这个过程会发生数据不一致性问题）

在更新数据的过程中，可能会有如下问题：

无并发请求下，其中一个操作失败的情况并发请求下，其他线程可能会读到旧值

因此，要想达到数据一致性，需要保证两点：

无并发请求下，保证 A 和 B 步骤都能成功执行并发请求下，在 A 和 B 步骤的间隔中，避免或消除其他线程的影响

接下来，我们针对有/无并发场景，进行分析并使用不同的策略。

A. 无并 *** 况

无并发请求下，在更新数据库和删除缓存值的过程中，因为操作被拆分成两步，那么就很有可能存在“步骤 1 成功，步骤 2 失败” 的情况发生（由于单线程中步骤 1 和步骤 2 是串行执行的，不太可能会发生 “步骤 2 成功，步骤 1 失败” 的情况）。

(1) 先删除缓存，再更新数据库

(2) 先更新数据库，再删除缓存

解决策略：

a.消息队列+异步重试

无论使用哪一种执行时序，可以在执行步骤 1 时，将步骤 2 的请求写入消息队列，当步骤 2 失败时，就可以使用重试策略，对失败操作进行 “补偿”。

具体步骤如下：

把要删除缓存值或者是要更新数据库值操作生成消息，暂存到消息队列中（例如使用 Kafka 消息队列）；当删除缓存值或者是更新数据库值操作成功时，把这些消息从消息队列中去除（丢弃），以免重复操作；当删除缓存值或者是更新数据库值操作失败时，执行失败策略，重试服务从消息队列中重新读取（消费）这些消息，然后再次进行删除或更新；删除或者更新失败时，需要再次进行重试，重试超过的一定次数，向业务层发送报错信息。

b.订阅 Binlog 变更日志

创建更新缓存服务，接收数据变更的 MQ 消息，然后消费消息，更新/删除 Redis 中的缓存数据；使用 Binlog 实时更新/删除 Redis 缓存。利用 C *** ，即将负责更新缓存的服务伪装成一个 MySQL 的从节点，从 MySQL 接收 Binlog，解析 Binlog 之后，得到实时的数据变更信息，然后根据变更信息去更新/删除 Redis 缓存；MQ+C *** 策略，将 C *** Server 接收到的 Binlog 数据直接投递到 MQ 进行解耦，使用 MQ 异步消费 Binlog 日志，以此进行数据同步；

不管用 MQ/C *** 或者 MQ+C *** 的策略来异步更新缓存，对整个更新服务的数据可靠性和实时性要求都比较高，如果产生数据丢失或者更新延时情况，会造成 MySQL 和 Redis 中的数据不一致。因此，使用这种策略时，需要考虑出现不同步问题时的降级或补偿方案。

B. 高并 *** 况

使用以上策略后，可以保证在单线程/无并发场景下的数据一致性。但是，在高并发场景下，由于数据库层面的读写并发，会引发的数据库与缓存数据不一致的问题（本质是后发生的读请求先返回了）

(1) 先删除缓存，再更新数据库

假设线程 A 删除缓存值后，由于 *** 延迟等原因导致未及更新数据库，而此时，线程 B 开始读取数据时会发现缓存缺失，进而去查询数据库。而当线程 B 从数据库读取完数据、更新了缓存后，线程 A 才开始更新数据库，此时，会导致缓存中的数据是旧值，而数据库中的是最新值，产生“数据不一致”。其本质就是，本应后发生的“B 线程-读请求” 先于 “A 线程-写请求” 执行并返回了。

或者

解决策略：

a.设置缓存过期时间 + 延时双删

通过设置缓存过期时间，若发生上述淘汰缓存失败的情况，则在缓存过期后，读请求仍然可以从 DB 中读取最新数据并更新缓存，可减小数据不一致的影响范围。虽然在一定时间范围内数据有差异，但可以保证数据的最终一致性。

此外，还可以通过延时双删进行保障：在线程 A 更新完数据库值以后，让它先 sleep 一小段时间，确保线程 B 能够先从数据库读取数据，再把缺失的数据写入缓存，然后，线程 A 再进行删除。后续，其它线程读取数据时，发现缓存缺失，会从数据库中读取最新值。

redis.delKey(X)db.update(X)Thread.sleep(N)redis.delKey(X)

sleep 时间：在业务程序运行的时候，统计下线程读数据和写缓存的操作时间，以此为基础来进行估算：

注意：如果难以接受 sleep 这种写法，可以使用延时队列进行替代。

先删除缓存值再更新数据库，有可能导致请求因缓存缺失而访问数据库，给数据库带来压力，也就是缓存穿透的问题。针对缓存穿透问题，可以用缓存空结果、布隆过滤器进行解决。

(2) 先更新数据库，再删除缓存

如果线程 A 更新了数据库中的值，但还没来得及删除缓存值，线程 B 就开始读取数据了，那么此时，线程 B 查询缓存时，发现缓存命中，就会直接从缓存中读取旧值。其本质也是，本应后发生的“B 线程-读请求” 先于 “A 线程-删除缓存” 执行并返回了。

或者，在”先更新数据库，再删除缓存”方案下，“读写分离 + 主从库延迟”也会导致不一致：

解决方案：

a.延迟消息

凭借经验发送「延迟消息」到队列中，延迟删除缓存，同时也要控制主从库延迟，尽可能降低不一致发生的概率

b.订阅 binlog，异步删除

通过数据库的 binlog 来异步淘汰 key，利用工具(c *** )将 binlog 日志采集发送到 MQ 中，然后通过 ACK 机制确认处理删除缓存。

c.删除消息写入数据库

通过比对数据库中的数据，进行删除确认先更新数据库再删除缓存，有可能导致请求因缓存缺失而访问数据库，给数据库带来压力，也就是缓存穿透的问题。针对缓存穿透问题，可以用缓存空结果、布隆过滤器进行解决。

d.加锁

更新数据时，加写锁；查询数据时，加读锁保证两步操作的“原子性”，使得操作可以串行执行。“原子性”的本质是什么？不可分割只是外在表现，其本质是多个资源间有一致性的要求，操作的中间状态对外不可见。

建议：

优先使用“先更新数据库再删除缓存”的执行时序，原因主要有两个：

先删除缓存值再更新数据库，有可能导致请求因缓存缺失而访问数据库，给数据库带来压力；业务应用中读取数据库和写缓存的时间有时不好估算，进而导致延迟双删中的 sleep 时间不好设置。

2.2 针对读写缓存（更新数据库+更新缓存）

读写缓存：增删改在缓存中进行，并采取相应的回写策略，同步数据到数据库中

同步直写：使用事务，保证缓存和数据更新的原子性，并进行失败重试（如果 Redis 本身出现故障，会降低服务的性能和可用性）异步回写：写缓存时不同步写数据库，等到数据从缓存中淘汰时，再写回数据库（没写回数据库前，缓存发生故障，会造成数据丢失）该策略在秒杀场中有见到过，业务层直接对缓存中的秒杀商品库存信息进行操作，一段时间后再回写数据库。

一致性：同步直写 > 异步回写因此，对于读写缓存，要保持数据强一致性的主要思路是：利用同步直写同步直写也存在两个操作的时序问题：更新数据库和更新缓存

A. 无并 *** 况

B. 高并 *** 况

有四种场景会造成数据不一致：

针对场景 1 和 2 的解决方案是：保存请求对缓存的读取记录，延时消息比较，发现不一致后，做业务补偿针对场景 3 和 4 的解决方案是：对于写请求，需要配合分布式锁使用。写请求进来时，针对同一个资源的修改操作，先加分布式锁，保证同一时间只有一个线程去更新数据库和缓存；没有拿到锁的线程把操作放入到队列中，延时处理。用这种方式保证多个线程操作同一资源的顺序性，以此保证一致性。

其中，分布式锁的实现可以使用以下策略：

2.3 强一致性策略

上述策略只能保证数据的最终一致性。要想做到强一致，最常见的方案是 2PC、 *** C、Paxos、Raft 这类一致性协议，但它们的性能往往比较差，而且这些方案也比较复杂，还要考虑各种容错问题。如果业务层要求必须读取数据的强一致性，可以采取以下策略：

（1）暂存并发读请求

在更新数据库时，先在 Redis 缓存客户端暂存并发读请求，等数据库更新完、缓存值删除后，再读取数据，从而保证数据一致性。

（2）串行化

读写请求入队列，工作线程从队列中取任务来依次执行

修改服务 Service 连接池，id 取模选取服务连接，能够保证同一个数据的读写都落在同一个后端服务上修改数据库 DB 连接池，id 取模选取 DB 连接，能够保证同一个数据的读写在数据库层面是串行的

（3）使用 Redis 分布式读写锁

将淘汰缓存与更新库表放入同一把写锁中，与其它读请求互斥，防止其间产生旧数据。读写互斥、写写互斥、读读共享，可满足读多写少的场景数据一致，也保证了并发性。并根据逻辑平均运行时间、响应超时时间来确定过期时间。

public void write() {    Lock writeLock = redis.getWriteLock(lockKey);    writeLock.lock();    try {        redis.delete(key);        db.update(record);    } finally {        writeLock.unlock();    }}public void read() {    if (caching) {        return;    }    // no cache    Lock readLock = redis.getReadLock(lockKey);    readLock.lock();    try {        record = db.get();    } finally {        readLock.unlock();    }    redis.set(key, record);}

2.4 小结

针对读写缓存时：同步直写，更新数据库+更新缓存：

针对只读缓存时：更新数据库+删除缓存：

较为通用的一致性策略拟定：

在并发场景下，使用 “更新数据库 + 更新缓存” 需要用分布式锁保证缓存和数据一致性，且可能存在”缓存资源浪费“和”机器性能浪费“的情况；一般推荐使用 “更新数据库 + 删除缓存” 的方案。如果根据需要，热点数据较多，可以使用 “更新数据库 + 更新缓存” 策略。

在 “更新数据库 + 删除缓存” 的方案中，推荐使用推荐用 “先更新数据库，再删除缓存” 策略，因为先删除缓存可能会导致大量请求落到数据库，而且延迟双删的时间很难评估。在 “先更新数据库，再删除缓存” 策略中，可以使用“消息队列+重试机制” 的方案保证缓存的删除。并通过 “订阅 binlog” 进行缓存比对，加上一层保障。

此外，需要通过初始化缓存预热、多数据源触发、延迟消息比对等策略进行辅助和补偿。【多种数据更新触发源：定时任务扫描，业务系统 MQ、binlog 变更 MQ，相互之间作为互补来保证数据不会漏更新】

3. 数据一致性中需要注意的其他问题有哪些？

(1) k-v 大小的合理设置

Redis key 大小设计：由于 *** 的一次传输 MTU 更大为 1500 字节，所以为了保证高效的性能，建议单个 k-v 大小不超过 1KB，一次 *** 传输就能完成，避免多次 *** 交互；k-v 是越小性能越好Redis 热 key：（1）当业务遇到单个读热 key，通过增加副本来提高读能力或是用 hashtag 把 key 存多份在多个分片中；（2）当业务遇到单个写热 key，需业务拆分这个 key 的功能，属于设计不合理- 当业务遇到热分片，即多个热 key 在同一个分片上导致单分片 cpu 高，可通过 hashtag 方式打散——[引自腾讯云技术分享]

(2 )避免其他问题导致缓存服务器崩溃，进而简直导致数据一致性策略失效

缓存穿透、缓存击穿、缓存雪崩、机器故障等问题：

(3)方案选定的思路

确定缓存类型（读写/只读）确定一致性级别确定同步/异步方式选定缓存流程补充细节

参考

https://xie.infoq.cn/article/1322475e05c11bd2aacd8bc73https://www.infoq.cn/article/Hh4IOuIiJHWB4X46vxeOhttps://time.geekbang.org/column/article/217593https://xie.infoq.cn/article/ab2599366009928a17fe498fb缓存与数据库一致性保证https://time.geekbang.org/column/article/295812https://blog.csdn.net/chengh1993/article/details/112685774https://juejin.cn/post/6850418120201666568

扫描二维码推送至手机访问。

本文链接：https://w-123.com/59485.html

标签: 原理

返回列表

上一篇：卡布西游宿命的羁绊(卡布西游宿命的羁绊任务)

下一篇：seo关键词快速排名前三位是哪个，关键词排名快速提升技巧

“redis和mysql数据同步原理（redis保证和数据库事务一致）” 的相关文章

Lapsus$ 再出手：泄漏 Globant 软件公司 70GB 数据

就在英国警方逮捕了 7 名嫌疑犯之后，近期非常猖獗的黑客组织 Lapsus$ 又有了新动作。在攻击微软、三星、NVIDIA 和 Okta 等公司之后，该组织再次宣布成功攻陷 Globant，后者是一家位于卢森堡的软件开发咨询公司。在周三宣布自己“度假归来”之后，该组织在其 Telegram 频道...

技术专家与黑客展开竞赛以确保电动汽车网络电网的安全

电动汽车（EV）革命来了。在过去的十年里，插电式混合动力电动车已经从16000辆增长到超过200万辆，汽车高管们预计到2030年，超过50%的美国汽车将是全电动的。不难看出，专家们为何做出如此乐观的预测。除了不断增长的电动汽车车队，今年早些时候签署的美国国会两党基础设施协议将包括75亿美元，以帮助规...

攻击者部署后门，窃取 Exchange 电子邮件

网络安全研究人员将该 APT 组织追踪为 UNC3524，并强调在某些情况下，该组织可以对受害者环境进行超过 18 个月的访问，展示了其 “先进 “的隐匿能力。在每一个 UNC3524 受害者环境中，攻击者都会针对一个子集的邮箱，集中其注意力在执行团队和从事企业发展、兼并和收购的员工或 IT 安...

Log4j 漏洞可能需要数月甚至数年时间才能妥善解决

网络安全专家认为 CVE-2021-44228 的普遍性以及容易被利用，这个 Log4j 中的远程代码执行漏洞可能需要数月甚至数年时间才能得到妥善解决。McAfee Enterprise 和 FireEye 的高级威胁研究主管 Steve Povolny 表示，Log4Shell 的破坏力完全和 S...

美敦力公司召回部分胰岛素泵控制器，以应对网络攻击风险

医疗设备制造商美敦力公司(Medtronic)已召回其部分胰岛素泵使用的遥控器，因为这些遥控器存在严重的漏洞，可能导致患者受伤或死亡。攻击者可以利用漏洞来改变胰岛素泵提供给病人的剂量。 “MiniMed™远程控制器使用无线射频(RF)与胰岛素泵通信，可以在不按任何胰岛素泵按钮的情况下将一定量的胰岛...