您现在的位置是：首页 > 数据库

当前栏目

分析MySQL 主从延迟与读写分离的不同解决方案

mysql 解决方案分析不同读写主从分离延迟

2023-06-13 09:19:14 时间

前言：

我们都知道互联网数据有个特性，大部分场景都是读多写少，比如：微博、微信、淘宝电商，按照二八原则，读流量占比甚至能达到 90%。

结合这个特性，我们对底层的数据库架构也会做相应调整。采用读写分离。

处理过程：

客户端会集成 SDK，每次执行 SQL 时，会判断是写或读操作。如果是写 SQL，请求会发到主库。主数据库执行SQL，事务提交后，会生成 binlog ，并同步给从库。从库通过 SQL 线程回放 binlog ，并在从库表中生成相应数据。如果是读 SQL，请求会通过负载均衡策略，挑选一个从库处理用户请求。

看似非常合理，细想却不是那么回事。

主库与从库是采用异步复制数据，如果这两者之间数据还没有同步怎么办?

主库刚写完数据，从库还没来得及拉取最新数据，读请求就来了，给用户的感觉，数据丢了?

针对这个问题，今天，我们就来探讨下有什么解决方案?

一、强制走主库

针对不用的业务诉求，区别性对待。

场景一：

如果是对数据的实时性要求不是很高，比如：大V有千万粉丝，发布一条微博，粉丝晚几秒钟收到这条信息，并不会有特别大的影响。这时，可以走从库。

场景二：

如果对数据的实时性要求非常高，比如金融类业务。我们可以在客户端代码标记下，让查询强制走主库。

二、从库延迟查询

由于主从库之间数据同步需要一定的时间间隔，那么有一种策略是延迟从从库查询数据。

比如：

select sleep(1)
select * from order where order_id=11111;

在正式的业务查询时，先执行一个sleep 语句，给从库预留一定的数据同步缓冲期。

因为是采用一刀切，当面对高并发业务场景时，性能会下降的非常厉害，一般不推荐这个方案。

三、判断主从是否延迟?决定选主库还是从库

之前写过一篇文章《京东一面：MySQL 主备延迟有哪些坑?主备切换策略》。

有讲过什么是主备延迟?、主备延迟的常见原因?

方案一：

在从库执行命令 show slave status。

查看seconds_behind_master 的值，单位为秒，如果为 0，表示主备库之间无延迟。

方案二：

比较主从库的文件点位。

还是执行show slave status，响应结果里有截个关键参数。

Master_Log_File 读到的主库最新文件。 Read_Master_Log_Pos 读到的主库最新文件的坐标位置。 Relay_Master_Log_File 从库执行到的最新文件。 Exec_Master_Log_Pos 从库执行到的最新文件的坐标位置。

两两比较，上面的参数是否相等。

方案三：

比较 GTID 集合。

Auto_Position=1 主从之间使用 GTID 协议。 Retrieved_Gtid_Set 从库收到的所有binlog日志的 GTID 集合。 Executed_Gtid_Set 从库已经执行完成的 GTID 集合。

比较 Retrieved_Gtid_Set 和 Executed_Gtid_Set 的值是否相等。

在执行业务SQL操作时，先判断从库是否已经同步最新数据。从而决定是操作主库，还是操作从库。

缺点：

无论采用上面哪一种方案，如果主库的写操作频繁不断，那么从库的值永远跟不上主库的值，那么读流量永远是打在了主库上。

1.针对这个问题，有什么解决方案?

这个问题跟 MQ消息队列既要求高吞吐量又要保证顺序是一样的，从全局来看确实无解，但是缩小范围就容易多了，我们可以保证一个分区内的消息有序。

回到主从库之间的数据同步问题，从库查询哪条记录，我们只要保证之前对应的写binglog已经同步完数据即可，可以不用管主从库的所有的事务binlog 是否同步。

问题是不是一下简单多了。

四、从库节点判断主库位点

在从库执行下面命令，返回是一个正整数 M，表示从库从参数节点开始执行了多少个事务。

select master_pos_wait(file, pos[, timeout]);

缺点：

master_pos_wait 返回结果无法与具体操作的数据行做关联，所以每次接收读请求时，从库还是无法确认是否已经同步数据，方案实用性不高。

五、比较 GTID

执行下面查询命令：

阻塞等待，直到从库执行的事务中包含gtid_set，返回 0。超时，返回 1。 select wait_for_executed_gtid_set(gtid_set, 1);

MySQL 5.7.6 版本开始，允许在执行完更新类事务后，把这个事务的 GTID 返回给客户端。具体操作，将参数session_track_gtids 设置为OWN_GTID，调用 API 接口mysql_session_track_get_first 返回结果解析出 GTID。

处理流程：

发起写 SQL 操作，在主库成功执行后，返回这个事务的 GTID。发起读 SQL 操作时，先在从库执行 select wait_for_executed_gtid_set (gtid_set, 1)。如果返回 0，表示已经从库已经同步了数据，可以在从库执行查询操作。否则，在主库执行查询操作。

缺点：

跟上面的 master_pos_wait 类似，如果写操作与读操作没有上下文关联，那么 GTID 无法传递。方案实用性不高。

六、引入缓存中间件

高并发系统，缓存作为性能优化利器，应用广泛。我们可以考虑引入缓存作为缓冲介质。

处理过程：

客户端写 SQL ，操作主库。同步将缓存中的数据删除。当客户端读数据时，优先从缓存加载。如果缓存中没有，会强制查询主库预热数据。

缺点：

K-V 存储，适用一些简单的查询条件场景。如果复杂的查询，还是要查询从库。

七、数据分片

参考 Redis Cluster 模式，集群网络拓扑通常是 3主 3从，主节点既负责写，也负责读。

通过水平分片，支持数据的横向扩展。由于每个节点都是独立的服务器，可以提高整体集群的吞吐量。

1.转换到数据库方面

常见的解决方式，是分库分表，每次读写都是操作主库的一个分表，从库只用来做数据备份。当主库发生故障时，主从切换，保证集群的高可用性。

到此这篇关于分享MySQL 主从延迟与读写分离的七种解决方案的文章就介绍到这了,更多相关MySQL主从延迟读写分离解决方案内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持！

我想要获取技术服务或软件
服务范围：MySQL、ORACLE、SQLSERVER、MongoDB、PostgreSQL 、程序问题
服务方式：远程服务、电话支持、现场服务，沟通指定方式服务
技术标签：数据恢复、安装配置、数据迁移、集群容灾、异常处理、其它问题

本站部分文章参考或来源于网络，如有侵权请联系站长。
数据库远程运维分析MySQL 主从延迟与读写分离的不同解决方案

猜你喜欢

python json转字符串_在python中将json转换为字符串
提升Redis集群单机提速轻松来（redis集群单数台）
Oracle数据库中使用Trim6进行数据修剪（oracle trim6）
MySQL数据库：免费软件下载体验（mysql数据库软件下载）
Yii框架调试心得--在页面输出执行sql语句
历经艰险：探索Oracle查询的历史锁定（oracle 查询历史锁）
oracle索引不能使用深入解析
Redis槽简化了分布式数据库管理（什么是redis槽）
sap的内核升级，修补了源代码保护的方式详解编程语言
s遇到错误不要慌，教你方法走四方详解编程语言
在 Shell 脚本中调用另一个 Shell 脚本的三种方式
九号公司上市后首次架构调整：成立四大机器人团队，要在未来扳回一局
的用法Oracle数据库中冒号参数的使用（oracle中冒号）
视图Ext.Viewport和窗口Ext.Window用法详解编程语言
Magnet for mac(窗口辅助管理工具)中文版
Linux中虚拟内存映射技术的应用原理与实践（虚拟内存映射linux）
【剑指offer】队列&栈篇-含题目代码思路解析