故障案例:定时备份可能引起的问题
场景1:db内存1.5G,业务非常少,平时qps不到10,每天凌晨5点到9点内存使用飙升到100%,内存100%时qps有个激增到20,cpu使用率也有激增
解决方法
1 查看缓冲池大小是900M
mysql> show variables like '%innodb_buffer_pool_size%';
+-------------------------+-----------+
| Variable_name | Value |
+-------------------------+-----------+
| innodb_buffer_pool_size | 943718400 |
+-------------------------+-----------+
1 row in set (0.00 sec)
2 查看缓冲池使用率 show engine innodb status。查看还剩41226*16/1024=644M
Buffer pool size 57599
Free buffers 41226
Database pages 16326
Old database pages 6040
Modified db pages 13
3 由于周期性的原因。查看当时的定时备份时间,发现開始时间正好是晚上5点。确认是db备份引起的
backup_count: 7
backup_begintime: 5
backup_duration: 24
manual_backup_count: 3
4 由于mysqldump前会有一个flush tables with read lock的操作来记录下当前状态show master status,假设当前有查询,这个操作会等待全部当前查询完毕后才运行。内存较少,建议客户升级内存,优化慢查询。
场景2:主库在每天凌晨3点。连接数突然从600激增到1200以上,并堆积很多慢查询,持续几个小时。其它监控參数都比較正常
解决方法
1 查看到当时的慢查询均是些简单SQL,SQL语句本身不存在问题
2 查看到主库备份时间为凌晨3点。确定是定时备份引起的
3 由于正好存在从库。兴许将定时备份移到从库解决,mysqldump --dump-slave=2
相关文章
- springboot的事务的隔离级别与操作案例
- css案例学习之ul li dl dt dd实现二级菜单
- css案例学习之继承关系
- 【Java】嵌套For循环性能优化案例
- 基于遗传算法改进的BP神经网络汽车拖拉机外观设计优化,基于GUI的汽车优化系统,BP神经网络详细原理,神经网络1000案例之12
- NLP自然语言处理系列- week6-文本生成案例(4)(PGN模型代码)
- 《Spark商业案例与性能调优实战100课》第13课:商业案例之纯粹通过DataSet进行电商交互式分析系统中特定时段段访问次数TopN
- css盒子模型及其实战案例(下)
- 第7.24节 Python案例详解:使用property函数定义属性简化属性访问代码实现
- 第7.11节 案例详解:Python类实例变量
- 几个学习流媒体的案例代码网址
- lua基本语法案例