MySQL(五)缓存策略

  • Post author:
  • Post category:mysql




MySQL系列文章


MySQL(一)基本架构、SQL语句操作、试图



MySQL(二)索引原理以及优化



MySQL(三)SQL优化、Buffer pool、Change buffer



MySQL(四)事务原理及分析



MySQL(五)缓存策略



MySQL(六)主从复制



数据库三范式




mysql为什么需要缓存?

当随着业务的扩大,数据量逐渐增大,会增加mysql读写压力。

一般在中间增加redis作为mysql的缓存。

mysql缓存方案:缓存用户定义的热点数据,用户直接从缓存获取热点数据,降低数据的读压力。



mysql缓存的使用场景?

内存访问速度是磁盘速度的10万倍(数量级)

读的需求远远大于写的需求

MySQL自身缓冲层跟业务无关(比如buffer pool)

MySQL作为项目主要数据库,便于统计分析

缓存数据库作为辅助数据库,存放热点数据



为什么需要缓冲层?

读多写少,单个主节点能支撑项目数据量;数据的主要依据是 mysql;



缓冲层的选择

缓存数据库可以选用 redis,memcached;它们所有数据都存储在内存当中,当然也可以将内存当中的数据持久化到磁盘当中;



总结

  • 由于 mysql 的缓冲层不由用户来控制,也就是不能由用户来控制缓存具体数据;
  • 访问磁盘的速度比较慢,尽量获取数据从内存中获取,所以需要缓存从内存中读取;
  • 主要解决读的性能;因为写没必要优化,必须让数据正确的落盘;如果写性能出现问题,那么可以使用横向扩展集群方式来解决;
  • 项目中需要存储的数据应该远大于内存的容量,同时需要进行数据统计分析,所以数据存储获取的依据应该是关系型数据库;
  • 缓存数据库可以存储用户自定义的热点数据;以下的讨论都是基于热点数据的同步问题;

    在这里插入图片描述



缓冲层存在的问题

没有缓冲层之前,我们对数据的读写都是基于 mysql;所以不存在同步问题;

引入缓冲层后,我们对数据的获取需要分别操作缓存数据库和 mysql;那么这个时候数据可能存在几个状态?

  1. mysql 有,缓存无
  2. mysql 无,缓存有
  3. 都有,但数据不一致
  4. 都有,数据一致
  5. 都没有

    其中1、4、5都可以接受的状态,需要制定读写策略来避免2,3情况的产生。



读写策略


读策略

:先读redis:没命中数据,则读Mysql;redis有数据,则直接返回。

读Mysql中:没命中数据,则返回没有;命中数据,则将Mysql读到的数据同步到redis。


写策略

:分为安全优先和效率优先两种(insert,update,delete)

安全优先:删除缓存,然后写mysql,接着mysql把数据同步到redis

效率优先:先写redis,如果是插入和更新操作,把key设置过期时间(比如200ms),然后再写mysql,最后mysql同步到redis。(安全问题只会影响200ms)。

通过读写策略可以解决缓冲层的问题,但是在MySQL数据同步到redis时有一些同步方案。



同步方案

  1. 触发器+UDF函数
  2. 伪装数据库



触发器+UDF函数

步骤:

  1. 在MySQL中对要操作的数据设置触发器Trigger,监听操作
  2. 客户端(NodeServer)向MySQL中写入数据时,触发器会被触发,触发之后调用MySQL的UDF函数
  3. UDF函数可以把数据写入到Redis中,从而达到同步的效果


    结果分析:


    这种方案适合于读多写少,并且不存并发写的场景

    因为MySQL触发器本身就会造成效率的降低,如果一个表经常被操作,这种方案显示是不合适的



伪装数据库

伪装数据库伪装成从数据库从MySQL中读取binlog数据,数据库读取到数据之后,解析Bin log,然后将数据写入写入同步到Redis中,然后客户端从Redis读数据。

阿里巴巴开源了一个Canal就是作为伪装数据库解决同步问题。


工作原理



canal模拟mysql slave的交互协议,伪装自己为mysql slave,向mysql master发送dump协议

mysql master收到dump请求,开始推送binary log给slave(也就是canal)

canal解析binary log对象(原始为byte流)



缓存异常情况



缓存穿透

假设某个数据 redis 不存在,mysql 也不存在,而且一直尝试读怎么办?缓存穿透,数据最终压力依然堆积在 mysql,可能造成 mysql 不堪重负而崩溃;redis中没有做一个保护。


解决方法



发现 mysql 不存在,将 redis 设置为 <key, nil> 设置过期时间 下次访问 key 的时候 不再访问 mysql 容易造成 redis 缓存很多无效数据;

布隆过滤器(能够确认一定不存在的key),将 mysql 当中已经存在的 key,写入布隆过滤器,不存在的直接 pass 掉;(解决使用不同的非法key来攻击数据库)



缓存击穿

某些数据 redis 没有,但是 mysql 有;此时当大量这类数据的并发连接请求,同样造成 mysql 过大;


解决

分布式锁

请求数据的时候获取锁,若获取成功,则操作后释放锁;若获取失败,则休眠一段时间(200ms)再去获取,当获取成功,操作后释放锁。

优点:没有额外的内存消耗,保证一致性,实现简单

缺点:线程需要等待,性能受影响

将非常热点的 key,设置不过期;



缓存雪崩

表示一段时间内,缓存集中失效(redis 无, mysql 有),导致请求全部走 mysql,有可能搞垮数据库,使整个服务失效;

mysql 主要的数据的依据;redis 可有可无的状态;


解决



缓存数据库在整个系统不是必须的,也就是缓存宕机不会影响整个系统提供服务;

  1. 如果因为缓存数据库宕机,造成所有数据涌向 mysql;采用高可用的集群方案,如哨兵模式、cluster模式;
  2. 如果因为设置了相同的过期时间,造成缓存集中失效;设置随机过期值或者其他机制错开失效时间;
  3. 如果因为系统重启的时候,造成缓存数据消失;

    重启时间短,redis 开启持久化(过期信息也会持久化)就行了; 重启时间长提前将热数据导入 redis 当中;



缓存的弊端

不能处理多语句的事务

redis不支持回滚

造成redis,mysql不一致



连接池问题

连接池:热点key总是在同一个连接;同一个key必须要走同一个mysql连接,或者同一个redis连接(通过hash实现)。目的是确保同一个没有并发问题。



版权声明:本文为weixin_44477424原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。