Redis之持久化(RDB,AOF)

  • Post author:
  • Post category:其他



目录


一,Redis高可用


二,Redis的两种持久化


2.1持久化的功能


2.2,Redis的两种持久化


三,Redis的RDB持久化


3.1触发条件


3.2 执行流程、


3.3,启动时加载RDF文件(恢复)


四,Redis的AOF持久化


4.1 开启AOF


4.2 执行流程


文件写入(write)和文件同步(sync)


4.3 文件重写


文件重写流程


重写流程注意点


4.4 启动时加载


五,RDB和AOF的缺点


5.1 RDB持久化


5.2 AOF持久化


六,Redis中如何获取mysql数据,以及删除数据


6.1、命中机制


6.2、淘汰机制


过期删除


惰性淘汰


随机淘汰


七,缓存压力高并发怎么处理


7.1、漏桶算法


7.2、令牌桶算法


一,Redis高可用

在WEB服务器中,

高可用是指服务器可以正常访问的时间,衡量的标准是在多长时间内可以提供正常服务

但是在Redis中,高可用的含义似乎要更广泛一些,处理保证提供正常服务,(如主从复制,快容灾技术)还需要考虑数据容量的扩展,数据安全不会丢失等。


在Redis中,实现高可用的技术主要包括持久化,主从复制,哨兵和集群


  1. 持久化

    :持久化最简单的高可用的方法(有的时候甚至不被归为高可用的手段)主要作用是数据备份,即将数据存储在硬盘,保证数据不会因进程退出二丢失

  2. 主从复制:

    主从复制是高可用Redis的基础,哨兵和集群都是在主从复制基础上实现高可用的,主从复制主要是实现了数据的多级备份,以及对于读操作的负载均衡和简单的故障恢复,

    缺陷:故障恢复无法自动化,写操作无法负载均衡,存储能力收到单机的限制

  3. 哨兵

    :在主从复制的基础上,

    哨兵实现了自动化的故障恢复。缺陷:写操作无法实现负载均衡,存储能力受到单机的限制

  4. 集群:

    通过集群,

    Redis解决了写操作无法负载均衡,以及存储能力受到单机限制的问题,实现了较为完善的高可用方案。

二,Redis的两种持久化

2.1持久化的功能

Redis是内存数据库,数据都是存储在内存中,为了避免服务器断电等原因导致Redis进程异常退出后数据的永远丢失,需要定期将redis中的数据以某种形式(数据或命令)从内存保存到硬盘,当下次Redis重启时,利用持久化文件实现数据包恢复,除此之外,为了进行容灾备份,,可以将持久化文件拷贝到一个运程位置。

2.2,Redis的两种持久化

RDB持久化:原理是将redis在内存中的数据库记录定时保存到磁盘上(类似于快照)

AOF持久化:原理是将Redis的操作日志以及追加的方式写入文件(类似于mysql的binlog)

总结:由于AOF持久性实时性更好,即当进程意外退出时丢失的数据更少,一次AOF是目前主流的持久化方式

三,Redis的RDB持久化

RDB持久化是指在指定的时间间隔内,将内存中当前进程中的数据生产快照保存到硬盘(因此也称为快照持久化),用的二进制压缩存储,保存的文件后缀是。RDB,当Redis重新启动时,可以读取快照文件恢复数据。

3.1触发条件

触发条件有:手动触发和自动触发


手动触发

手动触发Redis进行RDB持久化命令有两种

save命令
该命令会阻塞当前Redis服务器,执行sane命令期间,redis不能处理其他命令。知道RDB过程完成为止,
显然该命令对于比较大的实例会造成长时间的阻塞,这是致命缺陷,为了解决此问题,Redis提供了第二种方式

bgsave命令
执行该命令是,Redis会在后台一部进行快照操作,快照同时还可以响应客户端请求,具体操作是Redis
进程执行fork操作创建子进程,rdb持久化过程有子进程负责,完成后自动结束阻塞只发生在fork阶段,一般时间很短


自动触发

在自动触发RDB持久化的时候,Redis也会选择bgsave而不是save来进行持久化

1,-save:这里是依赖配置触发Redis的RDB持久化条件,也就是什么时候将内存中的数据持久化到硬盘,比如save m n 。表示m秒内数据及存在n条修改时,自动1触发bgsave

2,当然如果你至少Redis的存储功能,不需要持久化,那么你可以注销所以的save行来停用保存功能,可以直接一个空字符串来实现停用 save

vim /etc/redis/6379.conf
#自动触发最常见的情况是在配置文件中通过save m n,指定当m秒内发生n次变化时,会触发bgsave。 
 
save 900 1 :当时间到900秒时,如果redis数据发生了至少1次变化,则执行bgsave
save 300 10 :当时间到300秒时, 如果redis数据发生了至少10次变化,则执行bgsave
save 60 10000 :当时间到60秒时,如果redis数据发生了至少10000次变化, 则执行bgsave
#19行--以上三个save条件满足任意一个时,都会引起bgsave的调用
 
rdbcompression yes
#242行--是否开启RDB文件压缩 
 
dbfilename dump.rdb
#254行--指定RDB文件名 
 
dir /var/lib/redis/6379
#264行--指定RDB文件和AOF文件所在目录


其他自动触发机制

除了save m n 格式的触发外,还有一些其他情况会触发bgsave备份

  1. 在主从复制场景下,如果从节点执行全量复制操作,则主节点会执行bgsave命令,并将rdb文件发送给从节点
  2. 执行shutdown命令时,自动执行rdb持久化

3.2 执行流程、

  1. Redis父进程首先判断:当前是否执行save,或bgsave/bgrewriteaof(aof文件重写命令)的子进程,如果在执行则bgsave命令直接返回(两个进程同时执行大量的磁盘子进程,可能引起严重的性能问题)
  2. 父进程执行 fork() 创建子进程 ,这个过程父进程是阻塞的,Redis进程不能执行来自客户端的任何命令。
  3. 父进程fore()创建后,bgsave命令返回“Backgroup saving srarted”信息并不再阻塞父进程,父进程就可以响应其它命令。
  4. 子进程创建RDB文件,根据父进程内存快照生成临时快照文件,完成对原有文件进行原子替换(RDB始终完整)
  5. 子进程发送信号给父进程表示完成,父进程更新统计信息。

3.3,启动时加载RDF文件(恢复)

  1. 将备份文件(dump。rdb)移动到redis安装目录并启动服务即可,Redis就会自动加载文件数据至内存中,Redis服务器在在载入rdb文件期间,会一直处于阻塞状态,直到载入工作完成为止。
  2. RDB文件的载入工作是在服务器启动时自动执行的,并没有专门的命令。
  3. 但是由于AOF的优先级更高,因此当AOF开启是,Redis会优先载入AOF文件来恢复
  4. 只有当AOF关闭时,才会在Redis服务器上启动时检查rdb文件,并且自动载入。
  5. 服务器载入RDB文件期间处于阻塞状态,直到载入完成为止
  6. Redis载入RDB文件时,会对RDB进行文件效验,如果文件损坏,则日志中会打印错误,Redis启动1失败

四,Redis的AOF持久化

RDB持久化是将进程数据写入文件,而AOF持久化,则是讲过Redis执行的每次写,删除命令记录到单独的日志文件中,查询操作不会记录,当Redis重启时再次执行AOF文件中的命令来恢复数据

4.1 开启AOF

Redis服务器默认是开启RDB的,关闭AOF的,要开启AOF,需要在我们安装时设置的redis配置文件中进行更改。我这里是默认的/etc/redis/6379.conf配置文件中配置。当开启AOF后,最后恢复数据时,优点是AOF文件中恢复,运维AOF的优先级远高于RDB

vim /etc/redis/6379.conf
 
appendonly yes
#700行--修改,开启AOF
 
appendfilename "appendonly.aof"
#704行--指定A0F文件名称
 
aof-load-truncated yes
#796行--是否忽略最后一条可能存在问题的指令
 
/etc/init.d/redis_6379 restart   
#重启服务

4.2 执行流程

由于需要记录Redis的每条写命令,因此AOF不需要触发,AOf的执行流程如下
命令追加:将Redis的写命令追加到缓冲区aof_buf;
文件写入(white)和文件同步(sync):根据不同的同步策略将aof_buf中的内容同步到硬盘。
文件重写(rewrite):定期重写AOF文件,达到压缩的目的


命令追加(append)


Redis先将命令追加到缓冲区,而不是直接写入文件,主要是为了避免每次有写命令都直接写入盘,从而导致硬盘io成为Redis负载的瓶颈

命令追加的格式是Redis命令请求的协议格式,它是一种

纯文本格式

,具有兼容性好、可读性强、容易处理、操作简单避免二次开销等优点。在A0F文件中,除了用于指定数据库的select命令 (如select0为选中0号数据库) 是由Redis添加的,其他都是客户端发送来的写命令。

文件写入(write)和文件同步(

sync



Redis提供了多种AOF缓存区的同步文件策略,策略涉及到操作系统的write函数和fsync函数,说明如下


为了提高文件写入效率,在现代操作系统中,当用户调用write函数将数据写入文件时,操作系统通常会将数据暂存到一个内存缓冲区里,当缓冲区被填满或超过了指定时限后,才真正将缓冲区的数据写入到硬盘里。这样的操作虽然提高了效率,但也带来了安全问题:如果计算机停机,内存缓冲区中的数据会丢失;因此系统同时提供了fsync、fdatasync等同步函数,可以强制操作系统立刻将缓冲区中的数据写入到硬盘里,从而确保数据的安全性



AOF缓存区的同步文件策略存在三种同步方式,它们分别是:

vim /etc/redis/6379.conf
 
---729---
● appendfsync always:(一直触发)
#解释:命令写入aof_ buf后立即调用系统fsync操作同步到AOF文件,fsync完成后线程返回。
     这种情况下,每次有写命令都要同步到AOF文件,硬盘IO成为性能瓶颈,Redis只能支持大约几百TPS写入,
     严重降低了Redis的性能;即便是使用固态硬盘(SSD),每秒大约也只能处理几万个命令,而且会大大降低SSD的寿命。
 
● appendfsync no:(不进行持久化)
#解释:命令写入aof_ buf后调用系统write操作,不对AOF文件做fsync同步;
	 同步由操作系统负责,通常同步周期为30秒。这种情况下,文件同步的时间不可控,
	 且缓冲区中堆积的数据会很多,数据安全性无法保证。
 
● appendfsync everysec:(每一秒触发)
#解释:命令写入aof_ buf后调用系统write操作,write完成后线程返回; 
	 fsync同步文件操作由专门的线程每秒调用一次。
	 everysec是前述两种策略的折中,是性能和数据安全性的平衡,
	 因此是Redis的默认配置,也是我们推荐的配置。
 


文件

重写

(rewrite)

  1. 随着时间流逝,Redis服务器执行的写命令越来越多,AOF文件也会越来越大:过大的AOF文件不仅会影响服务器的正常运行,也会导致数据恢复需要的时间过长。
  2. 文件重写是指定期重写AOF文件,减小AOF文件的体积。需要注意的是,AOF重写是把Redis进程内的数据转化为写命令,同步到新的AOF文件;不会对旧的AOF文件进行任何读取、写入操作!
  3. 关于文件重写需要注意的另一点是:对于AOF持久化来说,文件重写虽然是强烈推荐的,但并不是必须的;即使没有文件重写,数据也可以被持久化并在Redis启动的时候导入:因此在一些实现中,会关闭自动的文件重写,然后通过定时任务在每天的某一时刻定时执行。


概括:文件重写主要目的就是为了减轻AOF文件的大小,缓解磁盘压力。重写的内容就是删除一些无效语句


4.3 文件重写

文件重写能压缩AOF文件的原因

过期的数据不再写入文件;

无效的命令不再写入文件: 如有些数据被重复设值(set ydq 123, set ydq 321)、有些数据被删除了(set ky20 ydq 、 rename ky20 kgc、del kgc。三条一起执行的语句没有意义就会被删除。) 等。

多条命令可以合并为一个: 如sadd myset 123, sadd myset 1234,sadd myset 12345 可以合并为sadd myset123 1234 12345。

通过上述内容可以看出,由于重写后AOF执行的命令减少了,文件重写既可以减少文件占用的空间,也可以加快恢复速度。


文件重新给的触发

手动触发:直接调用bgrewriteaof命令,该命令的执行与bgsave有些类似:都是fork子进程进行具体的工作,且都只有在fork时阻塞。

自动触发:通过设置auto-aof-rewrite-min-size选项和auto-aof-rewrite-percentage选项来自动执行BGREWRITEAOF。只有当auto-aof-rewrite-min-size和auto-aof-rewrite-percentage两个选项同时满足时,才会自动触发AOF重写,即bgrewriteaof操作

vim /etc/redis/6379.conf
 
----771----
auto-aof-rewrite-percentage 100
#当前AOF文件大小(即aof_current_size)是上次日志重写时AOF文件大小(aof_base_size)两倍时,发生BGREWRITEAOF操作
 
auto-aof-rewrite-min-size 64mb
#当前A0F文件执行BGREWRITEAOF命令的最小值,避免刚开始启动Reids时由于文件尺寸较小导致频繁的BGREWR ITEAOF

文件重写流程

  1. Redis父进程首先判断当前是否存在正在执行bgsave/bgrewriteaof的子进程,如果存在则bgrewriteaof命令直接返回,如果存在bgsave命令则等bgsave执行完成后再执行
  2. 父进程执行fork操作创建子进程,这个过程中父进程是阻塞的。
  3. 父进程fork后,bgrewriteaof 命令返回”Background append only file rewrite started”信息并不再阻塞父进程,并可以响应其他命令。Redis的所有写命令依然写入AOF缓冲区,并根据appendfsync策略同步到硬盘,保证原有A0F机制的正确。
  4. 由于fork操作使用写是复制技术,子进程只能共享fork操作时的内存数据。由于父进程依然在响应命令,因此Redis使用AOF重写缓冲区(aof_rewrite_buf) 保存这部分数据,防止新AOF文件生成期间丢失这部分数据。也就是说,bgrewriteaof执行期间,Redis的写 命令同时追加到aof_ buf和aof_ rewirte_ buf两个缓冲区。
  5. 子进程根据内存快照,按照命令合并规则写入到新的AOF文件。
  6. 子进程写完新的AOF文件后,向父进程发信号,父进程更新统计信息,具体可以通过info persistence查看。
  7. 父进程把AOF重写缓冲区的数据写入到新的AOF文件,这样就保证了新AOF文件所保存的数据库状态和服务器当前状态一致。
  8. 使用新的AOF文件替换老文件,完成AOF重写。

重写流程注意点

  • 重写由父进程fork子进程进行;

  • 重写期间Redis执行的写命令,需要追加到新的AOF文件中,为此Redis引入了aof_ rewrite_buf缓存。

4.4 启动时加载

  1. 当AOF开启时,Redis启 动时会优先载入AOF文件来恢复数据;只有当AOF关闭时,才会载入RDB文件恢复数据。
  2. 当AOF开启,但AOF文 件不存在时,即使RDB文件存在也不会加载。
  3. Redis载入AOF文件时,会对AOF文件进行校验,如果文件损坏,则日志中会打印错误,Redis启动失败。但如果是AOF文件结尾不完整(机器突然宕机等容易导致文件尾部不完整),且aof-load- truncated参数开启,则日志中会输出警告,Redis忽略掉AOF文件的尾部,启动成功。
  4. aof-load-truncated参数默认是开启的。


概述:redis默认是开启RDB文件,当AOF开启后,Redis将会优先对AOF操作,恢复时会先加载AOF文件数据,只要开启AOF,即使AOF文件不存在,也不会基于RDB文件恢复。恢复完后会对AOF文件校验,如果文件损坏,打印错误日志,报redis启动失败,如果是文件结尾不完整,且默认设置了删除不完整数据,则会进行警告。redis启动成功。

五,RDB和AOF的缺点

5.1 RDB持久化


RDB的优点


持久化的速度快(因为保存的是数据结果)在写入到*。RDB持久化文件,会进行压缩。来减小自身的体积。


集群中,redis的主从复制,从——》主服务器进行同步,默认先实现RDB文件恢复数据,所以同步性性能高。


RDB的缺点

数据完整性不如AOF

RDB类似于快照,可能会造成数据丢失

在进行备份时,会阻塞进程

5.2 AOF持久化


AOF的优点

AOF的数据完整性别RDB高

有重功能,会对无效数据进行删除,节省AOF文件占用的磁盘空间


AOF的缺陷

执行语句一致的情况下,AOF备份的内容更大(RDB备份的是结果,AOF备份的是语句)

AOF消耗的性能更大,占用的磁盘空间越来越大

六,Redis中如何获取mysql数据,以及删除数据

6.1、命中机制

Redis基本是做为缓存服务器来使用的,但是Redis怎么知道哪些数据需要被加载到Redis中的缓存中呢。

这就需要Redis中的命中机制,只有当客户端访问的热点数据,Redis才会将他们加载到redis缓存中给客户端访问。

6.2、淘汰机制

当缓存中的数据较多时,可能造成Redis内存不足,内存溢出等问题。所以,redis中有淘汰机制,进行淘汰一些数据,进行释放内存空间。

过期删除

给每一条加入到redis中的热点数据,设置过期时间,到达指定时间后,该数据被删除。客户端访问需要重新到mysql中获取。

惰性淘汰

将一些客户端访问量少的数据进行删除

随机淘汰

随机选取一些数据删除。

七,缓存压力高并发怎么处理

7.1、漏桶算法


漏桶算法是为了缓解Redis缓存服务受到强大的高并发进行处理。


步骤


先将请求进入到漏桶里,漏桶以固定的速度出水,也就是处理请求,当水加的过快,则会直接溢出,也就是拒绝请求,可以看出漏桶算法能强行限制数据的传输速率。


解释:

就是Redis中可以接收很多请求,但是它能处理的请求,只会按照它的速度来处理,但是请求数量过多后,redis就会拒绝服务



7.2、令牌桶算法

令牌桶也是用来缓解Redis高并发的一种算法。


步骤

系统会以一个恒定速度往桶里放入令牌,而如果请求需要被处理,则需要先从桶里获取一个令牌,当桶里没有令牌可取是,则拒绝服务。


解释:

Redis中有很多系统分配的令牌(令牌按系统分配的速度获取),每处理一个请求,就会分配一个令牌,当令牌用完了就会拒绝处理请求。(用完了就可能是高并发造成的)



版权声明:本文为m0_54594153原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。