Redis教程：数据持久化

BGSAVE命令可以在不阻塞服务器的情况下执行，所以Redis允许用户

通过设置服务器配置的save选项，让服务器每隔一段时间自动执行一次BGSAVE命令

。用户可以通过save选项设置多个保存条件，但只要其中一个条件被满足，服务器就会执行BGSAVE命令。举个栗子，如果我们向服务器提供以下配置：

save    900     1        //900秒内对数据库进行了至少一次的修改 
save    300     10       //300秒内对数据库进行了至少十次的修改
save    60      10000    //60秒内对数据库进行了至少一万次的修改

服务器会根据save选项所设置的保存条件，设置服务器状态redisServer结构体的saveparams属性：

redis.h

struct redisServer {
    ……
    //记录了保存条件的数组
    struct saveparam *saveparams;  
    ……
};

struct saveparam {
    //秒数
    time_t seconds;
    //修改数
    int changes;
};

服务器状态中的saveparams数组将会是图1-1所示:

dirty计数器和lastsave属性

除了saveparams数组之外，服务器状态还维持着一个dirty计数器，以及一个lastsave属性：

dirty计数器记录距离上一次成功执行SAVE命令或者BGSAVE命令之后，服务器对数据库状态（服务器中的所有数据库）进行了多少次修改（包括写入、删除、更新等操作）
lastsave属性是一个Unix时间戳，记录了服务器上一次成功执行SAVE命令或BGSAVE命令的时间

redis.h

struct redisServer {
    ……
    //修改计数器
    long long dirty;              
    ……
    //上一次执行保存的时间
    time_t lastsave;              
    ……
};

检查保存条件是否满足

Redis的服务器周期性操作函数

serverCron

默认每隔100毫秒就会执行一次，该函数用于对正在运行的服务进行维护，它的其中一项工作就是检查save选项所设置的保存条件是否满足，如果满足，就执行BGSAVE命令.

以下伪代码展示了serverCron函数检查保存条件的过程：

def serverCron():   
    # …   
    # 遍历所有保存条件   
    for saveparam in server.saveparams:      
         # 计算距离上次执行保存操作有多少秒      
         save_interval = unixtime_now()-server.lastsave   
     
        # 如果数据库状态的修改次数超过条件所设置的次数      
        # 并且距离上次保存的时间超过条件所设置的时间       
        # 那么执行保存操作      
         if      server.dirty >= saveparam.changes and \
                   save_interval > saveparam.seconds:      
      
                BGSAVE();
     # ...

1.3 RDB文件结构

图1-2 RDB文件结构

Redis部分

的长度为5字节，保存着”REDIS”五个字符。

db_version

长度为4字节，它的值是一个字符串表示的整数，这个整数记录了RDB文件的版本号，比如”0006″就代表RDB文件的版本为第六版。

databases部分包含着零个至任意多个数据库以及各个数据库中的键值对数据：

如果服务器的数据库状态为空（所有数据库都是空的），那么这个部分也为空，长度为0字节
如果服务器的数据库状态为非空（有至少一个数据库非空），那么这个部分也为非空，根据数据库所保存键值对的数量、类型和内容的不同，这个部分的长度也会有所不同

EOF

常量的长度为1字节，这个常量标志着RDB文件正文内容结束。

check_num

是一个8字节长的无符号整数，保存着一个校验和，这个校验和是程序通过对REDIS、db_version、databases、EOF四部分的内容进行计算得出的。

2 AOF持久化

除了RDB持久化功能之外，Redis还提供了AOF（Append Only File）持久化功能，与RDB持久化通过保存数据库中的键值对来记录数据库状态不同，AOF持久化是通过保存Redis服务器所执行的命令来记录数据库状态。

2.1

AOF持久化的实现

AOF持久化功能的实现可以分为命令追加（append）、文件写入、文件同步（sync）三个步骤：

命令追加

当AOF持久化功能处于打开状态时，服务器在执行完一个写命令后，会以协议格式将被执行的写命令追加到服务器状态的aof_buf缓冲区的末尾。

redis.h

struct redisServer {
    ……
    //AOF缓冲区
    sds aof_buf;     
    ……
};

服务器在执行这个SET命令之后，会将

协议内容

追加到aof_buf缓冲区的末尾：

AOF文件的写入与同步

Redis的服务器进程就是一个事件循环，这个循环中的文件事件负责接收客户端的命令请求，以及向客户端发送命令回复，而时间事件则负责执行像serverCron函数这样需要定时运行的函数。因为服务器在处理文件事件时可能会执行写命令，使得一些内容被追加到aof_buf缓冲区里面，所以在服务器每次结束一个事件循环之前，它都会

调用flushAppendOnlyFile函数，考虑是否需要将aof_buf缓冲区中的内容写入和保存到AOF文件里面

：

flushAppendOnlyFile函数的行为由服务器配置的appendsync选项的值来决定，各个不同值产生的行为如表2-1所示：

表2-1 flushAppendOnlyFile函数的行为
appendfsync选项的值	flushAppendOnlyFile函数的行为
always	将aof_buf缓冲区中的所有内容写入并同步到AOF文件
everysec	将aof_buf缓冲区中的所有内容写入到AOF文件，如果上次同步AOF文件的时间距离现在超过一秒钟，那么再次对AOF文件进行同步，并且这个同步操作是由一个线程专门负责执行的
no	将aof_buf缓冲区中的所有内容写入到AOF文件，但并不对AOF文件进行同步，何时同步由操作系统来决定

如果用户没有主动为appendsync选项设置值，那么appendsync选项的默认值为everysec。

2.2

AOF文件的载入与数据还原

因为AOF文件里面包含了重建数据库状态所需的所有写命令，所以服务器只要读入并重新执行一遍AOF文件里面保存的写命令，就可以还原服务器关闭之前的数据库状态。Redis读取AOF文件并还原数据库状态的详细步骤如下：

创建一个不带网络连接的伪客户端（fake client）：因为Redis的命令只能在客户端上下文执行，而载入AOF文件时所使用的命令直接来源于AOF文件而不是网络连接，所以服务器使用了一个没有网络连接的伪客户端来执行AOF文件保存的写命令，伪客户端执行命令的效果和网络连接的客户端执行命令的效果一样
从AOF文件中分析并读取出一条写命令
使用伪客户端执行被读取的写命令
一直执行步骤2和3，直到AOF文件中的所有写命令都被处理完毕为止

2.3 AOF重写机制

为了解决AOF文件体积膨胀的问题，Redis提供了AOF文件重写功能。通过该功能，Redis服务器恶意创建一个新的AOF文件来替代现有的AOF文件，

新旧两个AOF文件所保存的数据库状态相同，但新AOF文件不会包含任何浪费空间的冗余命令

，所以新AOF文件的体积通常会比旧AOF文件的体积要小的多。

Redis将AOF重写程序放到子进程里执行

，这样做可以同时达到两个目的：

子进程进行AOF重写期间，服务器进程（父进程）可以继续处理命令请求
子进程带有服务器进程的数据副本，使用子进程而不是线程，可以在避免使用锁的情况下，保证数据的安全性

不过，使用子进程也有一个问题需要解决，因为子进程在进行AOF重写期间，服务器进程还需要处理命令请求，而新的命令可能会对现有的数据库状态进行修改，从而使得服务器当前的数据库状态和重写后的AOF文件所保存的数据库状态不一致。

为了解决这种数据不一致问题，Redis服务器设置了一个AOF重写缓冲区，这个缓冲区在服务器创建子进程之后开始使用，当Redis服务器执行完一个写命令之后，它会同时将这个写命令发送给AOF缓冲区和AOF重写缓冲区，如图2-1所示：

也就是说，在子进程执行AOF重写期间，服务器进程需要执行以下三个工作：

执行客户端发来的命令
将执行后的写命令追加到AOF缓冲区
将执行后的写命令追加到AOF重写缓冲区

这样一来可以保证：

AOF缓冲区的内容会定期被写入和同步到AOF文件，对现有AOF文件的处理工作会如常进行
从创建子进程开始，服务器执行的所有写命令都会被记录到AOF重写缓冲区里面

当子进程完成AOF重写工作之后，它会向父进程发送一个信号，父进程在接到该信号之后，就会调用一个信号处理函数，并执行以下工作：

将AOF重写缓冲区中所有内容写入到新AOF文件中，这时新AOF文件所保存的数据库状态将和服务器当前的数据库状态一致
对新AOF文件进行改名，原子地覆盖现有的AOF文件，完成新旧两个AOF文件的替换

2.4 混合持久化

混合持久化指进行AOF

重写时子进程将当前时间点的数据快照保存为RDB

文件格式，而后将父进程累积命令保存为

AOF

格式。

加载时，首先会识别AOF

文件是否以

REDIS

字符串开头，如果是，就按RDB

格式加载，加载完

RDB

后继续按

AOF

格式加载剩余部分。

是否开启混合持久化由如下配置设置:

aof-use-rdb-preamble yes

原文链接：https://blog.csdn.net/tuwenqi2013/article/details/104466014

1 RDB持久化

1.1 RDB文件的创建和载入

1.2 自动间隔性保存

1.3 RDB文件结构

2 AOF持久化

2.1 AOF持久化的实现

2.2 AOF文件的载入与数据还原

2.3 AOF重写机制

2.4 混合持久化

你可能也喜欢

2.1

AOF持久化的实现

2.2

AOF文件的载入与数据还原