redis中的数据有一个过期时间,比如验证码、token等。当数据过了期限后,应该要被删除。
redisDb中有两个dict对象,dict内部实现的是哈希表的结构。两个dict对象的名字一个叫dict,一个叫expires。
dict用于存放实际数据、expires用于存放过期时间数据。
当往redisDb中的dict中加入key-value数据的的时候,并且为数据设置了过期时间的时候,会将对应的key和过期时间存放到expires中,便于后期查找过期时间。
Redis中提供了三种删除策略:
1、定时删除
当放入数据后,设置一个定时器,当定时器读秒完毕后,将对应的数据从dict中删除。
优点:
内存友好,数据一旦过期就会被删除
缺点:
CPU不友好,定时器耗费CPU资源,并且频繁的执行清理操作也会耗费CPU资源。
用时间换空间
2、惰性删除
当数据过期的时候,不做任何操作。当访问数据的时候,查看数据是否过期,如果过期返回null,并且将数据从内存中清除。如果没过期,就直接返回数据。
优点:
CPU友好,数据等到过期并且被访问的时候,才会删除。
缺点:
内存不友好,会占用大量内存。
用空间换时间
3、定期删除
定期删除是定时删除和惰性删除的折中方案。
每隔一段时间对redisServer中的所有redisDb的expires依次进行随机抽取检查。
redis中有一个server.hz定义了每秒钟执行定期删除的次数,每次执行的时间为250ms/server.hz。
redis中会维护一个current_db变量来标志当前检查的数据库。current_db++,当超过数据库的数量的时候,会重新从0开始。
定期检查就是执行一个循环,循环中的每轮操作会从current_db对应的数据库中随机依次取出w个key,查看其是否过期。如果过期就将其删除, 并且记录删除的key的个数。如果过期的key个数大于w
25%,就会继续检查当前数据库,当过期的key小于w
25%,会继续检查下一个数据库。
当执行时间超过规定的最大执行时间的时候,会退出检查。
一次检查中可以检查多个数据库,但是最多检查数量是redisServer中的数据库个数,也就是最多只能从当前位置检查一圈。
伪代码:
time_limit = 250ms/server.hz;//每次检查运行的最大时间
for(int j = 0;j < dbs_per_call;j++){//dbs_per_call为server中数据库的个数,也就是每次检查最多检查一轮所有的数据库
redisDb = redisServer.db[current_db];
current_db++;
//获取数据库的过期哈希表
expires = redisDb.expires;
//获取开始的时间
long start = time();
int expired = 0;
int w = 20;
do{
int i = 0;
while(i++ < w){
long now = time();
//如果随机找的key过期了
if(expire(now,random(expires))){
//过期数量++
expired ++;
}
}
//如果运行时间超过了规定时间,就退出检查,下一次定期检查直接检查下一个数据库
if(time() - start > timelimit){
return;
}
//如果过期数量超过25%,继续检查当前数据库
}while(expired > w * 25%);
}
优点:
通过控制定时时间来动态的调整CPU和内存之间的状态,十分灵活。
缺点:
定期删除的定时时间十分重要,如果时间过短,就会对CPU造成很大压力。如果时间过长,就会造成过期数据挤压内存。
Redis采用的策略
Redis采用的是
惰性删除 + 定期删除
的策略。
惰性删除:
当查询数据的时候,首先根据key查询对应的expires,检查是否过期,如果过期就返回null,并删除对应的数据和expires,如果不过期,就返回数据。
定期删除:
具体格式可以查看上面的仔细描述。