探索Redis设计与实现9:数据库redisDb与键过期删除策略

本文转自互联网

本系列文章将整理到我在GitHub上的《Java面试指南》仓库,更多精彩内容请到我的仓库里查看

https://github.com/h2pl/Java-Tutorial

喜欢的话麻烦点下Star哈

文章首发于我的个人博客:

www.how2playlife.com

本文是微信公众号【Java技术江湖】的《探索Redis设计与实现》其中一篇,本文部分内容来源于网络,为了把本文主题讲得清晰透彻,也整合了很多我认为不错的技术博客内容,引用其中了一些比较好的博客文章,如有侵权,请联系作者。

该系列博文会告诉你如何从入门到进阶,Redis基本的使用方法,Redis的基本数据结构,以及一些进阶的使用方法,同时也需要进一步了解Redis的底层数据结构,再接着,还会带来Redis主从复制、集群、分布式锁等方面的相关内容,以及作为缓存的一些使用方法和注意事项,以便让你更完整地了解整个Redis相关的技术体系,形成自己的知识框架。

如果对本系列文章有什么建议,或者是有什么疑问的话,也可以关注公众号【Java技术江湖】联系作者,欢迎你参与本系列博文的创作和修订。

一. 数据库
Redis的数据库使用字典作为底层实现,数据库的增、删、查、改都是构建在字典的操作之上的。
redis服务器将所有数据库都保存在服务器状态结构redisServer(redis.h/redisServer)的db数组(应该是一个链表)里:

struct redisServer {
  //..
  // 数据库数组,保存着服务器中所有的数据库
    redisDb *db;
  //..
}

在初始化服务器时,程序会根据服务器状态的dbnum属性来决定应该创建多少个数据库:

struct redisServer {
    // ..
    //服务器中数据库的数量
    int dbnum;
    //..
}

dbnum属性的值是由服务器配置的database选项决定的,默认值为16;

二、切换数据库原理
每个Redis客户端都有自己的目标数据库,每当客户端执行数据库的读写命令时,目标数据库就会成为这些命令的操作对象。

127.0.0.1:6379> set msg 'Hello world'
OK
127.0.0.1:6379> get msg
"Hello world"
127.0.0.1:6379> select 2
OK
127.0.0.1:6379[2]> get msg
(nil)
127.0.0.1:6379[2]>

在服务器内部,客户端状态redisClient结构(redis.h/redisClient)的db属性记录了客户端当前的目标数据库,这个属性是一个指向redisDb结构(redis.h/redisDb)的指针:

typedef struct redisClient {
    //..
    // 客户端当前正在使用的数据库
    redisDb *db;
    //..
} redisClient;

redisClient.db指针指向redisServer.db数组中的一个元素,而被指向的元素就是当前客户端的目标数据库。
我们就可以通过修改redisClient指针,让他指向服务器中的不同数据库,从而实现切换数据库的功能–这就是select命令的实现原理。
实现代码:

int selectDb(redisClient *c, int id) {
    // 确保 id 在正确范围内
    if (id < 0 || id >= server.dbnum)
        return REDIS_ERR;
    // 切换数据库(更新指针)
    c->db = &server.db[id];
    return REDIS_OK;
}

三、数据库的键空间
1、数据库的结构(我们只分析键空间和键过期时间)
typedef struct redisDb {
// 数据库键空间,保存着数据库中的所有键值对
dict dict; / The keyspace for this DB /
// 键的过期时间,字典的键为键,字典的值为过期事件 UNIX 时间戳
dict *expires; /
Timeout of keys with a timeout set /
// 数据库号码
int id; /
Database ID /
// 数据库的键的平均 TTL ,统计信息
long long avg_ttl; /
Average TTL, just for stats */
//..
} redisDb

上图是一个RedisDb的示例,该数据库存放有五个键值对,分别是sRedis,INums,hBooks,SortNum和sNums,它们各自都有自己的值对象,另外,其中有三个键设置了过期时间,当前数据库是服务器的第0号数据库。现在,我们就从源码角度分析这个数据库结构:
我们知道,Redis是一个键值对数据库服务器,服务器中的每一个数据库都是一个redis.h/redisDb结构,其中,结构中的dict字典保存了数据库中所有的键值对,我们就将这个字典成为键空间。
Redis数据库的数据都是以键值对的形式存在,其充分利用了字典高效索引的特点。
a、键空间的键就是数据库中的键,一般都是字符串对象;
b、键空间的值就是数据库中的值,可以是5种类型对象(字符串、列表、哈希、集合和有序集合)之一。
数据库的键空间结构分析完了,我们先看看数据库的初始化。

2、键空间的初始化
在redis.c中,我们可以找到键空间的初始化操作:

//创建并初始化数据库结构
 for (j = 0; j < server.dbnum; j++) {
    // 创建每个数据库的键空间
    server.db[j].dict = dictCreate(&dbDictType,NULL);
    // ...
    // 设定当前数据库的编号
    server.db[j].id = j;
}

初始化之后就是对键空间的操作了。

3、键空间的操作
我先把一些常见的键空间操作函数列出来:

// 从数据库中取出键key的值对象,若不存在就返回NULL
robj *lookupKey(redisDb *db, robj *key);

/* 先删除过期键,以读操作的方式从数据库中取出指定键对应的值对象
 * 并根据是否成功找到值,更新服务器的命中或不命中信息,
 * 如不存在则返回NULL,底层调用lookupKey函数 */
robj *lookupKeyRead(redisDb *db, robj *key);

/* 先删除过期键,以写操作的方式从数据库中取出指定键对应的值对象
 * 如不存在则返回NULL,底层调用lookupKey函数,
 * 不会更新服务器的命中或不命中信息
 */
robj *lookupKeyWrite(redisDb *db, robj *key);

/* 先删除过期键,以读操作的方式从数据库中取出指定键对应的值对象
 * 如不存在则返回NULL,底层调用lookupKeyRead函数
 * 此操作需要向客户端回复
 */
robj *lookupKeyReadOrReply(redisClient *c, robj *key, robj *reply);

/* 先删除过期键,以写操作的方式从数据库中取出指定键对应的值对象
 * 如不存在则返回NULL,底层调用lookupKeyWrite函数
 * 此操作需要向客户端回复
 */
robj *lookupKeyWriteOrReply(redisClient *c, robj *key, robj *reply);

/* 添加元素到指定数据库 */
void dbAdd(redisDb *db, robj *key, robj *val);
/* 重写指定键的值 */
void dbOverwrite(redisDb *db, robj *key, robj *val);
/* 设定指定键的值 */
void setKey(redisDb *db, robj *key, robj *val);
/* 判断指定键是否存在 */
int dbExists(redisDb *db, robj *key);
/* 随机返回数据库中的键 */
robj *dbRandomKey(redisDb *db);
/* 删除指定键 */
int dbDelete(redisDb *db, robj *key);
/* 清空所有数据库,返回键值对的个数 */
long long emptyDb(void(callback)(void*));

下面我选取几个比较典型的操作函数分析一下:

查找键值对函数–lookupKey
robj *lookupKey(redisDb *db, robj *key) {
// 查找键空间
dictEntry *de = dictFind(db->dict,key->ptr);
// 节点存在
if (de) {
// 取出该键对应的值
robj *val = dictGetVal(de);
// 更新时间信息
if (server.rdb_child_pid == -1 && server.aof_child_pid == -1)
val->lru = LRU_CLOCK();
// 返回值
return val;
} else {
// 节点不存在
return NULL;
}
}

添加键值对–dbAdd
添加键值对使我们经常使用到的函数,底层由dbAdd()函数实现,传入的参数是待添加的数据库,键对象和值对象,源码如下:

void dbAdd(redisDb *db, robj *key, robj *val) {
// 复制键名
sds copy = sdsdup(key->ptr);
// 尝试添加键值对
int retval = dictAdd(db->dict, copy, val);
// 如果键已经存在,那么停止
redisAssertWithInfo(NULL,key,retval == REDIS_OK);
// 如果开启了集群模式,那么将键保存到槽里面
if (server.cluster_enabled) slotToKeyAdd(key);
}

好了,关于键空间操作函数就分析到这,其他函数(在文件db.c中)大家可以自己去分析,有问题的话可以回帖,我们可以一起讨论!

四、数据库的过期键操作
在前面我们说到,redisDb结构中有一个expires指针(概况图可以看上图),该指针指向一个字典结构,字典中保存了所有键的过期时间,该字典称为过期字典。
过期字典的初始化:

// 创建并初始化数据库结构
for (j = 0; j < server.dbnum; j++) {
// 创建每个数据库的过期时间字典
server.db[j].expires = dictCreate(&keyptrDictType,NULL);
// 设定当前数据库的编号
server.db[j].id = j;
// ..
}

a、过期字典的键是一个指针,指向键空间中的某一个键对象(就是某一个数据库键);
b、过期字典的值是一个long long类型的整数,这个整数保存了键所指向的数据库键的时间戳–一个毫秒精度的unix时间戳。
下面我们就来分析过期键的处理函数:

1、过期键处理函数
设置键的过期时间–setExpire()
/*

  • 将键 key 的过期时间设为 when
  • /
    void setExpire(redisDb *db, robj *key, long long when) {
    dictEntry *kde, *de;
    // 从键空间中取出键key
    kde = dictFind(db->dict,key->ptr);
    // 如果键空间找不到该键,报错
    redisAssertWithInfo(NULL,key,kde != NULL);
    // 向过期字典中添加该键
    de = dictReplaceRaw(db->expires,dictGetKey(kde));
    // 设置键的过期时间
    // 这里是直接使用整数值来保存过期时间,不是用 INT 编码的 String 对象
    dictSetSignedIntegerVal(de,when);
    }

获取键的过期时间–getExpire()
long long getExpire(redisDb *db, robj *key) {
dictEntry *de;
// 如果过期键不存在,那么直接返回
if (dictSize(db->expires) == 0 ||
(de = dictFind(db->expires,key->ptr)) == NULL) return -1;
redisAssertWithInfo(NULL,key,dictFind(db->dict,key->ptr) != NULL);
// 返回过期时间
return dictGetSignedIntegerVal(de);
}

删除键的过期时间–removeExpire()
// 移除键 key 的过期时间
int removeExpire(redisDb *db, robj *key) {
// 确保键带有过期时间
redisAssertWithInfo(NULL,key,dictFind(db->dict,key->ptr) != NULL);
// 删除过期时间
return dictDelete(db->expires,key->ptr) == DICT_OK;
}

2、过期键删除策略
通过前面的介绍,大家应该都知道数据库键的过期时间都保存在过期字典里,那假如一个键过期了,那么这个过期键是什么时候被删除的呢?现在来看看redis的过期键的删除策略:
a、定时删除:在设置键的过期时间的同时,创建一个定时器,在定时结束的时候,将该键删除;
b、惰性删除:放任键过期不管,在访问该键的时候,判断该键的过期时间是否已经到了,如果过期时间已经到了,就执行删除操作;
c、定期删除:每隔一段时间,对数据库中的键进行一次遍历,删除过期的键。
其中定时删除可以及时删除数据库中的过期键,并释放过期键所占用的内存,但是它为每一个设置了过期时间的键都开了一个定时器,使的cpu的负载变高,会对服务器的响应时间和吞吐量造成影响。
惰性删除有效的克服了定时删除对CPU的影响,但是,如果一个过期键很长时间没有被访问到,且若存在大量这种过期键时,势必会占用很大的内存空间,导致内存消耗过大。
定时删除可以算是上述两种策略的折中。设定一个定时器,每隔一段时间遍历数据库,删除其中的过期键,有效的缓解了定时删除对CPU的占用以及惰性删除对内存的占用。
在实际应用中,Redis采用了惰性删除和定时删除两种策略来对过期键进行处理,上面提到的lookupKeyWrite等函数中就利用到了惰性删除策略,定时删除策略则是在根据服务器的例行处理程序serverCron来执行删除操作,该程序每100ms调用一次。

惰性删除函数–expireIfNeeded()
源码如下:

/* 检查key是否已经过期,如果是的话,将它从数据库中删除

  • 并将删除命令写入AOF文件以及附属节点(主从复制和AOF持久化相关)
  • 返回0代表该键还没有过期,或者没有设置过期时间
  • 返回1代表该键因为过期而被删除
  • /
    int expireIfNeeded(redisDb *db, robj *key) {
    // 获取该键的过期时间
    mstime_t when = getExpire(db,key);
    mstime_t now;
    // 该键没有设定过期时间
    if (when < 0) return 0;
    // 服务器正在加载数据的时候,不要处理
    if (server.loading) return 0;
    // lua脚本相关
    now = server.lua_caller ? server.lua_time_start : mstime();
    // 主从复制相关,附属节点不主动删除key
    if (server.masterhost != NULL) return now > when;
    // 该键还没有过期
    if (now <= when) return 0;
    // 删除过期键
    server.stat_expiredkeys++;
    // 将删除命令传播到AOF文件和附属节点
    propagateExpire(db,key);
    // 发送键空间操作时间通知
    notifyKeyspaceEvent(NOTIFY_EXPIRED,
    "expired",key,db->id);
    // 将该键从数据库中删除
    return dbDelete(db,key);
    }

定期删除策略
过期键的定期删除策略由redis.c/activeExpireCycle()函数实现,服务器周期性地操作redis.c/serverCron()(每隔100ms执行一次)时,会调用activeExpireCycle()函数,分多次遍历服务器中的各个数据库,从数据库中的expires字典中随机检查一部分键的过期时间,并删除其中的过期键。
删除过期键的操作由activeExpireCycleTryExpire函数(activeExpireCycle()调用了该函数)执行,其源码如下:

/* 检查键的过期时间,如过期直接删除*/
int activeExpireCycleTryExpire(redisDb *db, dictEntry *de, long long now) {
// 获取过期时间
long long t = dictGetSignedIntegerVal(de);
if (now > t) {
// 执行到此说明过期
// 创建该键的副本
sds key = dictGetKey(de);
robj *keyobj = createStringObject(key,sdslen(key));
// 将删除命令传播到AOF和附属节点
propagateExpire(db,keyobj);
// 在数据库中删除该键
dbDelete(db,keyobj);
// 发送事件通知
notifyKeyspaceEvent(NOTIFY_EXPIRED,
“expired”,keyobj,db->id);
// 临时键对象的引用计数减1
decrRefCount(keyobj);
// 服务器的过期键计数加1
// 该参数影响每次处理的数据库个数
server.stat_expiredkeys++;
return 1;
} else {
return 0;
}
}

删除过期键对AOF、RDB和主从复制都有影响,等到了介绍相关功能时再讨论。
今天就先到这里~

微信公众号

个人公众号:程序员黄小斜

微信公众号【程序员黄小斜】新生代青年聚集地,程序员成长充电站。作者黄小斜,职业是阿里程序员,身份是斜杠青年,希望和更多的程序员交朋友,一起进步和成长!这一次,我们一起出发。

关注公众号后回复“2019”领取我这两年整理的学习资料,涵盖自学编程、求职面试、算法刷题、Java技术、计算机基础和考研等8000G资料合集。

技术公众号:Java技术江湖

微信公众号【Java技术江湖】一位阿里 Java 工程师的技术小站,专注于 Java 相关技术:SSM、SpringBoot、MySQL、分布式、中间件、集群、Linux、网络、多线程,偶尔讲点Docker、ELK,同时也分享技术干货和学习经验,致力于Java全栈开发!

关注公众号后回复“PDF”即可领取200+页的《Java工程师面试指南》强烈推荐,几乎涵盖所有Java工程师必知必会的知识点。

坚持原创技术分享,您的支持将鼓励我继续创作!