Redis数据类型——SDS(简单动态字符串)

2023-12-31 16:38

本文主要是介绍Redis数据类型——SDS(简单动态字符串),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Redis并没有使用C语言传统的字符串,而是构建了一种名为简单动态字符串(Simple dynamic string,SDS),并作为默认字符串使用。

例如:执行如下命令

SET msg "hello world"

Redis数据库中将建立一个键值对,键是一个字符串对象,是一个负责保存"msg"的SDS,而值也是一个SDS,负责保存“hello world”。

  • 注意:SDS还被用于缓冲区,AOF缓冲区以及客户端的输入缓冲区都是SDS实现的

 

SDS的定义(未包含4.0新特性)

3.0特性

每个sds.h/sdshdr 都代表一个SDS值

struct sdshdr {

            int len;//记录SDS保存的数组的长度

            int free;//记录SDS中未使用的字节数量

            char buf[]; //字节数组,保存字符串

}

 

buf是一个char型数组,前五个字节保存了 R E D I S 五个字符,最后一个字节保存了空字符 \0;空字符并不算在len里面。额外分配 1 字节空间、把空字符自动加到数组末尾等操作都是SDS自动完成的,完全不用使用者来管理,对用户是完全透明的。

保留空字符的好处就是可以沿用C字符串函数库里的函数。可以直接使用print(“%s”,SDSname->buf);输出。

4.0新特性

#define SDS_TYPE_5  0
#define SDS_TYPE_8  1
#define SDS_TYPE_16 2
#define SDS_TYPE_32 3
#define SDS_TYPE_64 4
#define SDS_TYPE_MASK 7 //类型掩码
#define SDS_TYPE_BITS 3 
#define SDS_HDR_VAR(T,s) struct sdshdr##T *sh = (void*)((s)-(sizeof(struct sdshdr##T))); //获取header头指针,其中##是拼接的含义
#define SDS_HDR(T,s) ((struct sdshdr##T *)((s)-(sizeof(struct sdshdr##T)))) //获取header头指针
#define SDS_TYPE_5_LEN(f) ((f)>>SDS_TYPE_BITS) //获取sdshdr5的长度

 

struct __attribute__ ((__packed__)) sdshdr5 {   //5种header定义,节省内存使用
    uint8_t len; // 字符串实际长度
    uint8_t alloc; //字符串已拥有的内存空间容量  sdsalloc() = sdsavail() + sdslen()
    unsigned char flags;//表示类型,见宏定义
    char buf[];//buf[] : 字符串内容
};

 

static inline size_t sdslen(const sds s) {         //计算sds长度
    unsigned char flags = s[-1];
    switch(flags&SDS_TYPE_MASK) {
        case SDS_TYPE_5:
            return SDS_TYPE_5_LEN(flags);
        case SDS_TYPE_8:
            return SDS_HDR(8,s)->len;
        case SDS_TYPE_16:
            return SDS_HDR(16,s)->len;
        case SDS_TYPE_32:
            return SDS_HDR(32,s)->len;
        case SDS_TYPE_64:
            return SDS_HDR(64,s)->len;
    }
    return 0;
}

 

//计算sds可用空间
static inline size_t sdsavail(const sds s) {
    unsigned char flags = s[-1];
    switch(flags&SDS_TYPE_MASK) {
        case SDS_TYPE_5: {
            return 0;
        }
        case SDS_TYPE_8: {
            SDS_HDR_VAR(8,s);
            return sh->alloc - sh->len;
        }
        case SDS_TYPE_16: {
            SDS_HDR_VAR(16,s);
            return sh->alloc - sh->len;
        }
        case SDS_TYPE_32: {
            SDS_HDR_VAR(32,s);
            return sh->alloc - sh->len;
        }
        case SDS_TYPE_64: {
            SDS_HDR_VAR(64,s);
            return sh->alloc - sh->len;
        }
    }
    return 0;
}

 


//设置sds长度
static inline void sdssetlen(sds s, size_t newlen) {
    unsigned char flags = s[-1];
    switch(flags&SDS_TYPE_MASK) {
        case SDS_TYPE_5:
            {
                unsigned char *fp = ((unsigned char*)s)-1;
                *fp = SDS_TYPE_5 | (newlen << SDS_TYPE_BITS);
            }
            break;
        case SDS_TYPE_8:
            SDS_HDR(8,s)->len = newlen;
            break;
        case SDS_TYPE_16:
            SDS_HDR(16,s)->len = newlen;
            break;
        case SDS_TYPE_32:
            SDS_HDR(32,s)->len = newlen;
            break;
        case SDS_TYPE_64:
            SDS_HDR(64,s)->len = newlen;
            break;
    }
}

 

SDS与C字符串的区别

1、常数复杂度获取字符串长度

SDS获取字符串数组的时间复杂度是O(1),因为有len属性记录字符串的长度,而C语言需要遍历一遍才能获得字符串的长度,时间复杂度为O(N)。

2、杜绝缓冲区溢出

<string.h>/strcat 函数可以将src中的内容拼接到 dest 字符串末尾:

char *strcat(char *dest , char *src);

因为c不会记录字符串长度,使用strcat函数的时候,假设已经为 dest 分配了足够多的空间,可以容纳 src 但是,这一假设不成立的时候,就产生了内存溢出。

如图所示,内存中有两个字符串,分别为s1 s2,当执行语句;

strcat(s1 , " world");

但是,没有给s1分配足够多的空间,在执行完语句后会变成下图

这时,s2的内容被意外修改了,而与C语言策略不同,SDS进行修改前,会事先检查SDS的空间是否满足修改所需的要求,如不满足会自动扩展至所需空间。

3、减少修改字符时扩展内存的次数

拿C语言字符串来说,如果需要连续地使用 strcat 函数,为避免内存泄漏,需要连续地扩展空间,为了避免C语言这种缺陷,SDS实现了空间与分配和惰性空间释放两种优化策略

1、空间预分配

SDS大小分配策略
小于1MB分配的未使用空间 free = len ,例如:如果修改后的SDSlen长度为5,那么free分配的空间也是5  , 总空间就是 5 + 5 + 1 = 11(额外1字节给空字符)
大于等于1MB

分配的未使用空间为 1MB ,例如:如果修改后的SDSlen长度为5MB,那么free分配的空间就是 1MB  , 总空间就是 5MB + 1MB + 1byte(额外1字节给空字符)

 

这样就降低了内存重分配的次数,连续增长N次的重分配次数从必定N次降低为最多N次。

 

2、惰性空间释放

此策略用于优化字符串缩短操作,例如:sdstrim函数执行,对于字符串 s 。

 执行 sdstrim(s , "ab");   //删除字符串所有的ab

执行完后空余出4字节,SDS并没有立即释放,而是使用 free 记录空字符,避免将来的内存重分配。

当然,SDS也提供了释放未使用的空间的API,避免内存浪费。

 

4、二进制安全

C语言字符串不能保存包含 空字符串的字符串 ,否则会编译器会认为提前结束遍历,所以不能保存像图片音频等含空字符的文件,SDS保存在buf里的字符串都是二进制安全的,程序不会对其中的数据做任何限制和过滤。

SDS之所以能检测是否结束,是利用 len 属性而不是利用空字符。

5、兼容部分C字符串函数

即使SDS是二进制安全的,但是还保留了以空字符为结尾的惯例,这样就可以继续使用C语言库函数了。避免了重写代码的麻烦。

 

这篇关于Redis数据类型——SDS(简单动态字符串)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/556594

相关文章

C#数据结构之字符串(string)详解

《C#数据结构之字符串(string)详解》:本文主要介绍C#数据结构之字符串(string),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录转义字符序列字符串的创建字符串的声明null字符串与空字符串重复单字符字符串的构造字符串的属性和常用方法属性常用方法总结摘

C#如何动态创建Label,及动态label事件

《C#如何动态创建Label,及动态label事件》:本文主要介绍C#如何动态创建Label,及动态label事件,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C#如何动态创建Label,及动态label事件第一点:switch中的生成我们的label事件接着,

SpringCloud动态配置注解@RefreshScope与@Component的深度解析

《SpringCloud动态配置注解@RefreshScope与@Component的深度解析》在现代微服务架构中,动态配置管理是一个关键需求,本文将为大家介绍SpringCloud中相关的注解@Re... 目录引言1. @RefreshScope 的作用与原理1.1 什么是 @RefreshScope1.

MyBatis 动态 SQL 优化之标签的实战与技巧(常见用法)

《MyBatis动态SQL优化之标签的实战与技巧(常见用法)》本文通过详细的示例和实际应用场景,介绍了如何有效利用这些标签来优化MyBatis配置,提升开发效率,确保SQL的高效执行和安全性,感... 目录动态SQL详解一、动态SQL的核心概念1.1 什么是动态SQL?1.2 动态SQL的优点1.3 动态S

Mysql表的简单操作(基本技能)

《Mysql表的简单操作(基本技能)》在数据库中,表的操作主要包括表的创建、查看、修改、删除等,了解如何操作这些表是数据库管理和开发的基本技能,本文给大家介绍Mysql表的简单操作,感兴趣的朋友一起看... 目录3.1 创建表 3.2 查看表结构3.3 修改表3.4 实践案例:修改表在数据库中,表的操作主要

Java实现时间与字符串互相转换详解

《Java实现时间与字符串互相转换详解》这篇文章主要为大家详细介绍了Java中实现时间与字符串互相转换的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、日期格式化为字符串(一)使用预定义格式(二)自定义格式二、字符串解析为日期(一)解析ISO格式字符串(二)解析自定义

springboot简单集成Security配置的教程

《springboot简单集成Security配置的教程》:本文主要介绍springboot简单集成Security配置的教程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录集成Security安全框架引入依赖编写配置类WebSecurityConfig(自定义资源权限规则

Redis 中的热点键和数据倾斜示例详解

《Redis中的热点键和数据倾斜示例详解》热点键是指在Redis中被频繁访问的特定键,这些键由于其高访问频率,可能导致Redis服务器的性能问题,尤其是在高并发场景下,本文给大家介绍Redis中的热... 目录Redis 中的热点键和数据倾斜热点键(Hot Key)定义特点应对策略示例数据倾斜(Data S

C语言中的数据类型强制转换

《C语言中的数据类型强制转换》:本文主要介绍C语言中的数据类型强制转换方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C语言数据类型强制转换自动转换强制转换类型总结C语言数据类型强制转换强制类型转换:是通过类型转换运算来实现的,主要的数据类型转换分为自动转换

python中字符串拼接的几种方法及优缺点对比详解

《python中字符串拼接的几种方法及优缺点对比详解》在Python中,字符串拼接是常见的操作,Python提供了多种方法来拼接字符串,每种方法有其优缺点和适用场景,以下是几种常见的字符串拼接方法,需... 目录1. 使用 + 运算符示例:优缺点:2. 使用&nbsjsp;join() 方法示例:优缺点:3