您当前的位: 首页 > 宏观 > > 内容页

细说redis十种数据类型及底层原理

来源:面包芯语 2023-05-15 08:22:12

String

概述

string 是 Redis 最基本的数据类型,它可以存储任意类型的数据,比如文本、数字、图片或者序列化的对象。一个 string 类型的键最大可以存储 512 MB 的数据。

string 类型的底层实现是 SDS(simple dynamic string),它是一个动态字符串结构,由长度、空闲空间和字节数组三部分组成。SDS有3种编码类型:

embstr和raw存储字符串数据,int存储整型数据


(相关资料图)

应用场景

string 类型的应用场景非常广泛,比如:

底层原理

embstr结构

embstr 结构存储小于等于44个字节的字符串,embstr 每次开辟64个byte的空间

raw结构

image

embstr和raw的转换

在存储字符串的时候,redis会根据数据的长度判断使用哪种结构

127.0.0.1:6379>objectencodingstr"embstr"#str赋值44个字节的字符串127.0.0.1:6379>setstr1234567890123456789012345678901234567890abcdOK127.0.0.1:6379>objectencodingstr"embstr"#str2赋值45个字节的字符串127.0.0.1:6379>setstr21234567890123456789012345678901234567890abcdeOK127.0.0.1:6379>objectencodingstr2"raw"127.0.0.1:6379>setnum123OK127.0.0.1:6379>objectencodingnum"int"

Hash

概述

hash 是一个键值对集合,它可以存储多个字段和值,类似于编程语言中的 map 对象。一个 hash 类型的键最多可以存储 2^32 - 1 个字段。

Hash类型的底层实现有三种:

应用场景

hash 类型的应用场景主要是存储对象,比如:

底层原理

Redis在存储hash结构的数据,为了达到内存和性能的平衡,也针对少量存储和大量存储分别设计了两种结构,分别为:

从ziplist/listpack编码转换为hashTable编码是通过判断元素数量或单个元素Key或Value的长度决定的:

ziplist与listpack

ziplist/listpack都是hash结构用来存储少量数据的结构。从Redis7.0后,hash默认使用listpack结构。因为 ziplist有一个致命的缺陷,就是连锁更新,当一个节点的长度发生变化时,可能会导致后续所有节点的长度字段都要重新编码,这会造成极差的性能

ziplist结构

ziplist是一种紧凑的链表结构,它将所有的字段和值顺序地存储在一块连续的内存中。Redis中ziplist源码

typedefstruct{/*当使用字符串时,slen表示为字符串长度*/unsignedchar*sval;unsignedintslen;/*当使用整形时,sval为NULL,lval为ziplistEntry的value*/longlonglval;}ziplistEntry;

listpack结构

image

zipList的连锁更新问题

ziplist的每个entry都包含previous_entry_length来记录上一个节点的大小,长度是1个或5个byte:

假设,现有有N个连续、长度为250~253个byte的entry,因此entry的previous_entry_length属性占用1个btye

image

当第一节长度大于等于254个bytes,导致第二节previous_entry_length变为5个bytes,第二节的长度由250变为254。而第二节长度的增加必然会影响第三节的previous_entry_length。ziplist这种特殊套娃的情况下产生的连续多次空间扩展操作成为连锁更新。新增、删除都可能导致连锁更新的产生。

listpack是如何解决的

image

hashTable

hashTable是一种散列表结构,它将字段和值分别存储在两个数组中,并通过哈希函数计算字段在数组中的索引

image

Redis中hashTable源码

structdict{dictType*type;dictEntry**ht_table[2];unsignedlonght_used[2];longrehashidx;/*当进行rehash时,rehashidx为-1*/int16_tpauserehash;/*如果rehash暂停,pauserehash则大于0,(小于0表示代码错误)*/signedcharht_size_exp[2];/*哈希桶的个数(size=1<};typedefstructdict{dictEntry**table;dictType*type;unsignedlongsize;unsignedlongsizemask;unsignedlongused;void*privdata;}dict;typedefstructdictEntry{void*key;void*val;structdictEntry*next;}dictEntry;

ziplist和hashTable的转换

image
127.0.0.1:6379>hseth1id123456789012345678901234567890123456789012345678901234567890abcd(integer)1127.0.0.1:6379>objectencodingh1"ziplist"127.0.0.1:6379>hseth2id123456789012345678901234567890123456789012345678901234567890abcde(integer)1127.0.0.1:6379>objectencodingh2"hashtable"

ziplist的废弃

显然是ziplist在field个数太大、key太长、value太长三者有其一的时候会有以下问题:

hashTable变得越来越长怎么办

扩容,hashTabel是怎么扩容的?使用的是渐进式扩容rehashrehash会重新计算哈希值,且将哈希桶的容量扩大。

rehash 步骤

image

扩展哈希和收缩哈希都是通过执行rehash来完成,这其中就涉及到了空间的分配和释放,主要经过以下五步:

渐进式 rehash

Redis中的这种重新哈希的操作因为不是一次性全部rehash,而是分多次来慢慢的将ht[0]中的键值对rehash到ht[1],故而这种操作也称之为渐进式rehash。渐进式rehash可以避免集中式rehash带来的庞大计算量,是一种分而治之的思想。

在渐进式rehash过程中,因为还可能会有新的键值对存进来,此时Redis的做法是新添加的键值对统一放入ht[1]中,这样就确保了ht[0]键值对的数量只会减少。

当正在执行rehash操作时,如果服务器收到来自客户端的命令请求操作,则会先查询ht[0],查找不到结果再到ht[1]中查询

List

概述

list 是一个有序的字符串列表,它按照插入顺序排序,并且支持在两端插入或删除元素。一个 list 类型的键最多可以存储 2^32 - 1 个元素。

redis3.2以后,list 类型的底层实现只有一种结构,就是quicklist。版本不同时,底层实现是不同的,下面会讲解。

应用场景

list 类型的应用场景主要是实现队列和栈,比如:

底层原理

在讲解list结构之前,需要先说明一下list结构编码的更替,如下

linkedlist与ziplist

Redis3.2之前,linkedlistziplist两种编码可以选择切换,它们之间的转换关系如图

同样地,ziplist转为linkedlist的条件可在redis.conf配置

list-max-ziplist-entries 512list-max-ziplist-value 64

quickList(ziplist、linkedlist结合版)

quicklist存储了一个双向列表,每个列表的节点是一个ziplist,所以实际上quicklist并不是一个新的数据结构,它就是linkedlistziplist的结合,然后被命名为快速列表。ziplist内部entry个数可在redis.conf配置

list-max-ziplist-size -2# -5: 每个ziplist最多为 64 kb  <-- 影响正常负载,不推荐# -4: 每个ziplist最多为 32 Kb  <-- 不推荐# -3: 每个ziplist最多为 16 Kb  <-- 最好不要使用# -2: 每个ziplist最多为 8 Kb   <-- 好# -1: 每个ziplist最多为 4 Kb   <-- 好# 正数为ziplist内部entry个数

ziplist通过特定的LZF压缩算法来将节点进行压缩存储,从而更进一步的节省空间,而很多场景都是两端元素访问率最高,我们可以通过配置list-compress-depth来排除首尾两端不压缩的entry个数。

list-compress-depth 0# - 0:不压缩(默认值)# - 1:首尾第 1 个元素不压缩# - 2:首位前 2 个元素不压缩# - 3:首尾前 3 个元素不压缩# - 以此类推

quickList(listpack、linkedlist结合版)

和Hash结构一样,因为ziplist有连锁更新问题,redis7.0ziplist替换为listpack,下面是新quickList的结构图

image

Redis中listpack源码

typedefstructquicklist{quicklistNode*head;quicklistNode*tail;unsignedlongcount;/*所有列表包中所有条目的总数,占用16bits,最大65536*/unsignedlonglen;/*quicklistNode的数量*/signedintfill:QL_FILL_BITS;/*单个节点的填充因子*/unsignedintcompress:QL_COMP_BITS;/*不压缩的端节点深度;0=off */unsignedintbookmark_count:QL_BM_BITS;quicklistBookmarkbookmarks[];}quicklist;typedefstructquicklistNode{structquicklistNode*prev;structquicklistNode*next;unsignedchar*entry;size_tsz;/*当前entry占用字节*/unsignedintcount:16;/*listpack元素个数,最大65535*/unsignedintencoding:2;/*RAW==1orLZF==2*/unsignedintcontainer:2;/*PLAIN==1orPACKED==2*/unsignedintrecompress:1;/*当前listpack是否需要再次压缩*/unsignedintattempted_compress:1;/*测试用*/unsignedintextra:10;/*备用*/}quicklistNode;

listpack内部entry个数可在redis.conf配置

List-Max-listpack-size -2# -5: 每个listpack最多为 64 kb  <-- 影响正常负载,不推荐# -4: 每个listpack最多为 32 Kb  <-- 不推荐# -3: 每个listpack最多为 16 Kb  <-- 最好不要使用# -2: 每个listpack最多为 8 Kb   <-- 好# -1: 每个listpack最多为 4 Kb   <-- 好# 正数为listpack内部entry个数

Set

概述

set 是一个无序的字符串集合,它不允许重复的元素。一个 set 类型的键最多可以存储 2^32 - 1 个元素。

set 类型的底层实现有两种:

Redis 会根据 set 中元素的数量和类型来选择合适的编码方式,当 set 达到一定的阈值时,会自动转换编码方式。

typedefstructintset{uint32_tencoding;uint32_tlength;int8_tcontents[];}intset;

应用场景

set 类型的应用场景主要是利用集合的特性,比如:

底层原理

在讲解set结构之前,需要先说明一下set结构编码的更替,如下

intset

intset是一种紧凑的数组结构,它只保存int类型的数据,它将所有的元素按照从小到大的顺序存储在一块连续的内存中。intset会根据传入的数据大小,encoding分为int16_tint32_tint64_t

127.0.0.1:6379>saddset123(integer)1127.0.0.1:6379>objectencodingset"intset"127.0.0.1:6379>saddsetabcd(integer)1127.0.0.1:6379>objectencodingset"hashtable"

intset 和 hashtable 的转换

Redis7.2之前,当一个集合满足以下两个条件时,Redis 会选择使用intset编码:

intset最大元素数量可在redis.conf配置

set-max-intset-entries 512

为什么加入了listpack

redis7.2之前,sds类型的数据会直接放入到编码结构式为hashtableset中。其中,sds其实就是redis中的string类型。

而在redis7.2之后,sds类型的数据,首先会使用listpack结构当 set 达到一定的阈值时,才会自动转换为hashtable

添加listpack结构是为了提高内存利用率和操作效率,因为 hashtable 的空间开销和碰撞概率都比较高。

hashtable 的空间开销高

hashtable 的空间开销高是因为它需要预先分配一个固定大小的数组来存储键值对,而这个数组的大小通常要大于实际存储的元素个数,以保证较低的装载因子。装载因子是指 hashtable 中已经存储的元素个数和数组大小的比值,它反映了 hashtable 的空间利用率

因此,hashtable 需要在装载因子和空间利用率之间做一个平衡,通常装载因子的推荐值是 0.75

hashtable 的碰撞概率高

hashtable的碰撞概率高是因为它使用了一个散列函数来将任意长度的键映射到一个有限范围内的整数,作为数组的索引

散列函数的设计很重要,它应该尽可能地保证不同的键能够均匀地分布在数组中,避免出现某些位置过于拥挤,而其他位置过于稀疏的情况。然而,由于散列函数的输出范围是有限的,而键的取值范围是无限的,所以不可能完全避免两个不同的键被散列到同一个位置上,这就产生了碰撞。碰撞会影响 hashtable 的性能,因为它需要额外的处理方式来解决冲突,比如开放寻址法或者链地址法

举例说明,假设有一个大小为8的hashtable,使用取模运算作为散列函数,即h(k) = k mod 8。现在有四个键:5,13,21,29,它们都被散列到索引1

image

这就是一个碰撞的例子,因为四个键都映射到了同一个索引。这种情况可能是由于以下原因造成的:

为了解决碰撞,redis采用了链地址法。就是在每个索引处维护一个链表,存储所有散列到该索引的键。但是,如果链表过长,查找效率会降低。因此,一般建议保持hashtable的负载因子(即键的数量除以hashtable的大小)在一定范围内,比如0.5到0.75之间。如果负载因子过高或过低,可以通过扩容或缩容来调整hashtable的大小

intset 、listpack和hashtable的转换

intset 、listpack和hashtable这三者的转换时根据要添加的数据、当前set的编码和阈值决定的。

ZSet

概述

Redis 中的 zset 是一种有序集合类型,它可以存储不重复的字符串元素,并且给每个元素赋予一个排序权重值(score)。Redis 通过权重值来为集合中的元素进行从小到大的排序。zset的成员是唯一的,但权重值可以重复。一个 zset 类型的键最多可以存储 2^32 - 1 个元素。

Redis中zset源码

typedefstructzskiplistNode{sdsele;doublescore;structzskiplistNode*backward;structzskiplistLevel{structzskiplistNode*forward;unsignedlongspan;}level[];}zskiplistNode;typedefstructzskiplist{structzskiplistNode*header,*tail;unsignedlonglength;intlevel;}zskiplist;typedefstructzset{dict*dict;zskiplist*zsl;}zset;

应用场景

zset 类型的应用场景主要是利用分数和排序的特性,比如:

底层原理

Redis在存储zset结构的数据,为了达到内存和性能的平衡,针对少量存储和大量存储分别设计了两种结构,分别为:

zset 中的元素个数和元素值的长度比较小的时候,Redis 使用ziplist/listpack来节省内存空间。当 zset 中的元素个数和元素值的长度达到一定阈值时,Redis 会自动将ziplist/listpack转换为skiplist,以提高操作效率

具体来说,当 zset 同时满足以下两个条件时,会使用 listpack作为底层结构:

zset 中不满足以上两个条件时,会使用 skiplist 作为底层结构。

skiplist

跳跃表是一种随机化的数据结构,实质就是一种可以进行二分查找的有序链表。跳跃表在原有的有序链表上面增加了多级索引,通过索引来实现快速查找。跳跃表不仅能提高搜索性能,同时也可以提高插入和删除操作的性能

image

跳跃表相比于其他平衡树结构,有以下几个优点和缺点:

优点:

缺点:

redis的skiplist

skiplist有一个层数上的问题,当层数过多,会影响查询效率。而Redis 使用了一个随机函数来决定每个节点的层数,这个随机函数的期望值是 1/(1-p),其中 p 是一个概率常数,Redis 中默认为 0.25。这样可以保证跳跃表的平均高度为 log (1/p) n,其中 n 是节点数。Redis 还限制了跳跃表的最大层数为 32 ,这样可以避免过高的索引层造成空间浪费

Stream

概述

stream 是一个类似于日志的数据结构,它可以记录一系列的键值对,每个键值对都有一个唯一的 ID。一个 stream 类型的键最多可以存储 2^64 - 1 个键值对。

stream 类型的底层实现是 rax(基数树),它是一种压缩的前缀树结构,它将所有的键值对按照 ID 的字典序存储在一个树形结构中。rax 可以快速地定位、插入、删除任意位置的键值对

应用场景

stream 类型的应用场景主要是实现事件驱动的架构,比如:

底层原理

Rax Tree

rax tree是一种基于基数树(radix tree)的变体,也叫做压缩前缀树(compressed prefix tree),它被应用于redis stream中,用来存储streamID,其数据结构为

typedefstructraxNode{uint32_tiskey:1;/*Doesthisnodecontainakey?*/uint32_tisnull:1;/*AssociatedvalueisNULL(don"tstoreit).*/uint32_tiscompr:1;/*前缀是否压缩*/uint32_tsize:29;/*Numberofchildren,orcompressedstringlen.*/unsignedchardata[];}raxNode;

为了便于理解,设定一些场景举例说明

场景一:只插入foot

数据结构为:

image

其中,z-ptr指向的叶子节点的iskey=1,标识foot这个key。下图为使用树状图的形式来展现其数据结构

场景二:插入foot后,插入footer

数据结构为:

image

其插入过程为:

下图为使用树状图的形式来展现其数据结构

场景三:插入foot后,插入fo

数据结构为:

image

其插入过程为:

下图为使用树状图的形式来展现其数据结构

场景四:插入foot后,插入foobar

数据结构为:

image

其插入过程为:

下图为使用树状图的形式来展现其数据结构

Stream

stream的底层使用了rax treelistpack两种结构,rax tree用来存储streamID,而listpack用来存储对应的值,结构图如下:

image

Hyperloglog

概述

HyperLogLog 是一种概率数据结构,用于在恒定的内存大小下估计集合的基数(不同元素的个数)。它不是一个独立的数据类型,而是一种特殊的 string 类型,它可以使用极小的空间来统计一个集合中不同元素的数量,也就是基数。一个 hyperloglog 类型的键最多可以存储 12 KB 的数据

hyperloglog 类型的底层实现是 SDS(simple dynamic string),它和 string 类型相同,只是在操作时会使用一种概率算法来计算基数。hyperloglog 的误差率为 0.81%,也就是说如果真实基数为 1000,那么 hyperloglog 计算出来的基数可能在 981 到 1019 之间

应用场景

hyperloglog 类型的应用场景主要是利用空间换时间和精度,比如:

假如需要统计某商品的用户关注数,可以通过以下方式:

>PFADDgoodA"1"1>PFADDgoodA"2"1>PFADDgoodA"3"1>PFCOUNTgoodA3

GEO

概述

geospatial 是一种用于存储和查询地理空间位置的数据类型,它基于 sorted set 数据结构实现,利用 geohash 算法将经纬度编码为二进制字符串,并作为 sorted set 的 score 值。Redis geospatial 提供了一系列的命令来添加、删除、搜索和计算地理空间位置,例如:

应用场景

geospatial 的应用是地理位置搜索、分析和展示,例如地图应用、导航应用、位置服务应用等。例如,可以使用 geospatial 来实现以下功能:

Bitmap

概述

bitmap 不是一个独立的数据类型,而是一种特殊的 string 类型,它可以将一个 string 类型的值看作是一个由二进制位组成的数组,并提供了一系列操作二进制位的命令。一个 bitmap 类型的键最多可以存储 2^32 - 1 个二进制位。

bitmap 类型的底层实现是 SDS(simple dynamic string),它和 string 类型相同,只是在操作时会将每个字节拆分成 8 个二进制位。

应用场景

bitmap 类型的应用场景主要是利用二进制位的特性,比如:

假如需要统计每个用户的当天登录次数统计。

首先,需要规定bitmap的格式,假设为{userid}:{年份}:{第几天} {秒数} {是否登录}

userid为100的用户,记录他在2024年第100天中第1秒,是否登录

SETBIT1000:2024:100110

userid为100的用户,记录他在2024年第100天中第10240 秒,是否登录

SETBIT1000:2024:1001024010

userid为100的用户,记录他在2024年第100天中第86400 秒,是否登录

SETBIT1000:2024:1008640010

统计userid为100的用户,在2024年第100天的登录次数

BITCOUNT1000:2024:1003

Bitfield

概述

bitfield结构是基于字符串类型的一种扩展,可以让你对一个字符串中的任意位进行设置,增加和获取操作,就像一个位数组一样

可以操作任意位长度的整数,从无符号的1位整数到有符号的63位整数。这些值是使用二进制编码的Redis字符串来存储的

bitfield结构支持原子的读,写和增加操作,使它们成为管理计数器和类似数值的好选择

使用场景

Bitfield的使用场景与bitmap 类似,主要是一些需要用不同位长度的整数来表示状态或属性的场合,例如:

bitfieldbitmap都是基于string类型的位操作,但是有一些区别:

例如,使用bitfield存储用户的个人信息,

假设有一个用户,性别是女,年龄是25,身高是165厘米,体重是50千克,可以用以下命令来存储和获取这些信息:

>BITFIELDuser:1:infoSETu8#01SETu8#125SETu16#2165SETu16#3500000000

然后,获取这个用户的信息,性别、年龄、身高、体重

>BITFIELDuser:1:infoGETu8#0GETu8#1GETu16#2GETu16#312516550000

往期推荐

图文详解 Linux 分段机制!

好好问个问题很难?

保护模式下的内存管理

x86 ,她来了

我和 chatGPT 对线操作系统!

关键词:

Copyright ©  2015-2022 北极数据网版权所有  备案号:浙ICP备2022016517号-19   联系邮箱:514 676 113@qq.com