zl程序教程

您现在的位置是:首页 >  数据库

当前栏目

Redis(十八)-Redis的数据结构之整数集合

Redis集合数据结构 整数 十八
2023-09-27 14:19:46 时间

您好,我是码农飞哥,感谢您阅读本文,欢迎一键三连哦
💪🏻 1. Python基础专栏,基础知识一网打尽,9.9元买不了吃亏,买不了上当。 Python从入门到精通
❤️ 2. Python爬虫专栏,系统性的学习爬虫的知识点。9.9元买不了吃亏,买不了上当 。python爬虫入门进阶
❤️ 3. Ceph实战,从原理到实战应有尽有。 Ceph实战
❤️ 4. Java高并发编程入门,打卡学习Java高并发。 Java高并发编程入门
😁 5. 社区逛一逛,周周有福利,周周有惊喜。码农飞哥社区,飞跃计划
全网同名【码农飞哥】欢迎关注,个人VX: wei158556

整数集合的概念

当一个集合只包含整数值元素,并且这个集合的元素数量不多时,Redis就会使用整数集合作为集合键的底层实现,它可以保存的类型为int16_t、int32_t或者int64_t的整数值,集合中不允许有重复元素,Redis除了支持集合内的增删改查,同时还支持多个集合的交并集操作,合理地使用集合可以在实际开发中解决很多实际问题。

常用命令

集合内的操作

  • 添加元素: sadd key element[element ...],返回结果为添加成功的元素个数。
  • 删除元素: srem key element[element ...],返回结果为成功删除的元素个数。
  • 计算元素个数:scard key,该命令的实际复杂度为O(1),不会遍历集合中所有元素,而是直接使用Redis的内部变量。
  • 判断元素是否在集合中:slsmember key element,存在则返回1,否则返回0;
  • 随机从集合中返回指定个数的元素:srandmember key[count]
  • 从集合随机弹出元素:spop key
  • 获取全部元素: smembers key;

集合间操作

  • 取交集: sinter key [key ...]
  • 取并集 sunion key [key ...]
  • 取差集: sdiff key [key ...]

整数集合的实现

整数集合(intset)是Redis用于保存整数值的集合抽象数据结构,它可以保存类型为int6_t、int32_t或者int64_t的整数值,并且保证集合中不会出现重复元素。

	typedef struct intset {
	// 编码方式
	uint32_t encoding;
	// 集合包含的元素数量
	uint32_t length;
	// 保存元素的数组
	int8_t contents[];
	} intset;

contents 数组时整数集合的底层实现,整数集合的每个元素都是contents数组的一个数组项(item),各个项在数组中按值的大小从小到大的有序排列,并且数组中不包括任何重复项。
length属性记录了整数集合包含的元素数量,也即是contents数组的长度。
虽然intset结构将contents属性声明为int8_t类型的数组,但实际上contents数组并不保存任何int8_t类型的值,contents数组的整数类型取决于encoding属性的值。

  • 如果encoding属性的值INTSET_ENC_INT16,那么contents就是一个int16_t类型的数组,数组里的每个项都是一个int16_t类型的整数值(最少值为 -32768,最大值为 32767)。
  • 如果encoding属性的值为INTSET_ENC_INT32,那么contents就是一个int32_t类型的数组,数组里的每个项都是一个int32_t类型的整数值(最小值为-2147483648,最大值为2147483647)。
  • 如果encoding属性的值为INTSET_ENC_INT64,那么contents就是一个int64_t类型的数组,数组里的每个项都是一个int64_t类型的整数值(最小值为-9223372036854775808,最大值为9223372036854775807)。

举个例子

在这里插入图片描述

如上图所示,encoding属性的值为INTSET_ENC_INT16,表示整数集合的底层实现为int16类型的数组,而集合保存的都是int16_t类型的整数值。
length属性的值为5,表示整数集合包含五个元素。
content数组按从小到大的顺序保存着集合中的五个元素。
因为每个集合元素都是int16_t类型的整数值,所以contents数组的大小等于size of(int16_t) *5=80位

整数集合的升级

每当我们要将一个新元素添加到整数集合里面,并且新元素的类型比整数集合现有所有元素的类型都要长时,整数集合需要进行升级(upgrade),然后才能将新元素添加到整数集合里面。

升级整数集合并添加新元素共分为三步进行

  1. 根据新元素的类型,扩展整数集合数组的空间大小,并为新元素分配空间。
  2. 将底层数组现有的所有元素都转换成新元素相同的类型,并将类型转换后的元素放置在正确的位置上,而且在放置元素的过程中,需要继续维持底层数组的有序性不变。
  3. 将新元素添加到底层数组里面。

升级的好处

  1. 提升灵活性
    因为整数集合可以通过自动升级底层数组类型适应新元素,所以我们可以随意地将int16_t、int32_t或int64_t类型的整数添加到集合中,而不必担心出现类型错误,这种做法非常灵活。
  2. 节约内存
    要让一个数组可以同时保存int16_t、int32_t、int64_t三种类型的值,最简单的做法就是直接使用int64_t类型的数组作为整数集合的底层实现,不过这样一来,即使添加到整数集合里面的都是int16_t类型或者int32_t类型的值,数组都需要使用int64_t类型的空间去保存他们,从而出现了浪费内存的情况。

使用场景

集合类型典型的使用场景就是标签功能(tag),标签数据对用户体验以及增强用户粘度比较重要。
下面简单介绍如何使用集合类型实现标签功能的若干功能:

  1. 给用户添加标签
sadd user:1:tags tag1 tag2 tag3
sadd user:2:tags tag1 tag2 tag4
...
sadd user:3:tags tag1 tag2 tag5
  1. 给标签添加用户
sadd tag1:users user:1 user:2
sadd tag2:users user:1 user:3
...
sadd tag3:users user:1 user:4
  1. 删除用户下的标签
    srem  user:1:tags  tag1  tag5
  1. 计算用户共同感兴趣的标签
    sinter user:1:tags user:2:tags

总结

本文简单介绍了整数集合这种数据结构,整数集合是集合键的底层实现之一,是专门用来存储整数的,整数集合的底层实现是数组,这个数组以有序,无重复的方式保存集合元素,在有需要时,程序为会根据新添加元素的类型,改变这个数组的类型,升级操作为整数集合带来了操作上的灵活性,并且尽可能节约了内存。