20 | 删除数据后，为什么内存占用率还是很高？

本文主要是介绍20 | 删除数据后，为什么内存占用率还是很高？，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

文章目录

Redis核心技术与实战
- 实践篇
- - 20 | 删除数据后，为什么内存占用率还是很高？
  - - 什么是内存碎片？
    - 内存碎片是如何形成的？
    - 内因：内存分配器的分配策略
    - 外因：键值对大小不一样和删改操作
    - 如何判断是否有内存碎片？
    - 如何清理内存碎片？
    - - Redis 自动内存碎片清理机制

Redis核心技术与实战

实践篇

20 | 删除数据后，为什么内存占用率还是很高？

疑问：删除数据，数据量已经不大了，为什么使用 top 命令查看时，Redis 依然占用了很多内存？

因为当数据删除后，Redis 释放的内存空间会由内存分配器管理，并不会立即返回给操作系统。所以，操作系统仍然会记录着给 Redis 分配了大量内存。

潜在的风险点

Redis 释放的内存空间可能并不是连续的，这些不连续的内存空间很有可能处于一种闲置的状态。这就会导致一个问题：虽然有空闲空间，Redis 却无法用来保存数据，不仅会减少 Redis 能够实际保存的数据量，还会降低 Redis 运行机器的成本回报率。

什么是内存碎片？

通常情况下，内存空间闲置，往往是因为操作系统发生了较为严重的内存碎片。

假设一个车厢的座位总共有 60 个，现在已经卖了 57 张票。A、B、C 三人想要坐在一起，但剩下的三个座位是分散的，无法满足三人的要求。

在这里插入图片描述

类似的，应用申请的是一块连续地址空间的 N 字节，但在剩余的内存空间中，没有大小为 N 字节的连续空间，那么，这些剩余空间就是内存碎片（比如上图中的“空闲 2 字节”和“空闲 1 字节”）。

内存碎片是如何形成的？

内存碎片的形成有内因和外因两个层面的原因。简单来说，内因是操作系统的内存分配机制（内存分配器的分配策略），外因是 Redis 的负载特征（键值对大小不一样和删改操作）。

内因：内存分配器的分配策略

内存分配器的分配策略就决定了操作系统无法做到“按需分配”。

内存分配器一般是按固定大小来分配内存，而不是完全按照应用程序申请的内存空间大小给程序分配。

Redis 可以使用 libc、jemalloc、tcmalloc 多种内存分配器来分配内存，默认使用 jemalloc。

jemalloc 的分配策略之一，是按照一系列固定的大小划分内存空间（2 的 N 次方），当程序申请的内存最接近某个固定值时，jemalloc 会给它分配相应大小的空间。假设 Redis 申请一个 30 字节的空间保存数据，jemalloc 就会分配 32 字节，如果此时应用想要存入 2 字节的数据，则刚好够用，这样的分配方式起到了减少分配次数的作用；若此时应用想要存入4个字节的数据，而剩余的空间无法满足要求，则成为了内存碎片。

外因：键值对大小不一样和删改操作

第一个外因
Redis 通常作为共用的缓存系统或键值数据库对外提供服务。所以，不同业务应用的数据都可能保存在 Redis 中，这就会带来不同大小的键值对。这样一来，Redis 申请内存空间分配时，本身就会有大小不一的空间需求（简单地说，申请空间无规律）。
但是，内存分配器只能按固定大小分配内存，分配的内存空间一般都会比申请的空间大一些，不会完全一致，这本身就会造成一定的碎片，降低内存空间存储效率。
第二个外因
键值对会被修改和删除，这会导致空间的扩容和释放。具体来说，一方面，如果修改后的键值对变大或变小了，就需要占用额外的空间或者释放不用的空间。另一方面，删除的键值对后，就会把空间释放出来，形成空闲空间。

如何判断是否有内存碎片？

Redis 是内存数据库，内存利用率的高低直接关系到 Redis 运行效率的高低。Redis 自身提供了 INFO memory 命令，可以用来查询内存使用的详细信息，命令如下：

INFO memory
# Memory
used_memory:1073741736
used_memory_human:1024.00M
used_memory_rss:1997159792
used_memory_rss_human:1.86G
…
mem_fragmentation_ratio:1.86

mem_fragmentation_ratio 的指标，它表示的是 Redis 当前的内存碎片率。 等于指标 used_memory_rss 和 used_memory 相除的结果。

mem_fragmentation_ratio = used_memory_rss/ used_memory

used_memory_rss 是操作系统实际分配给 Redis 的物理内存空间，里面就包含了碎片；而used_memory 是 Redis 为了保存数据实际申请使用的空间。

经验阈值：

mem_fragmentation_ratio 大于 1 但小于 1.5：这种情况是合理的。 因为内因的内存分配器是一定要使用的，分配策略都是通用的，不会轻易修改；而外因由 Redis 负载决定，也无法限制。所以，存在内存碎片也是正常的。
mem_fragmentation_ratio 大于 1.5：表明内存碎片率已经超过了 50%。 一般情况下，这个时候就需要采取一些措施来降低内存碎片率。

如何清理内存碎片？

内存碎片清理，简单来说，就是“搬家让位，合并空间”。

在这里插入图片描述

碎片清理是有代价的，操作系统需要把多份数据拷贝到新位置，把原有空间释放出来，这会带来时间开销。因为 Redis 是单线程，在数据拷贝时，Redis 只能等着，这就导致 Redis 无法及时处理请求，性能就会降低。而且，有的时候，数据拷贝还需要注意顺序，就像上图清理内存碎片的例子，操作系统需要先拷贝 D，并释放 D 的空间后，才能拷贝 B。这种对顺序性的要求，会进一步增加 Redis 的等待时间，导致性能降低。

Redis 自动内存碎片清理机制

Redis 专门为自动内存碎片清理机制设置了参数。可以通过设置参数，来控制碎片清理的开始和结束时机，以及占用的 CPU 比例，从而减少碎片清理对 Redis 本身请求处理的性能影响。

Redis 需要启用自动内存碎片清理，可以把 activedefrag 配置项设置为 yes，命令如下：

config set activedefrag yes

这个命令只是启用了自动清理功能，但是，具体什么时候清理，会受到下面这两个参数的控制。这两个参数设置了触发内存清理的条件，如果同时满足这两个条件，就开始清理。在清理的过程中，只要有一个条件不满足了，就停止自动清理。

active-defrag-ignore-bytes 100mb：表示内存碎片的字节数达到 100MB 时，开始清理；
active-defrag-threshold-lower 10：表示内存碎片空间占操作系统分配给 Redis 的总空间比例达到 10% 时，开始清理。

为了尽可能减少碎片清理对 Redis 正常请求处理的影响，自动内存碎片清理功能在执行时，还会监控清理操作占用的 CPU 时间，而且还设置了两个参数，分别用于控制清理操作占用的 CPU 时间比例的上、下限，既保证清理工作能正常进行，又避免了降低 Redis 性能。这两个参数具体如下：

active-defrag-cycle-min 25：表示自动清理过程所用 CPU 时间的比例不低于 25%，保证清理能正常开展；
active-defrag-cycle-max 75：表示自动清理过程所用 CPU 时间的比例不高于 75%，一旦超过，就停止清理，从而避免在清理时，大量的内存拷贝阻塞 Redis，导致响应延迟升高。

这篇关于20 | 删除数据后，为什么内存占用率还是很高？的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！