Redis KEYS查询大批量数据替代方案

2025-01-01 03:50

本文主要是介绍Redis KEYS查询大批量数据替代方案,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《RedisKEYS查询大批量数据替代方案》在使用Redis时,KEYS命令虽然简单直接,但其全表扫描的特性在处理大规模数据时会导致性能问题,甚至可能阻塞Redis服务,本文将介绍SCAN命令、有序...

前言

在使用 Redis 时,KEYS 命令虽然简单直接,但其全表扫描的特性在处理大规模数据时会导致性能问题,甚至可能阻塞 Redis 服务。本文将介绍SCAN命令、有序集合、哈希表和RediSearch模块四种替代 KEYS 的高效方案,以应对大批量数据的查询和管理。根据本人实际使用情况,查询Redis大批量数据的情况下推荐使用SCAN命令较好。

KEYS命令问题背景

KEYS 命令会遍历整个键空间,对于包含大量键的 Redis 实例,这可能导致以下问题:
高延迟:执行时间较长,影响其他命令的响应速度。
阻塞 Redis:在单线程模型下,KEYS 会阻塞 Redis 服务器,导致其他操作无法及时处理。
内存消耗:返回所有匹配的键可能会占用大量内存。
因此,在生产环境中应尽量避免使用 KEYS 命令。

替代方案

1.使用 SCAN 命令

理论介绍

SCAN 是一个增量迭代器,可以分批逐步遍历键空间,避免一次性加载所有键。它支持游标(cursor)机制,允许用户通过多次调用来完成完整的遍历。

优点

非阻塞:不会阻塞 Redis 服务器,适合在线环境。
低资源消耗:每次只返回少量键,减少内存压力。

缺点

结果集不固定:SCAN 的结果集不是固定的,可能会有重复或遗漏的键,特别是在键频繁变化的情况下。
额外参数:需要合理设置 COUNT 参数以平衡遍历速度和资源消耗。

示例代码

/**
 * scan命令测试
 * @author senfel
 * @date 2024/12/26 11:34
 * @return void
 */
@Test
public void scan() {
    try (Jedis jedis = new Jedis("localhost", 6379)) {
        String cursor = "0";
        ScanParams scanParams = new ScanParams().match("sys_dict:*").count(100);
        do {
            ScanResult<String> scanResult = jedis.scan(cursor, scanParams);
            for (String key : scanResult.getResult()) {
                System.out.println("Found key: " + key);
            }
       python     cursor = scanResult.getCursor();
        } while (!cursor.equals("0"));
    }
}

2. 使用有序集合(Sorted Set)

理论介绍

如果需要对键进行排序或范围查询,可以考虑将键存储在有序集合中,并为每个键分配一个唯一的分数(score)。这样可以通过 ZRANGE 或 ZREVRANGE 等命令高效地获取指定范围内的键。

优点

高效查询:支持快速的范围查询和排序。
灵活性:可以根据业务需求调整分数规则。

缺点

额外开销:需要维护有序集合,增加了写入操作的复杂度。

示例代码

/**
 * sortSet
 * @author senfel
 * @date 2024/12/26 11:51
 * @return void
 */
@Test
public void sortSet() {
    try (Jedis jedis = new Jedis("localhost", 6379)) {
        // 添加键到有序集合
        for (int i = 0; i < 100; i++) {
            jedis.zadd("sorted_keys", System.currentTimeMillis(), "senfel"+i);
        }
        // 获取前 10 个键
        Set<String> keys = jedis.zrange("sorted_keys", 0, 9);
        for (String key : keys) {
            System.out.println("Key from sorted set: " + key);
        }
    }
}

3. 使用哈希(Hash)

理论介绍

如果键具有相似的结构或属于同一类目,可以将它们存储在一个哈希表中,每个字段代表一个键。这样可以通过 HGETALL 或 HSCAN 来批量获取相关键。

优点

集中管理:便于批量操作和维护。
高效访问:哈希表提供了 O(1) 的查找性能。

缺点

适用范围有限:适用于键具有相同前缀或分类的情况。

示例代码

/**
 * useHash
 * @author senfel
 * @date 2024/12/26 11:55
 * @return void
 */
@Test
public void useHash() {
    try (Jedis jedis = new Jedis("localhost", 6379)) {
        for (int i = 0; i < 100; i++) {
            // 添加键到哈希表
            jedis.hset("user_data", "name"+i, "senfel"+i);
        }
        // 获取所有键值对
        Map<String, String> userData = jedis.hgetAll("user_data");
        for (Map.Entry<String, String> entry : userData.entrySet()) {
            System.out.println("User data: " + entry.getKey() + " -> " + entry.getValue());
        }
    }
}

4. 使用 Redis 模块(如 RediSearch)

理论介绍

Redis 模块扩展了 Redis 的功能,其中 RediSearch 提供了全文搜索和索引功能,能够高效地管理和查询大量数据。它支持复杂的查询语法和过滤条件。

RediSearch安装推荐使用docker

docker run --name redisearch -p 16379:6379 -v redis-data:/data redis/redis-stack-server:latest

优点

强大查询能力:支持全文搜索、模糊匹配等高级查询。
高性能:优化的索引结构保证了高效的查询性能。

缺点

依赖外部模块:需要安装和配置 Redis 模块。
学习成本:API 和配置相对复杂,需要一定的时间熟悉。

maven依赖

<dependency>
    <groupId>com.redislabs<IGOky/groupId>
    <artifactId>jredisearch</artifactId>
    <version>2.0.0</version>
</dependency>

示例代码

/**
 * useRediSearch 未安装RediSearch未测试
 * @author senfel
 * @date 2024/12/26 12:26 
 * @return void
 */
@Test
public void useRediSearch() {
    Client client = Client.create("localhost", 6379).connect();
    // 创建索引并添加文档
    client.ftCreate("idx", Schema.newBuilder()
            .addField(new TexChina编程tField("title"))
            .addField(new TextField("content"))
            .build());
    client.ftAdd("idx", "doc1", 1.0, Document.newDocument()
            .addField("title", "Redis Search")
            .addField("content", "Learn how to use Redis Search"));
    // 查询文档
    SearchResult result = client.ftSearch("idx", new Query("Redis"));
    for (Document doc : result.documents()) {
        System.out.println("Found document: " + doc.getId());
    }
    client.close();
}

总结

综上所述,Redis 大批量数据解决方案目前有SCAN命令、有序集合、哈希表、RediSearch扩展模块。一般对于Redis 大批量键遍历可以使用非阻塞低资源消耗的SCAN 命令,对于需要排序或范围查询的场景则使用有序集合,python对于键具有相同前缀或分类的情况可以使用哈希表,如果需要全文搜索或复杂查询则可以使用高性能强大查询能力的RediSearch。

以上就是Redis KEYS查询大批量数据替代方案的详细内容,更多关于Redis KEYS数据替代方案的资料请关注php编程China编程(www.chinasem.cn)其它相关文章!

这篇关于Redis KEYS查询大批量数据替代方案的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1152879

相关文章

Java中注解与元数据示例详解

《Java中注解与元数据示例详解》Java注解和元数据是编程中重要的概念,用于描述程序元素的属性和用途,:本文主要介绍Java中注解与元数据的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参... 目录一、引言二、元数据的概念2.1 定义2.2 作用三、Java 注解的基础3.1 注解的定义3.2 内

将sqlserver数据迁移到mysql的详细步骤记录

《将sqlserver数据迁移到mysql的详细步骤记录》:本文主要介绍将SQLServer数据迁移到MySQL的步骤,包括导出数据、转换数据格式和导入数据,通过示例和工具说明,帮助大家顺利完成... 目录前言一、导出SQL Server 数据二、转换数据格式为mysql兼容格式三、导入数据到MySQL数据

Redis的Zset类型及相关命令详细讲解

《Redis的Zset类型及相关命令详细讲解》:本文主要介绍Redis的Zset类型及相关命令的相关资料,有序集合Zset是一种Redis数据结构,它类似于集合Set,但每个元素都有一个关联的分数... 目录Zset简介ZADDZCARDZCOUNTZRANGEZREVRANGEZRANGEBYSCOREZ

C++中使用vector存储并遍历数据的基本步骤

《C++中使用vector存储并遍历数据的基本步骤》C++标准模板库(STL)提供了多种容器类型,包括顺序容器、关联容器、无序关联容器和容器适配器,每种容器都有其特定的用途和特性,:本文主要介绍C... 目录(1)容器及简要描述‌php顺序容器‌‌关联容器‌‌无序关联容器‌(基于哈希表):‌容器适配器‌:(

C#提取PDF表单数据的实现流程

《C#提取PDF表单数据的实现流程》PDF表单是一种常见的数据收集工具,广泛应用于调查问卷、业务合同等场景,凭借出色的跨平台兼容性和标准化特点,PDF表单在各行各业中得到了广泛应用,本文将探讨如何使用... 目录引言使用工具C# 提取多个PDF表单域的数据C# 提取特定PDF表单域的数据引言PDF表单是一

MySQL分表自动化创建的实现方案

《MySQL分表自动化创建的实现方案》在数据库应用场景中,随着数据量的不断增长,单表存储数据可能会面临性能瓶颈,例如查询、插入、更新等操作的效率会逐渐降低,分表是一种有效的优化策略,它将数据分散存储在... 目录一、项目目的二、实现过程(一)mysql 事件调度器结合存储过程方式1. 开启事件调度器2. 创

一文详解Python中数据清洗与处理的常用方法

《一文详解Python中数据清洗与处理的常用方法》在数据处理与分析过程中,缺失值、重复值、异常值等问题是常见的挑战,本文总结了多种数据清洗与处理方法,文中的示例代码简洁易懂,有需要的小伙伴可以参考下... 目录缺失值处理重复值处理异常值处理数据类型转换文本清洗数据分组统计数据分箱数据标准化在数据处理与分析过

大数据小内存排序问题如何巧妙解决

《大数据小内存排序问题如何巧妙解决》文章介绍了大数据小内存排序的三种方法:数据库排序、分治法和位图法,数据库排序简单但速度慢,对设备要求高;分治法高效但实现复杂;位图法可读性差,但存储空间受限... 目录三种方法:方法概要数据库排序(http://www.chinasem.cn对数据库设备要求较高)分治法(常

Redis多种内存淘汰策略及配置技巧分享

《Redis多种内存淘汰策略及配置技巧分享》本文介绍了Redis内存满时的淘汰机制,包括内存淘汰机制的概念,Redis提供的8种淘汰策略(如noeviction、volatile-lru等)及其适用场... 目录前言一、什么是 Redis 的内存淘汰机制?二、Redis 内存淘汰策略1. pythonnoe

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI