Elastic Searchable snapshot功能初探 二 (hot phase)

2023-10-17 17:10

本文主要是介绍Elastic Searchable snapshot功能初探 二 (hot phase),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

    • hot phase Searchable snapshot 演示
      • 创建索引生命周期管理策略
      • 创建索引模板和索引别名
      • 写入数据
      • 触发生命周期管理的action
    • 总结

在上一篇文章中(Elastic Searchable snapshot功能初探),我们已经做了可搜索快照的简单演示。在总结中,我们提到:

通过以上演示,我们发现,通过配合新的node_roles,我们可以快速将节点标记为冷层(cold tier),在ILM中,这个新的冷层,会自动成为cold phase搬移数据的目的节点。而通过ILM,我们可以快速的通过策略指定索引该什么时候打开可搜索快照功能,并自动帮我们完成对接快照,配置别名的动作。而可搜索快照可以在hot phase就打开,在整个数据生命周期中为我们节省成本。

即可搜索快照功能,在我们的热节点上就可以直接打开。

在本篇博客中,我们将进一步演示该功能。所有的基本配置不变,要准备一套环境可以参考上一篇文章。

hot phase Searchable snapshot 演示

创建索引生命周期管理策略

仍然,我们先通过ILM工具来创建一个Hot phase的策略,如下图:
在这里插入图片描述
这里,我们将rollover的条件改为当索引超过3MB的时候,执行滚动切分。

对应的,为了将注意力放在hot phase,我们不enable另外的warm phase和cold phase

在这里插入图片描述

创建索引模板和索引别名

因为我们使用的是rollover功能,因此,必须使用data stream或者index alias。在下面的配置中,我们将指定匹配索引的lifecycle.namelifecycle.rollover_alias:

PUT _template/searchable_snapshot_hot_demo
{"index_patterns": ["data-*"],"settings": {"index.lifecycle.name": "searchable_snapshot_demo","index.lifecycle.rollover_alias": "data_alias"}
}

可以参考rollover的官方文档,我们需要指定一个alias,并且背后的写索引,其索引名需要匹配特定的索引名pattern: ^.*-\d+$。这里的%3Cdata-%7Bnow%2Fd%7D-0001%3E<data-{now-1d}-0001>的URI编码

PUT %3Cdata-%7Bnow%2Fd%7D-0001%3E
{"aliases": {"data_alias": {"is_write_index": true}}
}

写入数据

我们仍然是使用样本数据来做这次演示。通过将kibana_sample_data_logs索引reindex到data_alias,我们将触发之前的索引生命周期管理规则

POST _reindex
{"source": {"index": "kibana_sample_data_logs"},"dest": {"index": "data_alias"}
}

当data_alias中的索引大小超过3MB的时候,将自动rollover出新的索引

触发生命周期管理的action

先看样本数据集的情况,一主一副本,14074个文档,占用20mb的存储空间:
在这里插入图片描述

如果没有启动searchable snapshot,我们看到的是,经过reindex,写入到data-*索引的数据被拆分成3个集群,每个索引都是一主一副本,总体大小在22MB左右

在这里插入图片描述
而如果打开searchable snapshot功能,可以看到,在hot phase就已经将冗余副本搬移到对象存储中,这时只剩下一个主分片,并且索引名被改为restored-*

在这里插入图片描述

在这里插入图片描述

总结

通过以上演示,我们看到,并非需要等到cold phase我们才可使用searchable snapshot,我们可以在索引数据的任意生命周期都可享受到可搜索快照带来的成本降低的优势,唯一需要考虑的是,我们如果平衡搜索性能、故障恢复时间以及存储成本之间的关系。可以预见的是,在一些低并发,对查询延时不是特别敏感的场景,比如运维日志,我们可以完全借助可搜索快照的功能来降低存储成本。

这篇关于Elastic Searchable snapshot功能初探 二 (hot phase)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/226783

相关文章

Java实现文件图片的预览和下载功能

《Java实现文件图片的预览和下载功能》这篇文章主要为大家详细介绍了如何使用Java实现文件图片的预览和下载功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... Java实现文件(图片)的预览和下载 @ApiOperation("访问文件") @GetMapping("

SpringKafka消息发布之KafkaTemplate与事务支持功能

《SpringKafka消息发布之KafkaTemplate与事务支持功能》通过本文介绍的基本用法、序列化选项、事务支持、错误处理和性能优化技术,开发者可以构建高效可靠的Kafka消息发布系统,事务支... 目录引言一、KafkaTemplate基础二、消息序列化三、事务支持机制四、错误处理与重试五、性能优

SpringIntegration消息路由之Router的条件路由与过滤功能

《SpringIntegration消息路由之Router的条件路由与过滤功能》本文详细介绍了Router的基础概念、条件路由实现、基于消息头的路由、动态路由与路由表、消息过滤与选择性路由以及错误处理... 目录引言一、Router基础概念二、条件路由实现三、基于消息头的路由四、动态路由与路由表五、消息过滤

Spring Boot 3.4.3 基于 Spring WebFlux 实现 SSE 功能(代码示例)

《SpringBoot3.4.3基于SpringWebFlux实现SSE功能(代码示例)》SpringBoot3.4.3结合SpringWebFlux实现SSE功能,为实时数据推送提供... 目录1. SSE 简介1.1 什么是 SSE?1.2 SSE 的优点1.3 适用场景2. Spring WebFlu

基于SpringBoot实现文件秒传功能

《基于SpringBoot实现文件秒传功能》在开发Web应用时,文件上传是一个常见需求,然而,当用户需要上传大文件或相同文件多次时,会造成带宽浪费和服务器存储冗余,此时可以使用文件秒传技术通过识别重复... 目录前言文件秒传原理代码实现1. 创建项目基础结构2. 创建上传存储代码3. 创建Result类4.

Python+PyQt5实现多屏幕协同播放功能

《Python+PyQt5实现多屏幕协同播放功能》在现代会议展示、数字广告、展览展示等场景中,多屏幕协同播放已成为刚需,下面我们就来看看如何利用Python和PyQt5开发一套功能强大的跨屏播控系统吧... 目录一、项目概述:突破传统播放限制二、核心技术解析2.1 多屏管理机制2.2 播放引擎设计2.3 专

一文详解SpringBoot响应压缩功能的配置与优化

《一文详解SpringBoot响应压缩功能的配置与优化》SpringBoot的响应压缩功能基于智能协商机制,需同时满足很多条件,本文主要为大家详细介绍了SpringBoot响应压缩功能的配置与优化,需... 目录一、核心工作机制1.1 自动协商触发条件1.2 压缩处理流程二、配置方案详解2.1 基础YAML

使用PyTorch实现手写数字识别功能

《使用PyTorch实现手写数字识别功能》在人工智能的世界里,计算机视觉是最具魅力的领域之一,通过PyTorch这一强大的深度学习框架,我们将在经典的MNIST数据集上,见证一个神经网络从零开始学会识... 目录当计算机学会“看”数字搭建开发环境MNIST数据集解析1. 认识手写数字数据库2. 数据预处理的

Python实战之屏幕录制功能的实现

《Python实战之屏幕录制功能的实现》屏幕录制,即屏幕捕获,是指将计算机屏幕上的活动记录下来,生成视频文件,本文主要为大家介绍了如何使用Python实现这一功能,希望对大家有所帮助... 目录屏幕录制原理图像捕获音频捕获编码压缩输出保存完整的屏幕录制工具高级功能实时预览增加水印多平台支持屏幕录制原理屏幕

Python实现自动化表单填写功能

《Python实现自动化表单填写功能》在Python中,自动化表单填写可以通过多种库和工具实现,本文将详细介绍常用的自动化表单处理工具,并对它们进行横向比较,可根据需求选择合适的工具,感兴趣的小伙伴跟... 目录1. Selenium简介适用场景示例代码优点缺点2. Playwright简介适用场景示例代码