Elastic Observability 8.11:ES|QL、APM 中的通用分析和增强的 SLOs

2023-11-10 20:45

本文主要是介绍Elastic Observability 8.11:ES|QL、APM 中的通用分析和增强的 SLOs,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

作者:Tom Grabowski, Katrin Freihofner, Israel Ogbole

Elastic Observability 8.11 引入了 ES|QL for Observability(技术预览版)、Universal ProfilingTM 和 Elastic APM 集成,以及针对 Elastic Observability 的新 SLO (Service Level Objective)增强功能:

  • ES|QL for Elastic Observability:Elasticsearch 查询语言 (ES|QL) 现在处于技术预览版,它可以转换、丰富和简化数据调查。 了解 ES|QL 如何与 Elastic AI Assistant 集成、轻松创建警报以及通过单个查询创建上下文洞察。
  • 使用 Elastic APM 进行通用分析:将应用程序性能问题与 APM 中的底层系统功能相关联,而无需切换上下文。 这有助于 SRE 提高可见性并缩短解决问题的时间。
  • SLO 技术预览版中添加的新功能增强了操作体验,其中包括添加仪表板作为面板、新的错误率图表、按 APM 指标进行分区的功能等等。

Elastic Observability 8.11 现已在 Elastic Cloud 上推出,这是唯一包含最新版本中所有新功能的托管 Elasticsearch® 产品。 你还可以下载 Elastic Stack 和我们的云编排产品 Elastic Cloud Enterprise 和 Elastic Cloud for Kubernetes,以获得自我管理的体验。

Elastic 8.11 中还有哪些新功能? 查看8.11公告帖子了解更多>>

ES|QL 用于可观察性

AI助手 ES|QL 增强

Elastic AI Assistant for Observability 现在包含 ES|QL 功能,允许用户使用自然语言来解释查询,并让 AI 助手提供 ES|QL 查询语法,解释查询的作用,并提供提示运行请求的查询。

ES|QL 可观测性警报

新的 ES|QL 警报规则类型已无缝集成到 Elasticsearch 规则中,现在可在 Observability 中使用。 此规则类型通过强大的 ES|QL 语言提供新的高级功能,支持复杂的警报场景和用例。 此外,用户还可以在最终确定和保存规则之前预览和分析 ES|QL 查询的结果。 如果查询返回空结果,则不会生成任何警报。

在下面的示例中,我们使用 ES|QL 查询来查找原始、未解析的 Nginx 日志中的域。 我们对错误率高于 10% 的领域感兴趣。 此查询帮助我们识别有问题的域。 我们将此查询合并到我们的 ES|QL 警报规则中,以便在发生此类问题时通知我们。

ES|QL 查询:

from high-cardinality-data-fake_stack.nginx_proxy-* | grok message "%{DATA:log_date} %{IP:client_ip} - %{DATA:user} admin-console.%{DATA:domain} to: %{DATA:host.name}:%{DATA:http_port}: \"%{DATA:request_method} %{DATA:request_path} %{DATA:http_version}\" %{NUMBER:status_code} %{NUMBER:bytes} \"%{DATA:url}\" \"%{GREEDYDATA:user_agent}\"" | eval good = to_double(to_long(status_code) < 500), bad = to_double(to_long(status_code) >= 500) | stats total_bad = sum(bad), total_good = sum(good) by domain| eval error_rate = (total_bad / (total_bad + total_good)) | WHERE error_rate > 0.1 | drop total_bad, total_good

更好地结合在一起:通用分析 (Universal Profiling) 和 APM 集成

我们很高兴地宣布,我们增加了用户快速将应用程序性能问题与底层系统功能关联起来的功能,而无需将上下文从 APM 切换到通用分析。

这种集成提供了许多好处,包括:

  • 缩短解决时间:DevOps 和 SRE 现在可以排除故障并查明生产代码中的性能和错误,具体到代码的特定部分以及需要修改和/或升级的第三方库等。 这一切都在 APM 服务视图中完成,无需切换上下文。
  • 改进的可见性:通用分析为主机上运行的所有应用程序的运行时行为提供了前所未有的代码可见性。 它分析运行你的服务的主机上的每一行代码,不仅包括你的应用程序代码,还包括内核和第三方库。 这可以帮助你识别同一主机上可能影响特定服务性能的次优库和其他进程或服务。

observability-8-11-opbeans-java

假设你正在主机上运行容器化 Java 服务。 使用 APM,你会注意到 Java 服务的性能随着时间的推移而下降。 在 APM 服务页面中,通用分析用于识别消耗最多 CPU 时间的特定函数调用。 你发现花费最多时间的函数之一是调用用于连接到 Redis 的库。

你进一步调查发现该库很旧,并且没有使用最有效的方式连接到 Redis。 你对库进行了必要的更改,Java 服务的性能就会显着提高。

除了识别次优库之外,通用分析还可用于检测同一主机上可能影响特定服务性能的其他进程或服务。 例如,你可能有一个与相关服务无关的进程,该进程正在使用大量 CPU 资源,这可能会对你的服务产生连锁反应。

通过将通用分析与 APM 集成,DevOps 和 SRE 可以更深入地了解其代码的运行时行为,并更快、更高效地识别性能瓶颈并进行故障排除。

针对 SLOs 的新增强功能

版本 8.11 中包含服务级别目标 (Service Level Objective - SLO) 的多项增强功能和性能改进。 SLO 摘要计算的性能已得到改进,增强功能允许更快地计算通过跨集群搜索查询的数据。

用户现在可以将 SLO 概述添加到仪表板,这将允许他们查看 SLO 状态以及其他相关的可视化效果。

SLO 详细信息现在包括一个带有消耗率指示器的新错误率图表,可帮助用户可视化 SLO 的近期历史记录及其变化速度。

在 8.11 中,APM 延迟和错误率的 SLI 包括跨指标类型进行分组以及对组中每个单独指标进行分区的能力。

试试看

请在发行说明中了解这些功能以及更多信息。

现有 Elastic Cloud 客户可以直接从 Elastic Cloud 控制台访问其中许多功能。 没有利用云上的 Elastic? 开始免费试用。

本文中描述的任何特性或功能的发布和时间安排均由 Elastic 自行决定。 当前不可用的任何特性或功能可能无法按时交付或根本无法交付。

原文:Elastic Observability 8.11: ES|QL, Universal profiling in APM, and enhanced SLOs | Elastic Blog

这篇关于Elastic Observability 8.11:ES|QL、APM 中的通用分析和增强的 SLOs的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/385149

相关文章

Redis主从/哨兵机制原理分析

《Redis主从/哨兵机制原理分析》本文介绍了Redis的主从复制和哨兵机制,主从复制实现了数据的热备份和负载均衡,而哨兵机制可以监控Redis集群,实现自动故障转移,哨兵机制通过监控、下线、选举和故... 目录一、主从复制1.1 什么是主从复制1.2 主从复制的作用1.3 主从复制原理1.3.1 全量复制

Redis主从复制的原理分析

《Redis主从复制的原理分析》Redis主从复制通过将数据镜像到多个从节点,实现高可用性和扩展性,主从复制包括初次全量同步和增量同步两个阶段,为优化复制性能,可以采用AOF持久化、调整复制超时时间、... 目录Redis主从复制的原理主从复制概述配置主从复制数据同步过程复制一致性与延迟故障转移机制监控与维

Redis连接失败:客户端IP不在白名单中的问题分析与解决方案

《Redis连接失败:客户端IP不在白名单中的问题分析与解决方案》在现代分布式系统中,Redis作为一种高性能的内存数据库,被广泛应用于缓存、消息队列、会话存储等场景,然而,在实际使用过程中,我们可能... 目录一、问题背景二、错误分析1. 错误信息解读2. 根本原因三、解决方案1. 将客户端IP添加到Re

Redis主从复制实现原理分析

《Redis主从复制实现原理分析》Redis主从复制通过Sync和CommandPropagate阶段实现数据同步,2.8版本后引入Psync指令,根据复制偏移量进行全量或部分同步,优化了数据传输效率... 目录Redis主DodMIK从复制实现原理实现原理Psync: 2.8版本后总结Redis主从复制实

锐捷和腾达哪个好? 两个品牌路由器对比分析

《锐捷和腾达哪个好?两个品牌路由器对比分析》在选择路由器时,Tenda和锐捷都是备受关注的品牌,各自有独特的产品特点和市场定位,选择哪个品牌的路由器更合适,实际上取决于你的具体需求和使用场景,我们从... 在选购路由器时,锐捷和腾达都是市场上备受关注的品牌,但它们的定位和特点却有所不同。锐捷更偏向企业级和专

Spring中Bean有关NullPointerException异常的原因分析

《Spring中Bean有关NullPointerException异常的原因分析》在Spring中使用@Autowired注解注入的bean不能在静态上下文中访问,否则会导致NullPointerE... 目录Spring中Bean有关NullPointerException异常的原因问题描述解决方案总结

python中的与时间相关的模块应用场景分析

《python中的与时间相关的模块应用场景分析》本文介绍了Python中与时间相关的几个重要模块:`time`、`datetime`、`calendar`、`timeit`、`pytz`和`dateu... 目录1. time 模块2. datetime 模块3. calendar 模块4. timeit

python-nmap实现python利用nmap进行扫描分析

《python-nmap实现python利用nmap进行扫描分析》Nmap是一个非常用的网络/端口扫描工具,如果想将nmap集成进你的工具里,可以使用python-nmap这个python库,它提供了... 目录前言python-nmap的基本使用PortScanner扫描PortScannerAsync异

Oracle数据库执行计划的查看与分析技巧

《Oracle数据库执行计划的查看与分析技巧》在Oracle数据库中,执行计划能够帮助我们深入了解SQL语句在数据库内部的执行细节,进而优化查询性能、提升系统效率,执行计划是Oracle数据库优化器为... 目录一、什么是执行计划二、查看执行计划的方法(一)使用 EXPLAIN PLAN 命令(二)通过 S

详解Python中通用工具类与异常处理

《详解Python中通用工具类与异常处理》在Python开发中,编写可重用的工具类和通用的异常处理机制是提高代码质量和开发效率的关键,本文将介绍如何将特定的异常类改写为更通用的ValidationEx... 目录1. 通用异常类:ValidationException2. 通用工具类:Utils3. 示例文