Elastic Observability 8.11:ES|QL、APM 中的通用分析和增强的 SLOs

2023-11-10 20:45

本文主要是介绍Elastic Observability 8.11:ES|QL、APM 中的通用分析和增强的 SLOs,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

作者:Tom Grabowski, Katrin Freihofner, Israel Ogbole

Elastic Observability 8.11 引入了 ES|QL for Observability(技术预览版)、Universal ProfilingTM 和 Elastic APM 集成,以及针对 Elastic Observability 的新 SLO (Service Level Objective)增强功能:

  • ES|QL for Elastic Observability:Elasticsearch 查询语言 (ES|QL) 现在处于技术预览版,它可以转换、丰富和简化数据调查。 了解 ES|QL 如何与 Elastic AI Assistant 集成、轻松创建警报以及通过单个查询创建上下文洞察。
  • 使用 Elastic APM 进行通用分析:将应用程序性能问题与 APM 中的底层系统功能相关联,而无需切换上下文。 这有助于 SRE 提高可见性并缩短解决问题的时间。
  • SLO 技术预览版中添加的新功能增强了操作体验,其中包括添加仪表板作为面板、新的错误率图表、按 APM 指标进行分区的功能等等。

Elastic Observability 8.11 现已在 Elastic Cloud 上推出,这是唯一包含最新版本中所有新功能的托管 Elasticsearch® 产品。 你还可以下载 Elastic Stack 和我们的云编排产品 Elastic Cloud Enterprise 和 Elastic Cloud for Kubernetes,以获得自我管理的体验。

Elastic 8.11 中还有哪些新功能? 查看8.11公告帖子了解更多>>

ES|QL 用于可观察性

AI助手 ES|QL 增强

Elastic AI Assistant for Observability 现在包含 ES|QL 功能,允许用户使用自然语言来解释查询,并让 AI 助手提供 ES|QL 查询语法,解释查询的作用,并提供提示运行请求的查询。

ES|QL 可观测性警报

新的 ES|QL 警报规则类型已无缝集成到 Elasticsearch 规则中,现在可在 Observability 中使用。 此规则类型通过强大的 ES|QL 语言提供新的高级功能,支持复杂的警报场景和用例。 此外,用户还可以在最终确定和保存规则之前预览和分析 ES|QL 查询的结果。 如果查询返回空结果,则不会生成任何警报。

在下面的示例中,我们使用 ES|QL 查询来查找原始、未解析的 Nginx 日志中的域。 我们对错误率高于 10% 的领域感兴趣。 此查询帮助我们识别有问题的域。 我们将此查询合并到我们的 ES|QL 警报规则中,以便在发生此类问题时通知我们。

ES|QL 查询:

from high-cardinality-data-fake_stack.nginx_proxy-* | grok message "%{DATA:log_date} %{IP:client_ip} - %{DATA:user} admin-console.%{DATA:domain} to: %{DATA:host.name}:%{DATA:http_port}: \"%{DATA:request_method} %{DATA:request_path} %{DATA:http_version}\" %{NUMBER:status_code} %{NUMBER:bytes} \"%{DATA:url}\" \"%{GREEDYDATA:user_agent}\"" | eval good = to_double(to_long(status_code) < 500), bad = to_double(to_long(status_code) >= 500) | stats total_bad = sum(bad), total_good = sum(good) by domain| eval error_rate = (total_bad / (total_bad + total_good)) | WHERE error_rate > 0.1 | drop total_bad, total_good

更好地结合在一起:通用分析 (Universal Profiling) 和 APM 集成

我们很高兴地宣布,我们增加了用户快速将应用程序性能问题与底层系统功能关联起来的功能,而无需将上下文从 APM 切换到通用分析。

这种集成提供了许多好处,包括:

  • 缩短解决时间:DevOps 和 SRE 现在可以排除故障并查明生产代码中的性能和错误,具体到代码的特定部分以及需要修改和/或升级的第三方库等。 这一切都在 APM 服务视图中完成,无需切换上下文。
  • 改进的可见性:通用分析为主机上运行的所有应用程序的运行时行为提供了前所未有的代码可见性。 它分析运行你的服务的主机上的每一行代码,不仅包括你的应用程序代码,还包括内核和第三方库。 这可以帮助你识别同一主机上可能影响特定服务性能的次优库和其他进程或服务。

observability-8-11-opbeans-java

假设你正在主机上运行容器化 Java 服务。 使用 APM,你会注意到 Java 服务的性能随着时间的推移而下降。 在 APM 服务页面中,通用分析用于识别消耗最多 CPU 时间的特定函数调用。 你发现花费最多时间的函数之一是调用用于连接到 Redis 的库。

你进一步调查发现该库很旧,并且没有使用最有效的方式连接到 Redis。 你对库进行了必要的更改,Java 服务的性能就会显着提高。

除了识别次优库之外,通用分析还可用于检测同一主机上可能影响特定服务性能的其他进程或服务。 例如,你可能有一个与相关服务无关的进程,该进程正在使用大量 CPU 资源,这可能会对你的服务产生连锁反应。

通过将通用分析与 APM 集成,DevOps 和 SRE 可以更深入地了解其代码的运行时行为,并更快、更高效地识别性能瓶颈并进行故障排除。

针对 SLOs 的新增强功能

版本 8.11 中包含服务级别目标 (Service Level Objective - SLO) 的多项增强功能和性能改进。 SLO 摘要计算的性能已得到改进,增强功能允许更快地计算通过跨集群搜索查询的数据。

用户现在可以将 SLO 概述添加到仪表板,这将允许他们查看 SLO 状态以及其他相关的可视化效果。

SLO 详细信息现在包括一个带有消耗率指示器的新错误率图表,可帮助用户可视化 SLO 的近期历史记录及其变化速度。

在 8.11 中,APM 延迟和错误率的 SLI 包括跨指标类型进行分组以及对组中每个单独指标进行分区的能力。

试试看

请在发行说明中了解这些功能以及更多信息。

现有 Elastic Cloud 客户可以直接从 Elastic Cloud 控制台访问其中许多功能。 没有利用云上的 Elastic? 开始免费试用。

本文中描述的任何特性或功能的发布和时间安排均由 Elastic 自行决定。 当前不可用的任何特性或功能可能无法按时交付或根本无法交付。

原文:Elastic Observability 8.11: ES|QL, Universal profiling in APM, and enhanced SLOs | Elastic Blog

这篇关于Elastic Observability 8.11:ES|QL、APM 中的通用分析和增强的 SLOs的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/385149

相关文章

kotlin中const 和val的区别及使用场景分析

《kotlin中const和val的区别及使用场景分析》在Kotlin中,const和val都是用来声明常量的,但它们的使用场景和功能有所不同,下面给大家介绍kotlin中const和val的区别,... 目录kotlin中const 和val的区别1. val:2. const:二 代码示例1 Java

Go标准库常见错误分析和解决办法

《Go标准库常见错误分析和解决办法》Go语言的标准库为开发者提供了丰富且高效的工具,涵盖了从网络编程到文件操作等各个方面,然而,标准库虽好,使用不当却可能适得其反,正所谓工欲善其事,必先利其器,本文将... 目录1. 使用了错误的time.Duration2. time.After导致的内存泄漏3. jsO

Spring事务中@Transactional注解不生效的原因分析与解决

《Spring事务中@Transactional注解不生效的原因分析与解决》在Spring框架中,@Transactional注解是管理数据库事务的核心方式,本文将深入分析事务自调用的底层原理,解释为... 目录1. 引言2. 事务自调用问题重现2.1 示例代码2.2 问题现象3. 为什么事务自调用会失效3

使用Java实现通用树形结构构建工具类

《使用Java实现通用树形结构构建工具类》这篇文章主要为大家详细介绍了如何使用Java实现通用树形结构构建工具类,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录完整代码一、设计思想与核心功能二、核心实现原理1. 数据结构准备阶段2. 循环依赖检测算法3. 树形结构构建4. 搜索子

找不到Anaconda prompt终端的原因分析及解决方案

《找不到Anacondaprompt终端的原因分析及解决方案》因为anaconda还没有初始化,在安装anaconda的过程中,有一行是否要添加anaconda到菜单目录中,由于没有勾选,导致没有菜... 目录问题原因问http://www.chinasem.cn题解决安装了 Anaconda 却找不到 An

Spring定时任务只执行一次的原因分析与解决方案

《Spring定时任务只执行一次的原因分析与解决方案》在使用Spring的@Scheduled定时任务时,你是否遇到过任务只执行一次,后续不再触发的情况?这种情况可能由多种原因导致,如未启用调度、线程... 目录1. 问题背景2. Spring定时任务的基本用法3. 为什么定时任务只执行一次?3.1 未启用

C++ 各种map特点对比分析

《C++各种map特点对比分析》文章比较了C++中不同类型的map(如std::map,std::unordered_map,std::multimap,std::unordered_multima... 目录特点比较C++ 示例代码 ​​​​​​代码解释特点比较1. std::map底层实现:基于红黑

Spring、Spring Boot、Spring Cloud 的区别与联系分析

《Spring、SpringBoot、SpringCloud的区别与联系分析》Spring、SpringBoot和SpringCloud是Java开发中常用的框架,分别针对企业级应用开发、快速开... 目录1. Spring 框架2. Spring Boot3. Spring Cloud总结1. Sprin

Spring 中 BeanFactoryPostProcessor 的作用和示例源码分析

《Spring中BeanFactoryPostProcessor的作用和示例源码分析》Spring的BeanFactoryPostProcessor是容器初始化的扩展接口,允许在Bean实例化前... 目录一、概览1. 核心定位2. 核心功能详解3. 关键特性二、Spring 内置的 BeanFactory

MyBatis-Plus中Service接口的lambdaUpdate用法及实例分析

《MyBatis-Plus中Service接口的lambdaUpdate用法及实例分析》本文将详细讲解MyBatis-Plus中的lambdaUpdate用法,并提供丰富的案例来帮助读者更好地理解和应... 目录深入探索MyBATis-Plus中Service接口的lambdaUpdate用法及示例案例背景