云原生时代的监控明星 – 夜莺

2024-08-27 03:36

本文主要是介绍云原生时代的监控明星 – 夜莺,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

云原生时代的监控明星 – 夜莺

如果想要更多原创干货,欢迎关注wx: 云原生知识栈

引言

在云原生时代,随着业务的不断扩展和技术栈的日益复杂,对于监控系统的需求也日益增长。传统的监控方案往往难以满足现代企业的高可用、高性能要求。而夜莺监控(Nightingale),作为一款先进的开源云原生监控分析系统,以其All-In-One的设计理念,为企业带来了全新的解决方案。今天,我们就来一起探索夜莺监控的魅力所在。他到底为我解决了哪些问题?

夜莺监控简介

夜莺监控是一款由国内团队开发的开源云原生监控系统,它采用了All-In-One的设计模式,集数据采集、可视化、监控告警、数据分析于一体,与云原生生态紧密集成,为用户提供了一站式的监控解决方案。无论是在私有云、公有云还是混合云环境中,夜莺都能提供开箱即用的企业级监控分析和告警能力。

帮我解决了哪些问题?

1. 实现统一告警管理

夜莺天生支持多种时序库的对接,如:Prometheus、VictoriaMetrics、Thanos、Mimir、M3DB、TDengine 等多种时序库,

在我的场景中,存在大量混部,私有云的Prometheus集群,这让我的监控告警带来一定的挑战。使用夜莺让我释放了双手。提高了效率,

具体感受如下:

  • 不在需要管理Prometheus里面的Rules
  • 不在需要维护Prometheus系的Alertmanager
  • 不在需要维护那么多集群的告警渠道及组件
  • 不在需要为每一个用户配置不一样的告警规则
  • 有了分组分级告警能力
  • 有了统一的监控告警Oncall能力
  • 中心化接管全集群Prometheus服务管理
  • 告警聚合,清晰知道哪个Prometheus集群再哇哇叫
2. 统一日志查看聚合能力

想必大佬们也有类似的场景,各集群有一套自己的日志系统,如ELK,Loki等,分别接入各项目用户使用,那么每套日志系统切换着看,是不是很麻烦?
So,他来了!!!

开源版本目前支持接入 Prometheus Like(Prometheus、VictoriaMetrics、Thanos、M3 等兼容 Prometheus 查询接口的数据源)、ElasticSearch、Loki、TDEngine 等数据源类型,但是这只是我目前接入较少的一部分。

针对这部分功能给我的感jio

  • 下回再问我要日志系统链接–> 出门左拐
3. 告警管理订阅能力

如果你有100+Prometheus 集群,有100+用户关注告警信息,兄台如何应对?


上夜莺:

内置支持多种告警规则,可以扩展支持常见通知媒介,支持告警屏蔽/抑制/聚合/自愈、告警事件管理。

  • 我给你写好规则,你爱咋收咋收 => 告警订阅
  • 我不会写PromQL,我给你大量内置,还手摸手教你OK?=> 新手模式
  • 我不想写PromQL,想点一下就能看,OK,OK,=> 指标视图
  • 告警太多了,烦死人了,点一下自动屏蔽,或者控制一下通知间隔很累吗? => 告警屏蔽
4. 统一登录

要是你维护的系统,固定一个秘密。来一个人问你一下密码,你能受得了么?

夜莺支持了 OAuth、LDAP、CAS、OIDC 这四种单点登录服务的对接,想要对接某个单点登录服务,直接在页面上配置即可

产品架构:

核心功能亮点

1. 数据采集与整合
  • 广泛的数据源支持:夜莺监控支持多种数据源接入,包括Prometheus、VictoriaMetrics等多种时序数据库,以及日志文件、网络流量等。
2. 可视化与分析
  • 灵活的仪表盘定制:用户可以根据自身需求,自定义创建多样化的仪表板,实现对监控数据的实时展示。
  • 强大的数据分析工具:内置丰富的数据分析功能,支持SQL查询、数据挖掘等功能,帮助用户深入理解业务趋势。
3. 监控告警
  • 智能告警机制:支持基于阈值、异常检测等多种告警规则,可根据不同场景设置告警策略。
  • 多渠道通知:支持邮件、短信、企业微信等多种通知方式,确保问题及时被发现并处理。
  • 运维OnCall灵活机制: 无缝搭配 Flashduty:实现告警聚合收敛、认领、升级、排班、IM集成,确保告警处理不遗漏,减少打扰,高效协同。
4. 权限管理与便捷性
  • 细粒度的权限控制:提供用户管理和权限分配功能,确保每个用户只能访问被授权的数据。
  • 统一登录对接:统一的 SSO 认证、鉴权、用户、团队、业务组管理体系,提供了一个平台底座

最近的新功能

夜莺监控团队持续更新和完善产品,最近推出的版本中新增了一些实用的功能,例如:

  • 全站暗黑主题
  • 新增指标视图,内置上百个 promql,无需手写 promql 即可方便地查看监控数据
  • 新增模版中心,支持创建和修改模板,模版可以在一个地方集中维护和查看
  • 优化边缘机房机器失联告警的实现逻辑,真正做到边缘机房告警自闭环
  • 通知时支持配置过滤标签,避免告警事件中一堆不重要的标签
  • 全局回调地址页面展示优化,增加详尽的文档提示信息
  • 支持通过回调地址直接发送告警信息到钉钉、飞书、企微等
  • 内置集成故障自愈能力,不需要再单独部署 ibex 模块
  • 仪表盘变量支持和本业务组的机器联动,不同业务组组下的仪表盘只展示本业务组内的机器
  • 机器列表和指标视图打通,可以选择多台机器直接看图,无需任何提前配置
  • 告警规则,支持配置恢复时的 Promql,告警恢复通知也可以带上恢复时的值了
  • 支持通过回调地址直接发送告警信息到钉钉、飞书、企微等
  • 支持集成仪表盘,可以将 grafana 的仪表盘集成到夜莺中

部署方式:

准备好MySQL、Redis、K8s集群直接apply就行了,动动手,很快的!!!

https://flashcat.cloud/docs/content/flashcat-monitor/nightingale-v7/install/intro/


希望这篇文章能为你提供有关夜莺监控的一些有用信息。如果你有任何疑问或想要了解更多细节,请随时留言讨论。

如果想要更多原创干货,欢迎关注wx: 云原生知识栈

这篇关于云原生时代的监控明星 – 夜莺的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1110518

相关文章

Linux使用nload监控网络流量的方法

《Linux使用nload监控网络流量的方法》Linux中的nload命令是一个用于实时监控网络流量的工具,它提供了传入和传出流量的可视化表示,帮助用户一目了然地了解网络活动,本文给大家介绍了Linu... 目录简介安装示例用法基础用法指定网络接口限制显示特定流量类型指定刷新率设置流量速率的显示单位监控多个

通过prometheus监控Tomcat运行状态的操作流程

《通过prometheus监控Tomcat运行状态的操作流程》文章介绍了如何安装和配置Tomcat,并使用Prometheus和TomcatExporter来监控Tomcat的运行状态,文章详细讲解了... 目录Tomcat安装配置以及prometheus监控Tomcat一. 安装并配置tomcat1、安装

C#实现系统信息监控与获取功能

《C#实现系统信息监控与获取功能》在C#开发的众多应用场景中,获取系统信息以及监控用户操作有着广泛的用途,比如在系统性能优化工具中,需要实时读取CPU、GPU资源信息,本文将详细介绍如何使用C#来实现... 目录前言一、C# 监控键盘1. 原理与实现思路2. 代码实现二、读取 CPU、GPU 资源信息1.

k8s部署MongDB全过程

《k8s部署MongDB全过程》文章介绍了如何在Kubernetes集群中部署MongoDB,包括环境准备、创建Secret、创建服务和Deployment,并通过Robo3T工具测试连接... 目录一、环境准备1.1 环境说明1.2 创建 namespace1.3 创建mongdb账号/密码二、创建Sec

使用zabbix进行监控网络设备流量

《使用zabbix进行监控网络设备流量》这篇文章主要为大家详细介绍了如何使用zabbix进行监控网络设备流量,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录安装zabbix配置ENSP环境配置zabbix实行监控交换机测试一台liunx服务器,这里使用的为Ubuntu22.04(

springboot健康检查监控全过程

《springboot健康检查监控全过程》文章介绍了SpringBoot如何使用Actuator和Micrometer进行健康检查和监控,通过配置和自定义健康指示器,开发者可以实时监控应用组件的状态,... 目录1. 引言重要性2. 配置Spring Boot ActuatorSpring Boot Act

Java实现任务管理器性能网络监控数据的方法详解

《Java实现任务管理器性能网络监控数据的方法详解》在现代操作系统中,任务管理器是一个非常重要的工具,用于监控和管理计算机的运行状态,包括CPU使用率、内存占用等,对于开发者和系统管理员来说,了解这些... 目录引言一、背景知识二、准备工作1. Maven依赖2. Gradle依赖三、代码实现四、代码详解五

centos7基于keepalived+nginx部署k8s1.26.0高可用集群

《centos7基于keepalived+nginx部署k8s1.26.0高可用集群》Kubernetes是一个开源的容器编排平台,用于自动化地部署、扩展和管理容器化应用程序,在生产环境中,为了确保集... 目录一、初始化(所有节点都执行)二、安装containerd(所有节点都执行)三、安装docker-

python使用watchdog实现文件资源监控

《python使用watchdog实现文件资源监控》watchdog支持跨平台文件资源监控,可以检测指定文件夹下文件及文件夹变动,下面我们来看看Python如何使用watchdog实现文件资源监控吧... python文件监控库watchdogs简介随着Python在各种应用领域中的广泛使用,其生态环境也

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS