本文主要是介绍云原生时代的监控明星 – 夜莺,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
云原生时代的监控明星 – 夜莺
如果想要更多原创干货,欢迎关注wx: 云原生知识栈
引言
在云原生时代,随着业务的不断扩展和技术栈的日益复杂,对于监控系统的需求也日益增长。传统的监控方案往往难以满足现代企业的高可用、高性能要求。而夜莺监控(Nightingale),作为一款先进的开源云原生监控分析系统,以其All-In-One的设计理念,为企业带来了全新的解决方案。今天,我们就来一起探索夜莺监控的魅力所在。他到底为我解决了哪些问题?
夜莺监控简介
夜莺监控是一款由国内团队开发的开源云原生监控系统,它采用了All-In-One的设计模式,集数据采集、可视化、监控告警、数据分析于一体,与云原生生态紧密集成,为用户提供了一站式的监控解决方案。无论是在私有云、公有云还是混合云环境中,夜莺都能提供开箱即用的企业级监控分析和告警能力。
帮我解决了哪些问题?
1. 实现统一告警管理
夜莺天生支持多种时序库的对接,如:Prometheus、VictoriaMetrics、Thanos、Mimir、M3DB、TDengine 等多种时序库,
在我的场景中,存在大量混部,私有云的Prometheus集群,这让我的监控告警带来一定的挑战。使用夜莺让我释放了双手。提高了效率,
具体感受如下:
- 不在需要管理Prometheus里面的Rules
- 不在需要维护Prometheus系的Alertmanager
- 不在需要维护那么多集群的告警渠道及组件
- 不在需要为每一个用户配置不一样的告警规则
- 有了分组分级告警能力
- 有了统一的监控告警Oncall能力
- 中心化接管全集群Prometheus服务管理
- 告警聚合,清晰知道哪个Prometheus集群再哇哇叫
2. 统一日志查看聚合能力
想必大佬们也有类似的场景,各集群有一套自己的日志系统,如ELK,Loki等,分别接入各项目用户使用,那么每套日志系统切换着看,是不是很麻烦?
So,他来了!!!
开源版本目前支持接入 Prometheus Like(Prometheus、VictoriaMetrics、Thanos、M3 等兼容 Prometheus 查询接口的数据源)、ElasticSearch、Loki、TDEngine 等数据源类型,但是这只是我目前接入较少的一部分。
针对这部分功能给我的感jio
- 下回再问我要日志系统链接–> 出门左拐
3. 告警管理订阅能力
如果你有100+Prometheus 集群,有100+用户关注告警信息,兄台如何应对?
上夜莺:
内置支持多种告警规则,可以扩展支持常见通知媒介,支持告警屏蔽/抑制/聚合/自愈、告警事件管理。
- 我给你写好规则,你爱咋收咋收 => 告警订阅
- 我不会写PromQL,我给你大量内置,还手摸手教你OK?=> 新手模式
- 我不想写PromQL,想点一下就能看,OK,OK,=> 指标视图
- 告警太多了,烦死人了,点一下自动屏蔽,或者控制一下通知间隔很累吗? => 告警屏蔽
4. 统一登录
要是你维护的系统,固定一个秘密。来一个人问你一下密码,你能受得了么?
夜莺支持了 OAuth、LDAP、CAS、OIDC 这四种单点登录服务的对接,想要对接某个单点登录服务,直接在页面上配置即可
产品架构:
核心功能亮点
1. 数据采集与整合
- 广泛的数据源支持:夜莺监控支持多种数据源接入,包括Prometheus、VictoriaMetrics等多种时序数据库,以及日志文件、网络流量等。
2. 可视化与分析
- 灵活的仪表盘定制:用户可以根据自身需求,自定义创建多样化的仪表板,实现对监控数据的实时展示。
- 强大的数据分析工具:内置丰富的数据分析功能,支持SQL查询、数据挖掘等功能,帮助用户深入理解业务趋势。
3. 监控告警
- 智能告警机制:支持基于阈值、异常检测等多种告警规则,可根据不同场景设置告警策略。
- 多渠道通知:支持邮件、短信、企业微信等多种通知方式,确保问题及时被发现并处理。
- 运维OnCall灵活机制: 无缝搭配 Flashduty:实现告警聚合收敛、认领、升级、排班、IM集成,确保告警处理不遗漏,减少打扰,高效协同。
4. 权限管理与便捷性
- 细粒度的权限控制:提供用户管理和权限分配功能,确保每个用户只能访问被授权的数据。
- 统一登录对接:统一的 SSO 认证、鉴权、用户、团队、业务组管理体系,提供了一个平台底座
最近的新功能
夜莺监控团队持续更新和完善产品,最近推出的版本中新增了一些实用的功能,例如:
- 全站暗黑主题
- 新增指标视图,内置上百个 promql,无需手写 promql 即可方便地查看监控数据
- 新增模版中心,支持创建和修改模板,模版可以在一个地方集中维护和查看
- 优化边缘机房机器失联告警的实现逻辑,真正做到边缘机房告警自闭环
- 通知时支持配置过滤标签,避免告警事件中一堆不重要的标签
- 全局回调地址页面展示优化,增加详尽的文档提示信息
- 支持通过回调地址直接发送告警信息到钉钉、飞书、企微等
- 内置集成故障自愈能力,不需要再单独部署 ibex 模块
- 仪表盘变量支持和本业务组的机器联动,不同业务组组下的仪表盘只展示本业务组内的机器
- 机器列表和指标视图打通,可以选择多台机器直接看图,无需任何提前配置
- 告警规则,支持配置恢复时的 Promql,告警恢复通知也可以带上恢复时的值了
- 支持通过回调地址直接发送告警信息到钉钉、飞书、企微等
- 支持集成仪表盘,可以将 grafana 的仪表盘集成到夜莺中
部署方式:
准备好MySQL、Redis、K8s集群直接apply就行了,动动手,很快的!!!
https://flashcat.cloud/docs/content/flashcat-monitor/nightingale-v7/install/intro/
希望这篇文章能为你提供有关夜莺监控的一些有用信息。如果你有任何疑问或想要了解更多细节,请随时留言讨论。
如果想要更多原创干货,欢迎关注wx: 云原生知识栈
这篇关于云原生时代的监控明星 – 夜莺的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!