Hyperlnsight:监控产品中的“超能力战神”

2023-10-31 10:59

本文主要是介绍Hyperlnsight:监控产品中的“超能力战神”,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

当你去排队核酸检测,在验证身份证环节遇到系统奔溃,不得不继续等待......当你在金融交易应用上,操作一笔重要交易,如若因为交易故障,无法按时完成交易,将对自己带来巨大影响,狠狠吐槽金融企业的能力。

随着互联网服务深入千行百业,数字化应用成为企业和机构为用户提供服务的重要形式。如何降低应用的故障率;如何快速定位故障;如何保障系统稳定性和连续性,提高用户体验?这些都是IT运维目前面临的问题和痛点。

因此亟需一款能力全面的IT运维监控平台,助力应对数字化转型中产生的海量、复杂的运维难题。在此背景下,优维于2021年推出了超融合可观测平台Hyperlnsight。

Hyperlnsight是一款基于EasyCMDB的IT资源架构上构建可观测能力的新一代监控平台。从孤立的工具走向融合统一,从监控走向可观测,从应用融合出发,HyperInsight展现出多项“超能力”,比如数据采集、数据分析、应用服务、告警事件跟踪闭环等等。

1.数据采集:EasyHub与社区力量

HyperInsight 支持用户对指标(Metric)、事件(Event)、日志(Log)、分布式跟踪(Tracing)等数据来进行监控采集,除了使用产品内置插件或者用户自定义套件外,优维的EasyHub资源共享平台提供了上百个IT资源监控套件,而且 HyperInsight的数据采集服务兼容Promethues Exporter、Elastic Metricbeat等采集方案,用户可借助开源社区的力量,实现快速的现网监控数据采集与上报,快递降低实施成本。

△平台内置采集插件

△EasyHub资源共享平台

2.数据分析:EasyTSDB超融合存储

HyperInsight 最大的特点在于可有效借助 EasyCMDB 中的资源数据对资源的健康状态进行关联分析,作为新一代的IT资源元数据与监控数据的超融合式存储,优维自研的EasyTSDB为其提供了强大的数据分析能力。

3.应用服务:一键洞悉 一镜到底

优维持续坚持以应用为中心的产品建设思路,在坚实的数据采集与分析能力基础上,和传统的基础设施监控系统相比,HyperInsight更加聚焦在对应用服务的健康治理能力

4.应用服务地图

HyperInsight为整个业务系统提供了应用服务分析地图,在分析地图上,用户可以快速识别系统中的高危服务,可一键洞悉对服务的运行实例、吞吐量、接口时延、调用失败率等情况。

△应用服务分析地图

应用服务地图通过把同一个系统中的服务调用平铺出来,并且通过设置吞吐量、失败率、或者响应时间来对异常的服务进行过滤,颜色越深时,代表该指标的数值越大;同时右侧的服务和接口排行榜也会根据设置的指标进行排序,用于快速定位高危服务

5.从发现、分析到治理的完整闭环

应用服务地图提供了全景式的服务健康情况,一旦从服务地图,或者监控告警中发现异常的服务,HyperInsight可以通过服务的实例信息、调用分析、接口列表、告警事件等多个维度对异常的服务进行分析。

从服务的接口列表去查看接口的调用情况,包括接口的响应时延和失败率,如果发现了时延异常或者失败率高的接口时,可以点击该接口进入接口详情,进一步分析接口的健康状态。

HyperInsight 提供了强大的接口调用链路跟踪能力,针对异常的接口调用,可以通过时间范围、业务系统、应用服务等多个维度进行搜索和过滤,并且在调用链分析视图上提供丰富的辅助信息,例如产生的事件、关联的基础设施、服务地图、跟踪原始日志、堆栈信息等等,帮助用户精确定位问题根源

得益于EasyCMDB的强大的元数据管理能力,用户对服务运行架构有清晰的认知,从应用系统到服务接口、到底层的基础设施一览无遗。

6.让告警设置不再烦恼:可视化告警规则

告警设置与通知策略一直是企业监控系统配置里面最为复杂的一环,大量的告警规则随着生产服务的上线而产生,随着时间的推移,维护的工作变得越来越困难,单一指标重复告警现象居高不下,也容易造成告警风暴,导致监控系统的作用下降,观测效能大打折扣。

HyperInsight 为了彻底解决这些问题,创新地推出可复用、可视化的全链路告警规则。

全链路告警设置

HyperInsight 支持用户全景式地设置告警规则,全链路式告警规则的设置大幅度提高用户的使用效率和降低配置复杂度:

  • 通过监控目标设置告警的实例范围;

  • 设置触发告警的条件,例如指标阈值等;

  • 提供优维独有的告警分析能力,对产生的告警事件进行丰富(例如通过IP,从CMDB中查询和补充主机负责人信息到告警信息等)或者分组压缩(例如同一个主机上的不同告警事件进行分组压缩);

  • 设置告警通知,设置通知对象,例如负责人、指定用户或者用户组,以及通知方式,例如手机短信、电话、钉钉、企微、邮件等。

可复用的创新设计

监控目标到告警通知,4个阶段的策略均可以在任意的告警规则设置中重复使用,例如设置主机监控的实例范围,可以直接创建新的监控目标策略,也可以直接绑定之前已经创建的策略,来选择需要告警的主机实例。

又或者是通知策略,在生产使用的场合,通知策略复用程度和监控目标一样非常的频繁,例如所有的基础设施告警都会通知基础设施的运维小组,那么基础设施运维小组就是一个复用度很高的通知策略,在很多基础设施的告警规则中被引用。

7.告警事件跟踪与闭环

在设置告警规则后,处理告警触发的监控事件是大部分企业用户日常面临的工作之一,HyperInsight为用户提供了强大的事件处理中心,帮助用户快速处理、分析告警事件,并且希望通过事件中心,进一步提供事件治理的能力。

8.事件跟进:监控值班的驾驶舱

HyperInsight提供事件跟进的值班控制台,值班人员和业务人员可以快速地从控制台中,根据事件的不同状态来过滤需要关注的告警事件,例如值班人员一般会比较关心「待我响应」的告警事件,快速对线上产生的告警信息进行下一步的处理。

9.事件流转:跟踪、分析、定位与闭环

HyperInsight认为事件的闭环才是事件中心最为重要的一步,因此告警事件详情提供非常强大的告警跟踪、分析和定位、最后闭环的能力

首先,HyperInsight提供了事件的流转全景图,帮助用户快速了解当前事件的前世今生。

然后,HyperInsight提供了事件的基本信息、指标快照信息以及影响分析来帮助用户对告警进行跟踪、定位和分析。

指标快照完整地提供了指标的告警时长范围和严重程度

影响分析则是借助EasyCMDB的能力,可以快速地分析出告警资源对周边资源的影响,例如主机宕机后,对主机上运行的哪一些应用造成的影响等。

最后,HyperInsight提供了整个事件流转和一键闭环的能力,帮助用户快速对事件进行处理和完结

作为复杂业务的显微镜,HyperInsight从监控到洞察,从全局到细节,通过轻松部署、最少维护和全方位的覆盖范围,全自动化无死角监控,提供全方位IT资源和业务的可观测性,助力企业提升数字化体验,降低运维成本,提升工作效率,为数字化转型赋能升级。

这篇关于Hyperlnsight:监控产品中的“超能力战神”的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/314885

相关文章

python使用watchdog实现文件资源监控

《python使用watchdog实现文件资源监控》watchdog支持跨平台文件资源监控,可以检测指定文件夹下文件及文件夹变动,下面我们来看看Python如何使用watchdog实现文件资源监控吧... python文件监控库watchdogs简介随着Python在各种应用领域中的广泛使用,其生态环境也

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

雷动WEBRTC产品

http://www.rtcpower.com/html/leidongwebrtc.html ; 1.前言      WebRTC是一项在浏览器内部进行实时视频和音频通信的技术,是谷歌2010年以6820万美元收购Global IP Solutions公司而获得一项技术。WebRTC实现了基于网页的视频会议,标准是WHATWG 协议,目的是通过浏览器提供简单的javascript就可以

kubernetes集群部署Zabbix监控平台

一、zabbix介绍 1.zabbix简介 Zabbix是一个基于Web界面的分布式系统监控的企业级开源软件。可以监视各种系统与设备的参数,保障服务器及设备的安全运营。 2.zabbix特点 (1)安装与配置简单。 (2)可视化web管理界面。 (3)免费开源。 (4)支持中文。 (5)自动发现。 (6)分布式监控。 (7)实时绘图。 3.zabbix的主要功能

基于树梅派的视频监控机器人Verybot

最近这段时间做了一个基于树梅派 ( raspberry pi ) 的视频监控机器人平台 Verybot ,现在打算把这个机器人的一些图片、视频、设计思路进行公开,并且希望跟大家一起研究相关的各种问题,下面是两张机器人的照片:         图片1:                   图片2                    这个平台的基本组成是:

PC与android平板通过浏览器监控Verybot的视频

下面这个视频是PC与android平板通过浏览器监控Verybot的视频:           http://v.youku.com/v_show/id_XNjYzNzYyMTIw.html

全球AI产品Top100排行榜

Web Top50的榜单里,AIGC类型的应用占比52%,遥遥领先。AIGC类型包括图像、视频、音乐、语音等的内容生成和编辑。音乐生成应用Suno在过去六个月中的排名跃升最为显著,从第36位上升至第5位。排名第二大类是通用对话/AI聊天/角色扮演类型的应用,占比20%,包括常见的ChatGPT、Claude、Character.ai等。其他是AI写作(8%)、AI搜索/问答(6%)、Agent/

java后端服务监控与告警:Prometheus与Grafana集成

Java后端服务监控与告警:Prometheus与Grafana集成 大家好,我是微赚淘客返利系统3.0的小编,是个冬天不穿秋裤,天冷也要风度的程序猿! 在现代的微服务架构中,监控和告警是确保服务稳定性的关键组成部分。Prometheus和Grafana是两个强大的工具,它们可以集成在一起,为Java后端服务提供实时监控和可视化告警。 服务监控的重要性 服务监控可以帮助我们实时了解服务的健

145-Linux权限维持Rootkit后门Strace监控Alias别名Cron定时任务

参考 【权限维持】Linux&Rootkit后门&Strace监控&Alias别名&Cron定时任务_alias ls='alerts(){ ls $* --color=auto;python -c "-CSDN博客 参考 FlowUs 息流 - 新一代生产力工具 权限维持-Linux-定时任务-Cron后门 利用系统的定时任务功能进行反弹Shell 1、编辑后门反弹shell脚本