案例 | Zabbix如何为中国铁路动车组WiFi运营服务系统保驾护航?

本文主要是介绍案例 | Zabbix如何为中国铁路动车组WiFi运营服务系统保驾护航?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文转载自高鹏. 基于Zabbix的铁路动车组WiFi运营服务监控系统应用研究[J]. 铁路计算机应用, 2019, 028(004):22-27.

高鹏,中国铁道科学研究院集团有限公司,电子计算技术研究所助理研究员。

摘要

为了掌握铁路动车组WiFi运营服务系统实时运行状态,提高系统运维效率,缩短售后响应时间,节约应急资源,使运营管理和服务智能化,提出一种基于Zabbix的综合性监控系统。在阐述Zabbix开源框架与数据可视化基础之上,结合铁路动车组WiFi运营服务系统部署环境及应用场景,围绕系统运维及管理的实际需求,研究Zabbix监控系统关键技术。

利用Zabbix优秀的性能和可扩展性,将车载WiFi设备系统参数信息、列车开行信息、平台运营等数据高度集中、可视化展示,同时通过使用推送媒介建立实时性、高效性的推送机制,构建多层次、立体化的综合监控管理平台,实现了对铁路动车组WiFi运营服务系统资源数据的高度共享。充分利用现有技术条件,可以提高铁路动车组WiFi运营服务系统运维的高效化、统一化、智能化水平

为什么选择Zabbix

尽管目前市场上有较多的开源监控系统产品,如Nagios、Cacti、Zenoss 等,一定程度上提高了运维效率,节约了运维成本,但其服务对象相对单一,可定制性差, 无法满足日益增长的企业级服务发展需求,而开源监控方案 Zabbix 依据其强大的展现功能和可扩展性, 加上独特的开源性和简单易用等特点 , 更适用于铁路动车组 WiFi 运营服务综合监控系统。

一 监控系统概述

1.1 监控系统场景分析

铁路动车组 WiFi 运营服务系统主要由运营管理中心、地面网络和车载局域网 3 部分组成,其网络结构主要包括互联网接入和车载局域网两部分,系统结构示意图如图所示。

互联网接入作为整个动车组 WiFi 运营服务系统 的互联网出口, 通过车顶 3G/4G 天线与铁路沿线运营商公网基站建立无线连接通道;车载局域网为车厢内用户终端和单车设备之间提供车内通信网络,车内用户终端可共享车载无线局域网系统的内容服务,车厢单车之间通过车载局域网实现互联互通。

1.2 监控系统需求分析

2017 年 6 月,首列“复兴号”标动列车正式上线运营,铁路动车组 WiFi 运营服务系统作为“复兴号” 标动列车的配套设施也随之面世,旅客乘车期间可以享受铁路动车组 WiFi 这一增值服务。随着大批量标 动“复兴号”列车投入运营,铁路动车组 WiFi 运营 服务体系规模不断扩大, 其运营管理上亟需实现实时掌控系统运行状态、监控系统突发事件, 以动态调整运营策略,进而实现铁路动车组 WiFi 运营服务 价值最大化。为满足动车组 WiFi 运营服务需求,根据铁路动车组 WiFi 运营服务系统业务架构, 构建基 于 Zabbix 的车 - 车、车 - 地、地 - 地一体化综合监控 系统平台 [5] , 分别从铁路动车组 WiFi 运营服务系统 硬件层面、系统层面、业务层面进行需求分析,以实现对不同层次粒度数据的采集与融合。

二 监控系统部署方案


在这里插入图片描述

三 监控系统应用

3.1 监控系统关键技术

高性能网络数据包缓存与转发

基于铁路动车组具有配 属局分散、不集中等特性,为避免铁路动车组 WiFi 运营服务监控系统的 Zabbix_ Server 端 无 法 承 受 来 自 终 端 Zabbix_Agentdd 频 繁 请 求压力,Zabbix 监控系统以 列为单位,将列车采集数据 集中到同一数据缓存节点,Zabbix_AAgentd 在该缓存节点拿取数据,以主动上报方式传到 Zabbix_ Serve 端。该监控系统设定车载中心服务器作为每列车的数据缓存节点,在其部署Zabbix_ Agentd,并配置对应列车的 Host_name。各车厢单车服务器及 AP 产生的数据集中到车 载 WiFi 接入控制器(AC)上,车载 AC 将接收到的数据集中于车载中心服务器基于分 布式文件储存的数据库(mongoDB)中存 储 , 数据以设备 ID 分类罗列。如图 4 MongoDB 中展示了 ID 为“ZTC-01-000BABDF3355 (设备生产商编号 - 设备类型编号 - 设备 MAC)”中 心路由器上报的参数。Zabbix_AAgentd可直接从 MongoDB 中调集参数上报给 Zabbix_Server 端,这种上报方式减少了 Zabbix _Agentd 部署节点数量,缓解了 Zabbix _Server 端的处理压力,对动车组 WiFi 运营服务监控系统后续性能的扩展有着重要意义,提升了监控系统平台的实时性和稳定性。

通信协议转换

铁路动车组 WiFi 运营服务系统涉及诸多旅客 私密信息,为保障 Zabbix 监控系统服务端数据的安全性,将 Zabbix_Server 从原有的公网阿里云端迁移到客票系统内网部署。

日志集中检索与全链路追踪技术

日志集 中分析平台从日志产生到提供检索延时不超过5 s,平均检索耗时在 3 s 以内,为研发与运维人员提供了 强有力的故障定位工具,同时也是平台运行状况 监控的重要数据源。

四 监控系统应用

4.1 监控系统应用

车载 WiFi 设备是铁路动车组 WiFi 运营服务系 统重要组成部分,其状态好坏会直接影响铁路动车组 WiFi 运营服务质量,因此,实时掌握车载 WiFi 设备运行状态,是提高系统稳定,增强用户体验感的必然前提。Zabbix 监控系统通过实时监测终端设备的心跳包 ( 客户端与服务器间的响应数据包 ),根据其呼应频率特性分析,判断设备在线状态。车载接入器(AP)作为 WiFi 运营服务系统中数量多,易被攻击的设备,其状态的好坏对整个系统稳定显得至关重要,本监控系统设置 30 s 为一上报周期,对其状态进行实时性监控。预设 AP 在线状态值为 1,不在 线状态值为 0,车载控制器(AC)设定 15 min 为一 周期, 对 AP 上报状态结果进行分析判定,以单车厢分组(每单车厢固定配置 2 个 AP),展示出周期内上报数据的最新值、最小值、平均值、最大值,根据图形化状态图趋势,直观获取终端 AP 在线状态,进而评估系统的稳定性。其状态分析展示如图 5 所示。

4.2 系统应用监控

通过对终端设备系统应用参数的采集, 将实时数据进行图形化展示,图 6 展示了应用系统 1 min 内 的平均负载、内存占用的历史记录。随着列车开行时间的推移,铁路动车组 WiFi 运营服务系统接入用户数累计增加,中间件(MYSQL)事务每秒查询和回滚率随之上升,通过对多系统参数指标的参考,用以整体性分析、评估系统运行的平稳性和健壮性。

4.3 运营商网卡数据监控

通过使用脚本程序添加自定义监控参数, 形成监控网卡数据的可视化界面。从图 7 可以看出列车在不同行驶时间、行驶区段各运营商网卡信号强度的变化趋势,图 8 展示了旅客用户在 WiFi 使用过程中带宽的实时变化趋势, 图 7、图 8 中都有出现数据 急剧变化的区段,这与列车穿过隧道或车站, 隧道或车站对运营商的信号有很大的屏蔽效应有直接关系,同时信号强度以及带宽上下的波动会受铁路 沿线运营商信号覆盖率的影响。

五 利用Zabbix强大的API扩展能力

基于 Zabbix 监控技术与数据可视化研究的基础上,针对 Zabbix 分布式、可扩展性等特点,结合铁路动车组 WiFi 运营服务系统运营数据建立监控环境,进行Zabbix 监控系统的搭建和优化,利用其强大的应用程序接口(API)扩展能力,实现了动车组 WiFi 运营服务系统相关资源的整合。通过用户定制,添加自定义监控项,完成了对动车组 WiFi 运营服务系 统数据的可视化监控与管理,这些改进突破了传统系统平台的运维管理方式,整合了监控管理工具和通用集中监控系统的优势,对保障铁路动车组 WiFi 运营服务系统平稳运行具有重要意义。本监控系统全面应用以来,以监控代替检查,实现了系统运维的数字化、信息化及自动化,不但节约了运维人力的投入,而且精准度高,预警性强,切实为铁路动车组 WiFi 运营服务系统起到了保驾护航的作用,同时该系统监控系统的建设及改进对类似大型企业级应用具有借鉴价值。

你还想了解Zabbix在哪个行业的应用,欢迎留言告诉我们。

这篇关于案例 | Zabbix如何为中国铁路动车组WiFi运营服务系统保驾护航?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/218145

相关文章

Android 悬浮窗开发示例((动态权限请求 | 前台服务和通知 | 悬浮窗创建 )

《Android悬浮窗开发示例((动态权限请求|前台服务和通知|悬浮窗创建)》本文介绍了Android悬浮窗的实现效果,包括动态权限请求、前台服务和通知的使用,悬浮窗权限需要动态申请并引导... 目录一、悬浮窗 动态权限请求1、动态请求权限2、悬浮窗权限说明3、检查动态权限4、申请动态权限5、权限设置完毕后

TP-Link PDDNS服将于务6月30日正式停运:用户需转向第三方DDNS服务

《TP-LinkPDDNS服将于务6月30日正式停运:用户需转向第三方DDNS服务》近期,路由器制造巨头普联(TP-Link)在用户群体中引发了一系列重要变动,上个月,公司发出了一则通知,明确要求所... 路由器厂商普联(TP-Link)上个月发布公告要求所有用户必须完成实名认证后才能继续使用普联提供的 D

在不同系统间迁移Python程序的方法与教程

《在不同系统间迁移Python程序的方法与教程》本文介绍了几种将Windows上编写的Python程序迁移到Linux服务器上的方法,包括使用虚拟环境和依赖冻结、容器化技术(如Docker)、使用An... 目录使用虚拟环境和依赖冻结1. 创建虚拟环境2. 冻结依赖使用容器化技术(如 docker)1. 创

使用Navicat工具比对两个数据库所有表结构的差异案例详解

《使用Navicat工具比对两个数据库所有表结构的差异案例详解》:本文主要介绍如何使用Navicat工具对比两个数据库test_old和test_new,并生成相应的DDLSQL语句,以便将te... 目录概要案例一、如图两个数据库test_old和test_new进行比较:二、开始比较总结概要公司存在多

CentOS系统Maven安装教程分享

《CentOS系统Maven安装教程分享》本文介绍了如何在CentOS系统中安装Maven,并提供了一个简单的实际应用案例,安装Maven需要先安装Java和设置环境变量,Maven可以自动管理项目的... 目录准备工作下载并安装Maven常见问题及解决方法实际应用案例总结Maven是一个流行的项目管理工具

微服务架构之使用RabbitMQ进行异步处理方式

《微服务架构之使用RabbitMQ进行异步处理方式》本文介绍了RabbitMQ的基本概念、异步调用处理逻辑、RabbitMQ的基本使用方法以及在SpringBoot项目中使用RabbitMQ解决高并发... 目录一.什么是RabbitMQ?二.异步调用处理逻辑:三.RabbitMQ的基本使用1.安装2.架构

Java中使用Java Mail实现邮件服务功能示例

《Java中使用JavaMail实现邮件服务功能示例》:本文主要介绍Java中使用JavaMail实现邮件服务功能的相关资料,文章还提供了一个发送邮件的示例代码,包括创建参数类、邮件类和执行结... 目录前言一、历史背景二编程、pom依赖三、API说明(一)Session (会话)(二)Message编程客

C#实现系统信息监控与获取功能

《C#实现系统信息监控与获取功能》在C#开发的众多应用场景中,获取系统信息以及监控用户操作有着广泛的用途,比如在系统性能优化工具中,需要实时读取CPU、GPU资源信息,本文将详细介绍如何使用C#来实现... 目录前言一、C# 监控键盘1. 原理与实现思路2. 代码实现二、读取 CPU、GPU 资源信息1.

SpringBoot实现动态插拔的AOP的完整案例

《SpringBoot实现动态插拔的AOP的完整案例》在现代软件开发中,面向切面编程(AOP)是一种非常重要的技术,能够有效实现日志记录、安全控制、性能监控等横切关注点的分离,在传统的AOP实现中,切... 目录引言一、AOP 概述1.1 什么是 AOP1.2 AOP 的典型应用场景1.3 为什么需要动态插

在C#中获取端口号与系统信息的高效实践

《在C#中获取端口号与系统信息的高效实践》在现代软件开发中,尤其是系统管理、运维、监控和性能优化等场景中,了解计算机硬件和网络的状态至关重要,C#作为一种广泛应用的编程语言,提供了丰富的API来帮助开... 目录引言1. 获取端口号信息1.1 获取活动的 TCP 和 UDP 连接说明:应用场景:2. 获取硬