分布式监控平台Centreon实践真传

2024-01-19 21:48

本文主要是介绍分布式监控平台Centreon实践真传,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

第1章 监控那些事... 3

1.1我的监控之旅... 3

1.2监控的分类... 6

1.3有效监控... 6

1.4经验之谈... 7

第2章 认识开源分布式监控平台Centreon. 8

2.1 Centreon主要特征... 9

2.2 Centreon主要组成部分... 12

2.2.1操作系统CentOS. 12

2.2.2数据库MySQL. 12

2.2.3 WEB服务器Apache. 12

2.2.4 应用服务PHP. 14

2.2.5 Centreon相关组件... 14

2.2.6 Centreon分布式监控架构... 16

2.3 Centreon WEB 管理界面简述... 17

第3章 安装部署Centreon 20.10. 21

3.1 安装部署需求... 21

3.2安装前的准备工作... 23

3.3以Centreon ISO进行安装... 24

3.4在操作系统CentOS 7上安装Centreon. 35

3.4.1安装Centreon 先决条件... 36

3.4.2准备Yum安装源... 37

3.4.3安装Centreon Central Server 37

3.4.4修改数据库LimitNOFILE限制(可选)... 38

3.4.5修改PHP时区... 39

3.4.6将所有相关服务设置成随系统开机启动... 39

3.4.7启动所有服务... 40

3.5验证Centreon 安装的正确性... 40

第4章 更进一步了解Centreon. 41

4.1 Centreon初始化设置... 41

4.2 Centreon 20 相关信息初探... 46

4.2.1 Centreon相关性账号... 46

4.2.2主要配置文件... 48

4.3 Web管理后台登录... 54

4.4 注意事项... 55

第5章 我们的第一个监控... 56

5.1添加主机... 56

5.2添加依附于主机的服务... 62

5.3导出数据并启动Centreon引擎... 64

5.4操作步骤汇总... 70

5.5验证监控有效性... 70

第6章 玩真的,监控生产环境(一)... 72

6.1确定监控范围... 72

6.2告警工具准备... 72

6.3钉钉告警... 72

6.3.1准备钉钉群组机器人... 73

6.3.2告警整合进Centreon. 80

6.4短信告警... 85

6.5邮件告警... 86

第7章 玩真的,监控生产环境(二)... 88

7.1监控主机资源... 88

7.1.1安装NRPE. 89

7.1.2安装Nagios插件... 90

7.1.3被监控端配置NRPE. 90

7.1.4验证NRPE. 93

7.1.5监控服务器Centreon Central添加主机资源监控项... 94

7.1.6主机资源监控验证... 98

7.2模拟故障告警... 100

7.3批量部署NRPE监控主机资源... 104

第8章 玩真的,监控生产环境(三)... 107

8.1监控服务... 107

8.1.1监控负载均衡(Keepalived + HAProxy)... 108

8.1.2监控Proxmox VE超融合集群... 111

8.2监控小型站点... 114

8.2.1监控Nginx服务... 115

8.2.2监控PHP服务... 116

8.2.3监控MySQL数据库... 117

8.2.4综合性监控... 122

第9章Centreon 日常管理及维护... 125

9.1 Centreon 日常维护... 125

9.1.1 Centreon相关服务的启停... 125

9.1.2 Centreon数据备份... 126

9.1.3 Centreon 故障处理... 128

9.2 Centreon Central日常管理... 130

9.2.1添加联系人/用户... 130

9.2.2删除被监控主机... 139

9.2.3删除联系人/用户... 140

9.3 Nagios插件脚本撰写... 140

9.3.1监控日志文件是否生成(check_logfile)... 141

9.3.2监控日志文件大小(check_logsize)... 141

9.4 Centreon Central告警静默... 143

9.4.1立刻保持静默... 143

9.4.2固定时间静默... 145

第10章 Centreon使用技巧... 147

10.1创建Centreon 模板... 147

10.1.1创建服务模板... 148

10.2自定义Centreon Central管理后台视图( Custom Views)... 153

10.3复制监控对象... 156

10.4多用户钉钉机器人报警... 157

10.4.1创建钉钉群组... 158

10.4.2创建自定义钉钉群组机器人... 158

10.4.3创建另一个钉钉机器人调用脚本... 159

10.4.4 Centreon Web管理后台创建通知命令... 160

10.4.5创建联系人并关联钉钉... 162

10.4.6联系人/用户附属到主机或者服务... 163

 

第11章 Centreon版本升级

11.1 Centreon小版本升级.............................................................................. 166

11.1.1更新Centreon YUM源................................................................ 166

11.1.2 Centreon 在线更新...................................................................... 167

11.1.3重启PHP及Apache服务........................................................... 168

11.1.4 Centreon管理后台更新.............................................................. 169

11.1.5重启其它相关服务........................................................................ 172

11.2 Centreon 大版本升级............................................................................. 173

11.2.1更新系统及Centreon YUM源................................................... 173

11.2.2 Centreon 更新.............................................................................. 173

11.2.3启动新的PHP 7.2......................................................................... 174

11.2.4验证升级是否正常........................................................................ 177

11.3 Centreon版本升级的变化...................................................................... 178

第12章 Centreon 分布式监控............................................................................. 180

12.1安装Centreon 分布式Poller................................................................. 180

12.2中央服务器添加Poller............................................................................ 182

12.2.1以SSH协议连接远端Poller....................................................... 183

12.2.2以“gorgone”协议连接远端Poller.............................................. 186

12.3通过远端Poller监控私有网络............................................................... 189

12.3.1需求及场景描述............................................................................ 189

12.3.2添加受保护的内网主机............................................................... 190

12.3.3添加主机服务项............................................................................ 190

12.3.4模拟故障,验证监控是否有效................................................... 192

第13章 Centreon备份与恢复.............................................................................. 194

13.1最快的备份及恢复................................................................................... 195

13.1.1 Centreon系统备份....................................................................... 195

13.1.2 Centreon系统快速恢复.............................................................. 197

13.2简化性的Centreon备份及恢复............................................................ 200

13.2.1备份MariaDB数据库................................................................... 201

13.2.2备份非数据库文件........................................................................ 201

13.2.3 Centreon中央监控服务器恢复.................................................. 201

13.3经验总结.................................................................................................... 203

第14章 Centreon 典型故障处理......................................................................... 205

14.1远端Poller故障........................................................................................ 205

14.2 Centreon Central中央监控服务器故障............................................... 208

14.2.1 Centreon Central Web管理后台不能登录.............................. 209

14.2.2 “cdb”服务不能启动............................................................................... 210

14.2.3 Centreon Poller 间隙性停止故障.............................................. 211

14.3 NRPE(Nagios Remote Plugin Executor)故障................................. 215

14.3.1普通账号权限问题........................................................................ 215

14.3.2远端Poller内的NRPE权限问题............................................... 217

第15章 杂项............................................................................................................ 219

15.1 Centreon 高可用性(HA)................................................................... 219

15.2监控更大规模的网络............................................................................... 221

15.3 Centreon 的安全性................................................................................. 221

全文完

这篇关于分布式监控平台Centreon实践真传的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/623793

相关文章

C++实现封装的顺序表的操作与实践

《C++实现封装的顺序表的操作与实践》在程序设计中,顺序表是一种常见的线性数据结构,通常用于存储具有固定顺序的元素,与链表不同,顺序表中的元素是连续存储的,因此访问速度较快,但插入和删除操作的效率可能... 目录一、顺序表的基本概念二、顺序表类的设计1. 顺序表类的成员变量2. 构造函数和析构函数三、顺序表

python实现简易SSL的项目实践

《python实现简易SSL的项目实践》本文主要介绍了python实现简易SSL的项目实践,包括CA.py、server.py和client.py三个模块,文中通过示例代码介绍的非常详细,对大家的学习... 目录运行环境运行前准备程序实现与流程说明运行截图代码CA.pyclient.pyserver.py参

使用C++实现单链表的操作与实践

《使用C++实现单链表的操作与实践》在程序设计中,链表是一种常见的数据结构,特别是在动态数据管理、频繁插入和删除元素的场景中,链表相比于数组,具有更高的灵活性和高效性,尤其是在需要频繁修改数据结构的应... 目录一、单链表的基本概念二、单链表类的设计1. 节点的定义2. 链表的类定义三、单链表的操作实现四、

通过prometheus监控Tomcat运行状态的操作流程

《通过prometheus监控Tomcat运行状态的操作流程》文章介绍了如何安装和配置Tomcat,并使用Prometheus和TomcatExporter来监控Tomcat的运行状态,文章详细讲解了... 目录Tomcat安装配置以及prometheus监控Tomcat一. 安装并配置tomcat1、安装

Spring Boot统一异常拦截实践指南(最新推荐)

《SpringBoot统一异常拦截实践指南(最新推荐)》本文介绍了SpringBoot中统一异常处理的重要性及实现方案,包括使用`@ControllerAdvice`和`@ExceptionHand... 目录Spring Boot统一异常拦截实践指南一、为什么需要统一异常处理二、核心实现方案1. 基础组件

SpringBoot项目中Maven剔除无用Jar引用的最佳实践

《SpringBoot项目中Maven剔除无用Jar引用的最佳实践》在SpringBoot项目开发中,Maven是最常用的构建工具之一,通过Maven,我们可以轻松地管理项目所需的依赖,而,... 目录1、引言2、Maven 依赖管理的基础概念2.1 什么是 Maven 依赖2.2 Maven 的依赖传递机

C#实现系统信息监控与获取功能

《C#实现系统信息监控与获取功能》在C#开发的众多应用场景中,获取系统信息以及监控用户操作有着广泛的用途,比如在系统性能优化工具中,需要实时读取CPU、GPU资源信息,本文将详细介绍如何使用C#来实现... 目录前言一、C# 监控键盘1. 原理与实现思路2. 代码实现二、读取 CPU、GPU 资源信息1.

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI

在C#中获取端口号与系统信息的高效实践

《在C#中获取端口号与系统信息的高效实践》在现代软件开发中,尤其是系统管理、运维、监控和性能优化等场景中,了解计算机硬件和网络的状态至关重要,C#作为一种广泛应用的编程语言,提供了丰富的API来帮助开... 目录引言1. 获取端口号信息1.1 获取活动的 TCP 和 UDP 连接说明:应用场景:2. 获取硬

Java内存泄漏问题的排查、优化与最佳实践

《Java内存泄漏问题的排查、优化与最佳实践》在Java开发中,内存泄漏是一个常见且令人头疼的问题,内存泄漏指的是程序在运行过程中,已经不再使用的对象没有被及时释放,从而导致内存占用不断增加,最终... 目录引言1. 什么是内存泄漏?常见的内存泄漏情况2. 如何排查 Java 中的内存泄漏?2.1 使用 J