zabbix sender 配置方法

2024-03-03 19:50
文章标签 配置 方法 zabbix sender

本文主要是介绍zabbix sender 配置方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

说明

zabbix 监控常见有 agent, trapper, proxy 三种监控模式
本文主要讨论 trapper 模式

agent 方案

1 zabbix client (需要进行监控的客户机) 调用 zabbix-agent 进行启动 10050 端口
2 zabbix server 向已注册的 zabbix client 请求监控数据

参考 zabbix server 进程

[root@gx-yun-084044 ~]# ps aux | grep poll
root       1152  0.0  0.0      0     0 ?        S<   Nov14   0:00 [edac-poller]
zabbixs+  10604  0.0  0.0 363764  5044 ?        S    15:07   0:00 /usr/sbin/zabbix_server: poller #1 [got 0 values in 0.000084 sec, idle 5 sec]
zabbixs+  10605  0.0  0.0 363764  5044 ?        S    15:07   0:00 /usr/sbin/zabbix_server: poller #2 [got 0 values in 0.000264 sec, idle 5 sec]
zabbixs+  10606  0.0  0.0 363764  5044 ?        S    15:07   0:00 /usr/sbin/zabbix_server: poller #3 [got 0 values in 0.000107 sec, idle 5 sec]
zabbixs+  10607  0.0  0.0 363764  5156 ?        S    15:07   0:00 /usr/sbin/zabbix_server: poller #4 [got 0 values in 0.000082 sec, idle 5 sec]
zabbixs+  10608  0.0  0.0 363764  5044 ?        S    15:07   0:00 /usr/sbin/zabbix_server: poller #5 [got 0 values in 0.000231 sec, idle 5 sec]
zabbixs+  10609  0.0  0.0 363768  5444 ?        S    15:07   0:04 /usr/sbin/zabbix_server: unreachable poller #1 [got 0 values in 0.000103 sec, getting values]
zabbixs+  10622  0.0  0.0 259032  2508 ?        S    15:07   0:00 /usr/sbin/zabbix_server: http poller #1 [got 0 values in 0.000480 sec, idle 5 sec]
zabbixs+  10635  0.0  0.0 259032  2508 ?        S    15:07   0:00 /usr/sbin/zabbix_server: proxy poller #1 [exchanged data with 0 proxies in 0.000085 sec, idle 5 sec]

trapper 方案

1. zabbix server 服务器打开 10051 端口
2. zabbix client 利用 zabbix-sender 主动向 zabbix server 提供监控数据

场景

当前 zabbix 用于监控 openstack 中 instance 性能
zabbix instance (client) 约 6500 
zabbix items (监控项)  1400000+
每秒约插入数据库新数据约 25000

参考 zabbix status

ParameterValueDetails
Zabbix server is runningYeslocalhost:10051
Number of hosts (enabled/disabled/templates)65386478 / 0 / 60
Number of items (enabled/disabled/not supported)14085591328627 / 35584 / 44348
Number of triggers (enabled/disabled [problem/ok])509196283588 / 225608 [946 / 282642]
Number of users (online)18962
Required server performance, new values per second24266.07-

优缺点

agent 模式

优点参考场景, instance 被当做独立主机监控可以独立地区分数据, 定位 instance owner, 精准告警
缺点每个监控项都是由 zabbix server 通过 instance (被监控主机) 中的 agent 获取当 instance 不断增加, 则会导致 zabbix server 经常会出现 poller busy 或者 poller unreachable 错误上述错误会出现监控空白窗口, 即, 某个繁忙时间内无法获取对应监控信息
特点一个 instance 假如有 100 个 item 监控项, 那么 zabbix server 与 instance 就需要交互 100

trapper 模式

原理

   instance 由 cron job 调用进程, 进程收集需要的监控项数据把所有数据都整理成可用于上报 zabbix-server 的报表zabbix-sender 提交报表中所有监控项

优化

  一个 instance 假如有 100 个 item 监控项
  instance 自身收集 100 个 item 需要的数据instance 只需要向 zabbix-server 交互一次即可提交所有数据

思考

参考场景

instance 需要被当做独立主机监控
假如只把 agent 模式更换成 trapper 模式, 对于 zabbix server 的压力, 可以减少了一部分压力

换位思考

compute 节点上运行了 instance
在 compute 节点上, 对本 compute-node 中所有 instance 进行数据收集 (每个 compute 约 10 ~ 20instance )
可以再次降低 zabbix-sender 与 zabbix-server 之间的交互, 减少 10 ~ 20

优缺点

compute-node 需利用 libvirtd , 可以对 compute 中 instance 进行 item 数据收集
只可以收集硬件基础信息, 如 cpu, memory, disk usage, disk io, network package, network traffic
无法对 instance 中应用程序监控信息
不需要在 instance 中运行 zabbix-agent 进程
需要在 compute-node 中执行 zabbix-sender, 收集 compute-node 中所有 instnace 监控项, 最后向 zabbix-server 提交所有监控信息

zabbix sender

zabbix sender 由 zabbix-client 软件包提供
由被监控的机器主动运行,  常见被设定由 cron job 中调用

需求

需要 server 中的监控项 (item) 支持对应配置

1. 需要定义 item 监控类型 (默认 agent 被动模式) 需要改为 zabbix trapper 模式
2. 需要添加该 item allow host 选项, 允许那些主机进行数据上报功能注意, 需要定义多个 host 方法如下  x.x.x.x,x.x.x.x 利用逗号进行分隔

参考下图

trapper

数据库说明

上图中的修改, 将会自动对 zabbix.items 表进行修改

需要先知道当前对应模板 hostid

MariaDB [zabbix]> select hostid  from hosts where name = 'linux_vm';
+--------+
| hostid |
+--------+
|  10108 |
+--------+
1 row in set (0.00 sec)

假设需要对其中一个 item ( net.if.out[eth0] ) 进行修改
一次性添加主机方法

MariaDB [zabbix]> update items set trapper_hosts = '10.199.131.230,10.199.131.229,10.199.131.206,10.199.131.201' where hostid=10108;
Query OK, 23 rows affected (0.00 sec)
Rows matched: 23  Changed: 23  Warnings: 0

查询对应主机信息

MariaDB [zabbix]> select type, key_, trapper_hosts from items where key_='net.if.out[eth0]' and hostid=10108;
+------+------------------+-------------------------------------------------------------+
| type | key_             | trapper_hosts                                               |
+------+------------------+-------------------------------------------------------------+
|    2 | net.if.out[eth0] | 10.199.131.230,10.199.131.229,10.199.131.206,10.199.131.201 |
+------+------------------+-------------------------------------------------------------+
1 row in set (0.00 sec)

追加主机方法
通过 concat(‘xxxx,’, trapper_hosts) 方法, 可以直接对表中数据进行追加, 而不需要关心当前已经存在有哪些数据

MariaDB [zabbix]> update items set trapper_hosts = concat('10.189.209.162,',trapper_hosts)  where hostid=10108;
Query OK, 23 rows affected (0.00 sec)
Rows matched: 23  Changed: 23  Warnings: 0

说明

type:  zabbix trapper  修改表 items 中 type 列, 对应值为 2allowed host 修改 items 中 trapper_hosts 列, 对应值为 'x.x.x.x,x.x.x.x,x.x.x.x'
type:  agent修改表 items 中 type 列, 对应值为 0allowed host 修改 items 中 trapper_hosts 列, 对应值为 ''

zabbix sender 报表

参考报表格式

kvm-test4-vsvnf.vclound.com agent.ping 1
kvm-test4-vsvnf.vclound.com system.cpu.util[,system] 0.0
kvm-test4-vsvnf.vclound.com system.cpu.util[,user] 0.0
kvm-test4-vsvnf.vclound.com system.cpu.util[,cpu] 1.02968210051
kvm-test4-vsvnf.vclound.com vm.memory.size[total] 3974930432
kvm-test4-vsvnf.vclound.com vm.memory.size[available] 3374346240
kvm-test4-vsvnf.vclound.com vm.memory.size[used] 600584192
kvm-test4-vsvnf.vclound.com hv.memory.size[used] 1037721600
kvm-test4-vsvnf.vclound.com net.if.in[eth0] 14325621103
kvm-test4-vsvnf.vclound.com net.if.out[eth0] 372320716
kvm-test4-vsvnf.vclound.com net.if.in[eth0,dropped] 0
kvm-test4-vsvnf.vclound.com net.if.out[eth0,dropped] 0
kvm-test4-vsvnf.vclound.com net.if.in[eth0,errors] 0
kvm-test4-vsvnf.vclound.com net.if.out[eth0,errors] 0
kvm-test4-vsvnf.vclound.com net.if.in[eth0,packets] 104586170
kvm-test4-vsvnf.vclound.com net.if.out[eth0,packets] 5623263
kvm-test4-vsvnf.vclound.com vfs.fs.iostat[,write_bytes] 3299751424
kvm-test4-vsvnf.vclound.com vfs.fs.iostat[,read_bytes] 207334912
kvm-test4-vsvnf.vclound.com vfs.fs.iostat[,write_request] 425585
kvm-test4-vsvnf.vclound.com vfs.fs.iostat[,read_request] 8089
kvm-test4-vsvnf.vclound.com vfs.fs.iostat[,error] 0
kvm-test4-vsvnf.vclound.com vfs.fs.size[sda5,total] 17179869184
kvm-test4-vsvnf.vclound.com vfs.fs.size[sda5,used] 3006477107
kvm-test4-vsvnf.vclound.com vfs.fs.size[sda5,available] 13958643712
kvm-test4-vsvnf.vclound.com vfs.fs.size[sda2,total] 20401094656
kvm-test4-vsvnf.vclound.com vfs.fs.size[sda2,used] 46137344
kvm-test4-vsvnf.vclound.com vfs.fs.size[sda2,available] 19327352832
kvm-test4-vsvnf.vclound.com vfs.fs.size[sda1,total] 521142272
kvm-test4-vsvnf.vclound.com vfs.fs.size[sda1,used] 110100480
kvm-test4-vsvnf.vclound.com vfs.fs.size[sda1,available] 409993216
kvm-test4-vsvnf.vclound.com vfs.fs.inode[sda5,total] 8131584
kvm-test4-vsvnf.vclound.com vfs.fs.inode[sda5,used] 74754
kvm-test4-vsvnf.vclound.com vfs.fs.inode[sda5,available] 8056830
kvm-test4-vsvnf.vclound.com vfs.fs.inode[sda2,total] 2621440
kvm-test4-vsvnf.vclound.com vfs.fs.inode[sda2,used] 12
kvm-test4-vsvnf.vclound.com vfs.fs.inode[sda2,available] 2621428
kvm-test4-vsvnf.vclound.com vfs.fs.inode[sda1,total] 256000
kvm-test4-vsvnf.vclound.com vfs.fs.inode[sda1,used] 331
kvm-test4-vsvnf.vclound.com vfs.fs.inode[sda1,available] 255669

格式说明

主机名监控项监控值
kvm-test4-vsvnf.vclound.comvfs.fs.inode[sda1,available]255669
kvm-test4-vsvnf.vclound.comvfs.fs.inode[sda1,total]256000
kvm-test4-vsvnf.vclound.comvfs.fs.inode[sda1,used]331

提交方法

zabbix_sender -z zabbix-server-ipaddr -i /zabbix-record-fullpath.txt

这篇关于zabbix sender 配置方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/770725

相关文章

Oracle查询优化之高效实现仅查询前10条记录的方法与实践

《Oracle查询优化之高效实现仅查询前10条记录的方法与实践》:本文主要介绍Oracle查询优化之高效实现仅查询前10条记录的相关资料,包括使用ROWNUM、ROW_NUMBER()函数、FET... 目录1. 使用 ROWNUM 查询2. 使用 ROW_NUMBER() 函数3. 使用 FETCH FI

Git中恢复已删除分支的几种方法

《Git中恢复已删除分支的几种方法》:本文主要介绍在Git中恢复已删除分支的几种方法,包括查找提交记录、恢复分支、推送恢复的分支等步骤,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录1. 恢复本地删除的分支场景方法2. 恢复远程删除的分支场景方法3. 恢复未推送的本地删除分支场景方法4. 恢复

Python将大量遥感数据的值缩放指定倍数的方法(推荐)

《Python将大量遥感数据的值缩放指定倍数的方法(推荐)》本文介绍基于Python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处理,并将所得处理后数据保存为新的遥感影像... 本文介绍基于python中的gdal模块,批量读取大量多波段遥感影像文件,分别对各波段数据加以数值处

windos server2022的配置故障转移服务的图文教程

《windosserver2022的配置故障转移服务的图文教程》本文主要介绍了windosserver2022的配置故障转移服务的图文教程,以确保服务和应用程序的连续性和可用性,文中通过图文介绍的非... 目录准备环境:步骤故障转移群集是 Windows Server 2022 中提供的一种功能,用于在多个

Window Server2016加入AD域的方法步骤

《WindowServer2016加入AD域的方法步骤》:本文主要介绍WindowServer2016加入AD域的方法步骤,包括配置DNS、检测ping通、更改计算机域、输入账号密码、重启服务... 目录一、 准备条件二、配置ServerB加入ServerA的AD域(test.ly)三、查看加入AD域后的变

windos server2022里的DFS配置的实现

《windosserver2022里的DFS配置的实现》DFS是WindowsServer操作系统提供的一种功能,用于在多台服务器上集中管理共享文件夹和文件的分布式存储解决方案,本文就来介绍一下wi... 目录什么是DFS?优势:应用场景:DFS配置步骤什么是DFS?DFS指的是分布式文件系统(Distr

Window Server2016 AD域的创建的方法步骤

《WindowServer2016AD域的创建的方法步骤》本文主要介绍了WindowServer2016AD域的创建的方法步骤,文中通过图文介绍的非常详细,对大家的学习或者工作具有一定的参考学习价... 目录一、准备条件二、在ServerA服务器中常见AD域管理器:三、创建AD域,域地址为“test.ly”

NFS实现多服务器文件的共享的方法步骤

《NFS实现多服务器文件的共享的方法步骤》NFS允许网络中的计算机之间共享资源,客户端可以透明地读写远端NFS服务器上的文件,本文就来介绍一下NFS实现多服务器文件的共享的方法步骤,感兴趣的可以了解一... 目录一、简介二、部署1、准备1、服务端和客户端:安装nfs-utils2、服务端:创建共享目录3、服

Java 字符数组转字符串的常用方法

《Java字符数组转字符串的常用方法》文章总结了在Java中将字符数组转换为字符串的几种常用方法,包括使用String构造函数、String.valueOf()方法、StringBuilder以及A... 目录1. 使用String构造函数1.1 基本转换方法1.2 注意事项2. 使用String.valu

Python中使用defaultdict和Counter的方法

《Python中使用defaultdict和Counter的方法》本文深入探讨了Python中的两个强大工具——defaultdict和Counter,并详细介绍了它们的工作原理、应用场景以及在实际编... 目录引言defaultdict的深入应用什么是defaultdictdefaultdict的工作原理