该主机与 Cloudera Manager Server 失去联系的时间过长。 该主机未与 Host Monitor 建立联系

本文主要是介绍该主机与 Cloudera Manager Server 失去联系的时间过长。 该主机未与 Host Monitor 建立联系,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

该主机与 Cloudera Manager Server 失去联系的时间过长。 该主机未与 Host Monitor 建立联系

这个去集群主机cm界面上看会出现这个错误
排查思路:

  1. 一般比较常见的原因可能是出问题的主机和集群主节点的时间对应不上了。
  2. 还有就是cm agent服务出现问题了

去该主机的后台进行查看

1.1 如果集群配置了ntp时间同步协议

查看问题节点的ntp服务是否正常启动

systemctl status ntpd

[root@cloudcdp02 ~]# systemctl status ntpd
● ntpd.service - Network Time Service
Loaded: loaded (/usr/lib/systemd/system/ntpd.service; enabled; vendor preset: disabled)
Active: active (running) since 一 2024-03-25 00:53:52 CST; 1 weeks 3 days ago
Process: 717 ExecStart=/usr/sbin/ntpd -u ntp:ntp $OPTIONS (code=exited, status=0/SUCCESS)
Main PID: 726 (ntpd)
CGroup: /system.slice/ntpd.service
└─726 /usr/sbin/ntpd -u ntp:ntp -g
3月 25 00:53:52 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c012 02 freq_set kernel 4.576 PPM
3月 25 00:53:52 cloudcdp02.hadoop.com systemd[1]: Started Network Time Service.
3月 25 00:53:57 cloudcdp02.hadoop.com ntpd[726]: Listen normally on 4 eth0 172.21.32.231 UDP 123
3月 25 00:53:57 cloudcdp02.hadoop.com ntpd[726]: Listen normally on 5 eth0 fe80::f87f:eaff:fe8b:1600 UDP 123
3月 25 00:53:57 cloudcdp02.hadoop.com ntpd[726]: new interface(s) found: waking up resolver
3月 25 00:58:21 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c61c 0c clock_step +0.293029 s
3月 25 00:58:21 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c614 04 freq_mode
3月 25 00:58:22 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c618 08 no_sys_peer
3月 25 01:14:01 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c612 02 freq_set kernel 4.919 PPM
3月 25 01:14:01 cloudcdp02.hadoop.com ntpd[726]: 0.0.0.0 c615 05 clock_sync

这种是正常已经启动好的
如果没有启动,就重启一下ntp服务

systemctl start ntpd

在查看一下ntp是否与主节点进行时间同步

ntpq -p

在这里插入图片描述
可以看到remote下面的主机前面有一个*,代表着正在与cloudcdp01进行时间同步,如果 *在local前面,就代表着与本地时间同步

如果offset下面的数字时间偏差太大的话,光靠ntp可能回不过来,这时候需要手动和主节点进行时间同步
手动同步命令

ntpdate -s 主节点ip

重启agent服务

 systemctl restart cloudera-scm-agent.service

1.2. 如果集群没有配置了ntp时间同步协议

查看主节点的时间

date

然后在回到问题节点上面,直接修改问题节点的系统时间,让其与之同步
同步时间

sudo date -s "2024-04-02 12:30:00"

重启agent服务

 systemctl restart cloudera-scm-agent.service

2.如果agent服务出现问题

查看agent服务状态

 systemctl status cloudera-scm-agent.service

如果发现agent服务停止就重新启动一下,如果发现agent服务没有了,就需要重新安装agent服务
重新安装agent服务,直接从主节点的/var/www/html里面发一份agent服务安装包,rpm安装一下就好了
服务安装好后,需要修改agent服务的配置文件,不然会出现agent服务无法识别主机的报错

修改agent服务的配置

#进入配置服务目录
cd /etc/cloudera-scm-agent
#打开配置文件
vim config.ini

修改server_host后面的地址,把localhoust改为主节点ip。

在这里插入图片描述

然后重启agent服务

 systemctl restart cloudera-scm-agent.service

这篇关于该主机与 Cloudera Manager Server 失去联系的时间过长。 该主机未与 Host Monitor 建立联系的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/875896

相关文章

问题:第一次世界大战的起止时间是 #其他#学习方法#微信

问题:第一次世界大战的起止时间是 A.1913 ~1918 年 B.1913 ~1918 年 C.1914 ~1918 年 D.1914 ~1919 年 参考答案如图所示

Windows/macOS/Linux 安装 Redis 和 Redis Desktop Manager 可视化工具

本文所有安装都在macOS High Sierra 10.13.4进行,Windows安装相对容易些,Linux安装与macOS类似,文中会做区分讲解 1. Redis安装 1.下载Redis https://redis.io/download 把下载的源码更名为redis-4.0.9-source,我喜欢跟maven、Tomcat放在一起,就放到/Users/zhan/Documents

时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测

时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测 目录 时序预测 | MATLAB实现LSTM时间序列未来多步预测-递归预测基本介绍程序设计参考资料 基本介绍 MATLAB实现LSTM时间序列未来多步预测-递归预测。LSTM是一种含有LSTM区块(blocks)或其他的一种类神经网络,文献或其他资料中LSTM区块可能被描述成智能网络单元,因为

java中查看函数运行时间和cpu运行时间

android开发调查性能问题中有一个现象,函数的运行时间远低于cpu执行时间,因为函数运行期间线程可能包含等待操作。native层可以查看实际的cpu执行时间和函数执行时间。在java中如何实现? 借助AI得到了答案 import java.lang.management.ManagementFactory;import java.lang.management.Threa

SQL Server中,查询数据库中有多少个表,以及数据库其余类型数据统计查询

sqlserver查询数据库中有多少个表 sql server 数表:select count(1) from sysobjects where xtype='U'数视图:select count(1) from sysobjects where xtype='V'数存储过程select count(1) from sysobjects where xtype='P' SE

SQL Server中,always on服务器的相关操作

在SQL Server中,建立了always on服务,可用于数据库的同步备份,当数据库出现问题后,always on服务会自动切换主从服务器。 例如192.168.1.10为主服务器,12为从服务器,当主服务器出现问题后,always on自动将主服务器切换为12,保证数据库正常访问。 对于always on服务器有如下操作: 1、切换主从服务器:假如需要手动切换主从服务器时(如果两个服务

SQL Server中,isnull()函数以及null的用法

SQL Serve中的isnull()函数:          isnull(value1,value2)         1、value1与value2的数据类型必须一致。         2、如果value1的值不为null,结果返回value1。         3、如果value1为null,结果返回vaule2的值。vaule2是你设定的值。        如

SQL Server中,添加数据库到AlwaysOn高可用性组条件

1、将数据添加到AlwaysOn高可用性组,需要满足以下条件: 2、更多具体AlwaysOn设置,参考:https://msdn.microsoft.com/zh-cn/library/windows/apps/ff878487(v=sql.120).aspx 注:上述资源来自MSDN。

SQL Server中,用Restore DataBase把数据库还原到指定的路径

restore database 数据库名 from disk='备份文件路径' with move '数据库文件名' to '数据库文件放置路径', move '日志文件名' to '日志文件存放置路径' Go 如: restore database EaseWe from disk='H:\EaseWe.bak' with move 'Ease

时间服务器中,适用于国内的 NTP 服务器地址,可用于时间同步或 Android 加速 GPS 定位

NTP 是什么?   NTP 是网络时间协议(Network Time Protocol),它用来同步网络设备【如计算机、手机】的时间的协议。 NTP 实现什么目的?   目的很简单,就是为了提供准确时间。因为我们的手表、设备等,经常会时间跑着跑着就有误差,或快或慢的少几秒,时间长了甚至误差过分钟。 NTP 服务器列表 最常见、熟知的就是 www.pool.ntp.org/zo