本文主要是介绍大数据之LibrA数据库系统告警处理(ALM-12010 Manager主备节点间心跳中断),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
告警解释
当主Manager节点在7秒内没有收到备Manager节点的心跳信号时,产生该告警。
当主Manager节点收到备Manager节点的心跳信号后,告警恢复。
告警属性
告警参数
对系统的影响
如果主Manager进程异常,主备倒换无法进行,影响业务。
可能原因
主备Manager节点间链路异常。
处理步骤
检查主备Manager服务器间的网络是否正常。
- 打开FusionInsight Manager页面,在告警列表中,单击此告警所在行,在告警详情中,查看该告警的备Manager服务器(即Peer Manager)IP地址。
- 使用PuTTY工具,以root用户登录主Manager服务器。
- 执行ping 备Manager心跳IP地址命令检查备Manager服务器是否可达。
- 是,执行步骤 6。
- 否,执行步骤 4。
- 联系网络管理员查看是否为网络故障。
- 是,执行步骤 5。
- 否,执行步骤 6。
- 修复网络故障,查看告警列表中,该告警是否已清除。
- 是,处理完毕。
- 否,执行步骤 6。
收集故障信息。
- 在FusionInsight Manager界面,单击“系统设置 > 日志下载”。
- 在“服务”下拉框中勾选如下节点信息,单击“确定”。
- OmmServer
- Controller
- NodeAgent
- 设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟,单击“下载”。
这篇关于大数据之LibrA数据库系统告警处理(ALM-12010 Manager主备节点间心跳中断)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!