【友云音】【问题排查记录-2】Agent成环问题

2024-01-03 20:30

本文主要是介绍【友云音】【问题排查记录-2】Agent成环问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

问题现象

agent停止,数据上传异常。查询业务数据后发现,业务数据也异常

问题分析

在10.1.228.172的agent目录下的在httpchanle.log中发现,这个机器的agent自发现把10.1.228.176当成了跳板机。

2019-06-18 21:40:38 ReceiverRunable - [ INFO ] 设置自动发现的跳板机IP= 10.1.228.176 
2019-06-18 21:40:39 SendRunable - [ INFO ] 发送ping信号 
2019-06-18 21:40:39 ReceiverRunable - [ INFO ] 接收到10.1.228.172发送的ping信号 
2019-06-18 21:40:39 ReceiverRunable - [ INFO ] 接收到10.1.228.176发送的pong信号

又看了下errorCollection.log,确认了数据确实再向10.1.228.176,发送数据。

2019-06-18 21:46:14 HttpClientUtil - [ ERROR ]  url = https://10.1.228.176:44444/send/api/metric
2019-06-18 21:46:14 ForwardEventSink - [ ERROR ]  Sink send data happends IOException !!
java.io.IOException: Timeout waiting for connection from poolat ycm.agent.util.send.HttpClientUtil.sendPost(HttpClientUtil.java:186)at ycm.agent.util.send.HttpClientUtil.send(HttpClientUtil.java:110)at ycm.agent.util.send.SinkTool.sendPost(SinkTool.java:39)at ycm.agent.appmoni.trace.ForwardEventSink.sendTraceData(ForwardEventSink.java:214)at ycm.agent.appmoni.trace.ForwardEventSink.dealEventData(ForwardEventSink.java:176)at ycm.agent.appmoni.trace.ForwardEventSink.process(ForwardEventSink.java:67)at org.apache.flume.sink.DefaultSinkProcessor.process(DefaultSinkProcessor.java:68)at org.apache.flume.SinkRunner$PollingRunner.run(SinkRunner.java:148)at java.lang.Thread.run(Thread.java:662)

去10.1.228.176看同样日志发现,这台机器的agent把数据发往了10.1.228.173上发送数据。在6月18号晚,云端新架构上线,agent自己连接不到这样所有的agent都这么做,使agent行程了闭环,数据在内网发不出来。

代码逻辑

当有两台以上的服务器能连公网的情况下:

2018年6月~2018年11月这个版本的agent的自发现跳板机逻辑是:如果当前agent检测agent和云端不能通信,那么他就会实时的去找在同一网段的别的机器的agent,认为他是跳板机,把数据发向他。

新版探针,也有这个自发现跳板机的功能,但是加了一层判断,每隔几分钟就检测本agent和云端的通信状况,如果可以通信,就用本agent把数据发往云端,进而避免了成环解不了套的局面。

解决办法

临时解决

重启其中一台agent,让环打开,各自把数据发往云端。

永久解决

更换最新版的探针

这篇关于【友云音】【问题排查记录-2】Agent成环问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/566956

相关文章

springboot循环依赖问题案例代码及解决办法

《springboot循环依赖问题案例代码及解决办法》在SpringBoot中,如果两个或多个Bean之间存在循环依赖(即BeanA依赖BeanB,而BeanB又依赖BeanA),会导致Spring的... 目录1. 什么是循环依赖?2. 循环依赖的场景案例3. 解决循环依赖的常见方法方法 1:使用 @La

Spring Boot 配置文件之类型、加载顺序与最佳实践记录

《SpringBoot配置文件之类型、加载顺序与最佳实践记录》SpringBoot的配置文件是灵活且强大的工具,通过合理的配置管理,可以让应用开发和部署更加高效,无论是简单的属性配置,还是复杂... 目录Spring Boot 配置文件详解一、Spring Boot 配置文件类型1.1 applicatio

MySQL INSERT语句实现当记录不存在时插入的几种方法

《MySQLINSERT语句实现当记录不存在时插入的几种方法》MySQL的INSERT语句是用于向数据库表中插入新记录的关键命令,下面:本文主要介绍MySQLINSERT语句实现当记录不存在时... 目录使用 INSERT IGNORE使用 ON DUPLICATE KEY UPDATE使用 REPLACE

SpringBoot启动报错的11个高频问题排查与解决终极指南

《SpringBoot启动报错的11个高频问题排查与解决终极指南》这篇文章主要为大家详细介绍了SpringBoot启动报错的11个高频问题的排查与解决,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一... 目录1. 依赖冲突:NoSuchMethodError 的终极解法2. Bean注入失败:No qu

Python 中的异步与同步深度解析(实践记录)

《Python中的异步与同步深度解析(实践记录)》在Python编程世界里,异步和同步的概念是理解程序执行流程和性能优化的关键,这篇文章将带你深入了解它们的差异,以及阻塞和非阻塞的特性,同时通过实际... 目录python中的异步与同步:深度解析与实践异步与同步的定义异步同步阻塞与非阻塞的概念阻塞非阻塞同步

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

MySQL新增字段后Java实体未更新的潜在问题与解决方案

《MySQL新增字段后Java实体未更新的潜在问题与解决方案》在Java+MySQL的开发中,我们通常使用ORM框架来映射数据库表与Java对象,但有时候,数据库表结构变更(如新增字段)后,开发人员可... 目录引言1. 问题背景:数据库与 Java 实体不同步1.1 常见场景1.2 示例代码2. 不同操作

如何解决mysql出现Incorrect string value for column ‘表项‘ at row 1错误问题

《如何解决mysql出现Incorrectstringvalueforcolumn‘表项‘atrow1错误问题》:本文主要介绍如何解决mysql出现Incorrectstringv... 目录mysql出现Incorrect string value for column ‘表项‘ at row 1错误报错

如何解决Spring MVC中响应乱码问题

《如何解决SpringMVC中响应乱码问题》:本文主要介绍如何解决SpringMVC中响应乱码问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Spring MVC最新响应中乱码解决方式以前的解决办法这是比较通用的一种方法总结Spring MVC最新响应中乱码解

pip无法安装osgeo失败的问题解决

《pip无法安装osgeo失败的问题解决》本文主要介绍了pip无法安装osgeo失败的问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 进入官方提供的扩展包下载网站寻找版本适配的whl文件注意:要选择cp(python版本)和你py