本文主要是介绍记录第一次线上OOM,程序假死问题处理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
记录第一次线上OOM,程序假死问题处理
记录第一次线上OOM,程序假死问题处理
新入职一家公司,作为一个菜鸡,直接上手改造项目,顺便吐槽下现在线上跑的程序半小时重启一次,菜鸟正式上手处理问题,前面的业务之类的就略过了。
linux小白处理类似问题重点如下!!!!!谢谢以下两位大佬整理的命令,撒花
输出日志的指令
JVM操作的其他指令这一篇对于之前不会linux的小白很有用,比如我,推荐!!!
现有的现象
在这里推荐一款在线工具https://gceasy.io/ ,真香,直接把日志上传就可以在线分析了,问题解决之前的gc情况如下
从这里可以看到堆满了,但是程序并没有报错OOM(黑人问号),而且一直在运行
用到的堆栈指令可以到这两篇博客看看,难找
linux小白处理类似问题重点如下!!!!!
输出日志的指令
JVM操作的其他指令这一篇对于之前不会linux的小白很有用,比如我,推荐!!!
最后解决方法
通过调用jmap -histo 309命令查看堆内对象存储情况,发现异常队列
分析此处代码,以及相关的代码逻辑,发现入队操作以前的人是用的多线程,而出队的操作是只创建了一个线程在跑,导致队列在半小时内被塞满,但是还是在发送消息。所以没有消费,但是有一直在发送数据到下游kafka。于是我加了线程池,多出10个线程处理发送数据逻辑。至此程序上线情况良好,未在出现程序假死情况以及堆中存满数据。完结撒花,第一篇博客记录成长~~
如果这篇博客对你有一丝丝的帮助,麻烦点个赞,谢谢~~否则年轻人,你不讲武德:
给你一套混元形意太极门闪电鞭!!!
linux小白处理类似问题重点如下!!!!!
linux小白处理类似问题重点如下!!!!!
输出日志的指令
JVM操作的其他指令这一篇对于之前不会linux的小白很有用,比如我,推荐!!!
这篇关于记录第一次线上OOM,程序假死问题处理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!