生产问题总结(集群或单节点挂掉)

2024-02-26 03:08

本文主要是介绍生产问题总结(集群或单节点挂掉),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.问题

最近一周真是不太平,应用几乎每天都会挂,而且还每天的原因都不一样

2.以下就几种原因简单的说下

1)内存溢出

现象:内存告警,拿不到数据库连接,高full gc

分析:增加jvm参数,full gc时生成dump日志,分析dump日志,发现有一个查询占了内存的60+%。。。,看内存占比前几位的全是string对象,而且全是重复的,

那么就直接去看这个查询啊,一看这个查询的sqlmap,发现里面用了in,而当时生产环境这条sql in后面带了20000+的id去查询db,而db根据id来分库分表,然后根据id,这个sql会落到其中的700+张表,呵呵,那么问题来了,这台应用就会建立700+的db链接和700+的prepareStatement,大量的string对象其实就是这个prepareStatement,每个占了内存的0.03%,700+就占了差不多21%,进而导致整个应用内存吃紧,最终OOM

2)还tm是内存溢出

现象:内存告警,高full gc

分析:还是看应用的dump日志,还是发现有个查询占用了大量内存,不过这次和上次的问题不一样了。。。查询里面用了ibatis的内存分页,而非常悲剧的是,这条sql查询的结果集有600W+,而且查的是整条记录,所以内存再次撑爆。。。

3)服务器内存告警

现象:收到服务器内存监控告警

  分析,立马去服务器上执行top命令,看内存的使用情况,发现应用的进程占了40%左右的内存,排在第二位,而排在第一位的居然是一个root进程,占了50%左右的内存,导致应用的内存不够用,后来查了下,发现是中间件组做的一个日志采集服务。。。什么鬼,坑死了


3.总结

1.系统宕机时,先看下应用的日志是否有OOM的异常,如果有,看应用的dump日志,分析导致OOM的原因;如果没有OOM,则看服务器当时的内存使用情况,看是不是有别的进程占用了太多的服务器的资源,导致应用无法获取资源;

2.写sql时一定要注意,就拿我们的应用来说,ORM框架用的ibatis,一般来说,ibatis的内存分页不建议使用,因为它是将结果集一次全部load如内存,然后再在内存中分页将结果返回,当时结果集很大时,会耗尽系统的内存;sql中的in查询也是,不建议使用,如果非要使用的话,建议限制下in后面所带字符串的数量,比如不能超过1000个;总之一个要控制sql本身的长度,同时也要注意下控制结果集的大小,结果集很大时建议采用分页查询,避免一次查询出过多的数据

这篇关于生产问题总结(集群或单节点挂掉)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/747539

相关文章

SpringBoot启动报错的11个高频问题排查与解决终极指南

《SpringBoot启动报错的11个高频问题排查与解决终极指南》这篇文章主要为大家详细介绍了SpringBoot启动报错的11个高频问题的排查与解决,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一... 目录1. 依赖冲突:NoSuchMethodError 的终极解法2. Bean注入失败:No qu

MySQL新增字段后Java实体未更新的潜在问题与解决方案

《MySQL新增字段后Java实体未更新的潜在问题与解决方案》在Java+MySQL的开发中,我们通常使用ORM框架来映射数据库表与Java对象,但有时候,数据库表结构变更(如新增字段)后,开发人员可... 目录引言1. 问题背景:数据库与 Java 实体不同步1.1 常见场景1.2 示例代码2. 不同操作

如何解决mysql出现Incorrect string value for column ‘表项‘ at row 1错误问题

《如何解决mysql出现Incorrectstringvalueforcolumn‘表项‘atrow1错误问题》:本文主要介绍如何解决mysql出现Incorrectstringv... 目录mysql出现Incorrect string value for column ‘表项‘ at row 1错误报错

如何解决Spring MVC中响应乱码问题

《如何解决SpringMVC中响应乱码问题》:本文主要介绍如何解决SpringMVC中响应乱码问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Spring MVC最新响应中乱码解决方式以前的解决办法这是比较通用的一种方法总结Spring MVC最新响应中乱码解

java常见报错及解决方案总结

《java常见报错及解决方案总结》:本文主要介绍Java编程中常见错误类型及示例,包括语法错误、空指针异常、数组下标越界、类型转换异常、文件未找到异常、除以零异常、非法线程操作异常、方法未定义异常... 目录1. 语法错误 (Syntax Errors)示例 1:解决方案:2. 空指针异常 (NullPoi

pip无法安装osgeo失败的问题解决

《pip无法安装osgeo失败的问题解决》本文主要介绍了pip无法安装osgeo失败的问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 进入官方提供的扩展包下载网站寻找版本适配的whl文件注意:要选择cp(python版本)和你py

解决Java中基于GeoTools的Shapefile读取乱码的问题

《解决Java中基于GeoTools的Shapefile读取乱码的问题》本文主要讨论了在使用Java编程语言进行地理信息数据解析时遇到的Shapefile属性信息乱码问题,以及根据不同的编码设置进行属... 目录前言1、Shapefile属性字段编码的情况:一、Shp文件常见的字符集编码1、System编码

Spring MVC使用视图解析的问题解读

《SpringMVC使用视图解析的问题解读》:本文主要介绍SpringMVC使用视图解析的问题解读,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Spring MVC使用视图解析1. 会使用视图解析的情况2. 不会使用视图解析的情况总结Spring MVC使用视图

Redis解决缓存击穿问题的两种方法

《Redis解决缓存击穿问题的两种方法》缓存击穿问题也叫热点Key问题,就是⼀个被高并发访问并且缓存重建业务较复杂的key突然失效了,无数的请求访问会在瞬间给数据库带来巨大的冲击,本文给大家介绍了Re... 目录引言解决办法互斥锁(强一致,性能差)逻辑过期(高可用,性能优)设计逻辑过期时间引言缓存击穿:给

Java程序运行时出现乱码问题的排查与解决方法

《Java程序运行时出现乱码问题的排查与解决方法》本文主要介绍了Java程序运行时出现乱码问题的排查与解决方法,包括检查Java源文件编码、检查编译时的编码设置、检查运行时的编码设置、检查命令提示符的... 目录一、检查 Java 源文件编码二、检查编译时的编码设置三、检查运行时的编码设置四、检查命令提示符