应用发版期间服务响应超时

2024-03-07 00:32

本文主要是介绍应用发版期间服务响应超时,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

描述

负责的应用正式环境发版期间,下游应用调用服务告警,查看监控发现这个时间段内偶发下游调用查询接口超时,服务耗时波动如下图:

image

并且当应用的所有节点服务发布完成后,偶发的接口超时告警自动恢复,因此盲猜是服务发布时的抖动导致该问题,于是有以下几个猜测:

  1. 服务注册发现流程问题:节点下线后未及时从注册中心剔除下线节点,导致下游调用到了下线节点
  2. 服务注册发现流程问题:节点上线后先在注册中心注册节点,再开放服务端口,导致中间的时间差服务无响应
  3. 资源初始化问题:节点上线后资源未初始化完成,下游调用服务后资源首次初始化耗时长导致服务超时

排查

每个请求都对应一个唯一的traceId做链路追踪,通过下游服务调用超时错误日志中对应的traceId,找到该请求路由到的具体容器节点后,查看日志发现,应用于2021-07-16 11:41:42启动完成,而超时请求于2021-07-16 11:41:47路由到该节点,也就是节点先启动注册完成后,再出现服务响应超时的情况,因此猜想1排除。

接着排查该节点启动后的接口响应耗时情况,于是查看日志数据,前10条记录。该几个请求链路均为查询接口,请求的流程图如下:

image

由日志可得,该节点应用启动完成后,前3次服务响应耗时正常,第4-7次的响应耗时明显过长,但从第8次起响应耗时又恢复正常。于是通过以上几个链路的traceId查看每个请求的调用链路情况:

  1. 第1次请求直接命中tair缓存,响应耗时正常。
  2. 第2次请求直接命中堆内缓存,响应耗时正常。
  3. 第3次请求直接命中堆内缓存,响应耗时正常。
  4. 第4次请求缓存命中失败,请求数据库查询,数据库执行耗时超长。
  5. 第5次请求缓存命中失败,请求数据库查询,数据库执行耗时超长。
  6. 第6次请求缓存命中失败,请求数据库查询,数据库执行耗时超长。
  7. 第7次请求缓存命中失败,请求数据库查询,数据库执行耗时超长。

很明显超时的原因是因为缓存命中失败后请求数据库查询而导致,但排查后续中的链路即使出现查询数据库也未出现服务响应耗时过长的情况,因此怀疑是数据库连接未初始化的问题:应用刚启动完成后,请求查询数据库前需要额外请求配置中心初始化相关配置并且创建数据库连接,导致的耗时超长的情况。

咨询同事后得知应用在已经配置开启了数据库连接预热,于是去查看预热配置说明:是否预热最小连接数。然后再查看连接池配置,发现当前的连接池配置的最小连接数为0。也就是说应用启动时预热了个寂寞,导致应用启动后数据库连接池数量为0,当请求到该应用后前几次请求均需要创建新数据库连接因而耗时较长,而后续请求直接复用连接池连接因此后续请求处理耗时恢复正常。

解决

配置中心平台修改应用的连接池配置,最小连接数从0修改为5,保证应用在启动完成后数据库连接池已经初始化完成。等待下次应用迭代发布时监控新发布应用的请求耗时情况。

这篇关于应用发版期间服务响应超时的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/781873

相关文章

Feign Client超时时间设置不生效的解决方法

《FeignClient超时时间设置不生效的解决方法》这篇文章主要为大家详细介绍了FeignClient超时时间设置不生效的原因与解决方法,具有一定的的参考价值,希望对大家有一定的帮助... 在使用Feign Client时,可以通过两种方式来设置超时时间:1.针对整个Feign Client设置超时时间

Python中随机休眠技术原理与应用详解

《Python中随机休眠技术原理与应用详解》在编程中,让程序暂停执行特定时间是常见需求,当需要引入不确定性时,随机休眠就成为关键技巧,下面我们就来看看Python中随机休眠技术的具体实现与应用吧... 目录引言一、实现原理与基础方法1.1 核心函数解析1.2 基础实现模板1.3 整数版实现二、典型应用场景2

一文详解SpringBoot响应压缩功能的配置与优化

《一文详解SpringBoot响应压缩功能的配置与优化》SpringBoot的响应压缩功能基于智能协商机制,需同时满足很多条件,本文主要为大家详细介绍了SpringBoot响应压缩功能的配置与优化,需... 目录一、核心工作机制1.1 自动协商触发条件1.2 压缩处理流程二、配置方案详解2.1 基础YAML

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

Android Kotlin 高阶函数详解及其在协程中的应用小结

《AndroidKotlin高阶函数详解及其在协程中的应用小结》高阶函数是Kotlin中的一个重要特性,它能够将函数作为一等公民(First-ClassCitizen),使得代码更加简洁、灵活和可... 目录1. 引言2. 什么是高阶函数?3. 高阶函数的基础用法3.1 传递函数作为参数3.2 Lambda

Linux上设置Ollama服务配置(常用环境变量)

《Linux上设置Ollama服务配置(常用环境变量)》本文主要介绍了Linux上设置Ollama服务配置(常用环境变量),Ollama提供了多种环境变量供配置,如调试模式、模型目录等,下面就来介绍一... 目录在 linux 上设置环境变量配置 OllamPOgxSRJfa手动安装安装特定版本查看日志在

如何解决Spring MVC中响应乱码问题

《如何解决SpringMVC中响应乱码问题》:本文主要介绍如何解决SpringMVC中响应乱码问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Spring MVC最新响应中乱码解决方式以前的解决办法这是比较通用的一种方法总结Spring MVC最新响应中乱码解

Java中&和&&以及|和||的区别、应用场景和代码示例

《Java中&和&&以及|和||的区别、应用场景和代码示例》:本文主要介绍Java中的逻辑运算符&、&&、|和||的区别,包括它们在布尔和整数类型上的应用,文中通过代码介绍的非常详细,需要的朋友可... 目录前言1. & 和 &&代码示例2. | 和 ||代码示例3. 为什么要使用 & 和 | 而不是总是使

SpringCloud之LoadBalancer负载均衡服务调用过程

《SpringCloud之LoadBalancer负载均衡服务调用过程》:本文主要介绍SpringCloud之LoadBalancer负载均衡服务调用过程,具有很好的参考价值,希望对大家有所帮助,... 目录前言一、LoadBalancer是什么?二、使用步骤1、启动consul2、客户端加入依赖3、以服务

Python循环缓冲区的应用详解

《Python循环缓冲区的应用详解》循环缓冲区是一个线性缓冲区,逻辑上被视为一个循环的结构,本文主要为大家介绍了Python中循环缓冲区的相关应用,有兴趣的小伙伴可以了解一下... 目录什么是循环缓冲区循环缓冲区的结构python中的循环缓冲区实现运行循环缓冲区循环缓冲区的优势应用案例Python中的实现库