偶发专题

虹科免拆诊断案例 | 15款马自达3偶发高速CAN网络故障

CAN总线大家都不陌生,遇到这类故障,我们第一反应可能是用万用表测一下电压,看看存不存在短路、断路等问题。不过,使用万用表测得的电压值只是CAN总线上的平均电压,是一个大概的数值,并不能反映真实的CAN总线信号变化。如果想要更准确的信息,还是需要使用示波器来获取总线波形。 这里分享一个典型的总线故障波形,捕捉波形用的工具都是虹科Pico汽车示波器,软件为Picoscope6。 故障车是20

Nginx实战:故障处理_后端服务正常,nginx偶发502(Bad Gateway)

一、故障场景 用户访问服务偶发报错【502 Bad Gateway】,但是服务后端正常运行。架构如下: #mermaid-svg-4dDszusKEuPgIPlt {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-4dDszusKEuPgIPlt .erro

案例-insert value偶发慢分析

业务insert value偶发变慢,当我去查看活动会话的时候写入慢问题已经缓解了。 后来发现写入慢问题持续不到半分钟,insert value写入时间1-2s,写个抓活动会话的脚本还是能拿到会话信息: wait_event | count---------------------+-------[null] | 11WALRead

记录接口请求偶发504 Gateway Time-out问题

项目场景: 我们将服务部署到A公司服务器中,使用了共五台服务器,分别是:1.NG服务器 2.日志服务器 3.缓存服务器 4.应用服务器1 5.应用服务器2 。而请求过来首先到达的是他们的物理代理服务器,然后再转发请求到我们的ng服务器,然后再到应用服务器。 问题描述 接口请求经常会网络繁忙,报504 Gateway Time-out,然后返回了个. 原因分析: 网络带宽问题:

开启 Keep-Alive 可能会导致http 请求偶发失败

大家好,我是蓝胖子,说起提高http的传输效率,很多人会开启http的Keep-Alive选项,这会http请求能够复用tcp连接,节省了握手的开销。但开启Keep-Alive真的没有问题吗?我们来细细分析下。 最大空闲时间造成请求失败 通常我们开启Keep-Alive后 ,服务端还会设置连接的最大空闲时间,这样能保证在没有请求发生时,及时释放连接,不会让过多的tcp连接白白占用机器资源。

360企业安全浏览器兼容模式显示异常某个内容不显示 偶发现象 本地无法复现情况js

360企业安全浏览器兼容模式显示异常 ,现象测试环境频发 ,本地连测试无法复现,线上反馈问题。 出现问题的电脑为windows且使用360企业安全浏览器打开兼容模式可复现 复现过程: 不直接点击超链接跳转页面 ,登录后直接通过出问题的页面的全链接访问成功复现问题。 解决方案和过程 通过控制台打印出localStorage里的内容看所取得数据是否存在 ,在看使用的方法是否兼容不同浏览器

记1次OpenFeign请求偶发解析失败问题

记1次OpenFeign请求,遇到返回的结果无法解析的情况 feign.codec.DecodeException: Error while extracting response for type [xxxxxxx] and content type [application/json;charset=UTF-8]; nested exception is org.springfra

记录job执行批量数据偶发执行失败问题

业务背景 job读取一个中间表数据,执行频率为10min,读取状态未处理数据,同步到第三方系统 代码处理逻辑 1.查询中间表数据,条件:状态未处理 + limit 100 2.循环中处理如下逻辑 A 调用第三方系统,同步状态 B 同步成功,更新中间表处理结果 更新逻辑具体为: 1>根据ID+版本号,再次查询中间表。目的:校验数据存在性+乐观锁 2>更新中间表数据 代码 Li

记录:排查create_ap偶发无法开启自发AP的问题

背景说明: 系统:Xubuntu16.04;内核:4.14;无线网卡:EDIMAX EW-7822UAC 关于无线网卡的驱动安装和create_ap配置参考博文:Xubuntu16.04系统中使用EDIMAX EW-7822UAC无线网卡开启5G自发AP 目录 问题记录排查过程解决办法 问题记录   最近新买了一个EDIMAX EW-7822UAC无线网卡,安装了驱动,配

Redis偶发Cannot determine a partition for slot报错问题

Redis偶发Cannot determine a partition for slot报错问题 一、背景二、问题定位1、报错位置2、lettuce定时刷新任务3、本地缓存masterCache先清理后写入的问题 三、解决方案:版本升级 一、背景 线上系统(springboot)经常报错Cannot determine a partition for slot,搜索过后发现已有的

生产环境k8s偶发超时问题排查及解决

前言: 凡是有明确报错的问题,都是能很快解决的,真正难以解决和排查的,是偶发且笼统报错的问题。 这里记录整个解决的过程,期间有走过弯路,有思维局限,但庆幸最终找到了原因,正常把我们系统上线到 k8s 平台了。   问题表现:   生产某套应用访问时,偶尔会报 timed out 。相同的配置在 开发、测试、预生产都能正常运行。    排查思路:    1、 首先,因为这个问题是偶发性的

虹科免拆诊断 | 2011 款奔驰 S350L 车行驶中发动机偶发熄火

故障现象 一辆2011款奔驰S350L车,搭载274发动机,累计行驶里程约为23万km。车主反映,车辆在行驶中发动机突然熄火,且无法再次起动着机,请求救援。 故障诊断 将车拖回维修厂后检查,起动发动机,起动机正常运转,但发动机无法着机。进一步与车主交流得知,该故障为偶发性故障,故障发生频率较低,有时几个月出现一次,故障现象出现后有时需要停车等待一段时间可再次起动着机。为此故障该车在其他维修厂