大量enq: SQ - contention 等待导致系统卡顿

2024-08-23 09:20

本文主要是介绍大量enq: SQ - contention 等待导致系统卡顿,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Symptoms

上午收到邮件报警,提示有异常等待“log file sync”

等待事件邮件监控请参考

oracle常用监控脚本(纯干货,没有EMCC,ZABBIX也不怕)_oracle 监控及日常处理脚本-CSDN博客

查看OEM也能看到异常的波峰

OEM搭建可以参看这篇文章

EMCC13.5安装配置手册(详细版)-CSDN博客

登陆到主机查看等待事件,发现有超多的“enq: SQ - contention”

OEM下探也能看到是“enq: SQ - contention”等待

同时在OEM中可以看到影响最大的sql如下

select Object_SEQ.NEXTVAL from dual;

Cause

问题指向等待事件enq: SQ - contention,那这个等待如何引起的?

1. 等待事件背景
  • Oracle 数据库使用序列来生成唯一的整数值,通常用于生成主键值。为了确保序列生成的唯一性和顺序性,Oracle 使用 SQ 锁来控制对序列对象的并发访问。

  • 当多个会话试图同时访问相同的序列对象并请求下一个序列值时,如果序列无法立即提供下一个值,后续会话会进入 enq: SQ - contention 等待状态,直到持有锁的会话完成序列生成并释放锁。

2. 触发条件
  • 此等待事件通常在高并发环境中出现,特别是在多个会话频繁请求相同的序列对象时。这会导致竞争激烈,从而出现锁争用。

  • 常见的触发场景包括:大量并发的插入操作使用相同的序列生成主键,或者某些情况下序列的缓存大小设置过小,导致频繁的序列生成和锁定。

3. 影响
  • enq: SQ - contention 等待事件会导致数据库性能下降,特别是当大量并发会话长时间等待此锁时,整个应用程序的响应时间可能会受到影响。

了解了这些我们就可以知道应该是大量的插入并发,而且都在请求同一个sequence,导致争用,数据库中出现大量enq SQ的等待,造成系统的卡顿。由于该异常等待并不常见,我在wait event的监控脚本中并未添加,所以报出的是log file sync,其实也是系统卡顿的一种表现。

select Object_SEQ.NEXTVAL from dual;

Solution

知道了问题的原因,解决起来就相对简单一些,一般争用都是因为sequence的cache不够大,导致查询next指速度不够快,在OLTP系统中建议cache值要大一些

查询问题sequence的cache值和order

SQL> SELECT SEQUENCE_NAME, CACHE_SIZE, ORDER_FLAG FROM DBA_SEQUENCES where SEQUENCE_NAME='OBJECT_SEQ';SEQUENCE_NAME                  CACHE_SIZE O------------------------------ ---------- -OBJECT_SEQ                           20 N

如果sequence的默认cache是20,在高并发的OLTP系统中,需要改大一些,官方建议增加到10000。 这里一条sql拉出该用户下所有的sequence修改sql,修改后观察一段时间,一切正常。

SELECT 'ALTER SEQUENCE '||SEQUENCE_OWNER||'.'||SEQUENCE_NAME||' CACHE 10000;' FROM DBA_SEQUENCES where SEQUENCE_OWNER='USERNAME';

参考官方文档也贴在这里

RAC and Sequences (Doc ID 853652.1)

High "enq: SQ - contention" waits in RAC (Doc ID 2156730.1)

1) Find out the sequence that is causing the "enq: SQ - contention" either from the system state dump, hang analyze output, AWR, or ASH report.On AWR report, for example, look at the sql that causes most elapsed time and look for a sql that uses cache.In the AWR report that showed the top wait events shown in the above "SYMPTOMS" section , The sql statement, "Select SUPPLIER_SEQ.NEXTVAL from dual", is the sql that was responsible for most elapsed time. 2) Issue "show sequence <sequence name>" or "SELECT SEQUENCE_NAME, CACHE_SIZE, ORDER_FLAG FROM USER_SEQUENCES;" after connecting to the problem databaseFor example, if the sequence name is SUPPLIER_SEQ, issue "show sequence SUPPLIER_SEQ" or "SELECT SEQUENCE_NAME, CACHE_SIZE, ORDER_FLAG FROM USER_SEQUENCES;"3) If the sequence is NOT defined with CACHE and NOORDER option, the check if the attribute for the problem sequence can be changed to CACHE and NOORDER option. If the application requires that the problem sequence must NOT be defined using CACHE and NOORDER option, then work with the application development to minimize the use of that sequence.For more information, refer to the Document 853652.1 RAC and Sequences4) If the sequence is defined with CACHE and NOORDER option and if the cache size is 20, the default cache size, (or a small value like 100), increase the cache size to 10000 by issuingALTER SEQUENCE <sequence name> CACHE 10000;For example, if the sequence name is SUPPLIER_SEQ, issueALTER SEQUENCE SUPPLIER_SEQ CACHE 10000;

生产系统建议(OLTP)

1.如果sequence设置了cache,为了减少争用,建议将cache设置大一些(>1000)。

2.一个表或者一个业务功能使用一个sequence,不要多个表或者多个功能模块共用同一个sequence,减少争用的可能。

这篇关于大量enq: SQ - contention 等待导致系统卡顿的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1098982

相关文章

一次生产环境大量CLOSE_WAIT导致服务无法访问的定位过程

1.症状 生产环境的一个服务突然无法访问,服务的交互过程如下所示: 所有的请求都是通过网关进入,之后分发到后端服务。 现在的情况是用户服务无法访问商旅服务,网关有大量java.net.SocketTimeoutException: Read timed out报错日志,商旅服务也不断有日志打印,大多是回调和定时任务日志,所以故障点在网关和商旅服务,大概率是商旅服务无法访问导致网关超时。 后

Jasperreports+jaspersoft studio学习教程(八)- 报表分页和大量数据内存处理

9.1 设计报表模板 9.1.1 使用Table组件新建模板(步骤参考教程七)如下: 9.1.2 模板自带变量 $V{PAGE_NUMBER} :代表当前页数(可以是页码也可以是页数,通过TextField的计算时间的不同值来设置) $V{PAGE_COUNT} :当前页面中记录的数目 $V{groupname_COUNT} :   代表当前组的记录数 $V{COLUMN_NU

LabVIEW环境中等待FPGA模块初始化完成

这个程序使用的是LabVIEW环境中的FPGA模块和I/O模块初始化功能,主要实现等待FAM(Field-Programmable Gate Array Module,FPGA模块)的初始化完成,并处理初始化过程中的错误。让我们逐步分析各部分的功能: 1. Wait for FAM Initialization框架 此程序框架用于等待I/O模块成功初始化。如果在5秒钟内模块没有完成配

selenium的webdriver三种等待方式(显式等待WebDriverWait+implicitly_wait隐式等待+sleep强制等待)

隐式等待是等页面加载,不是等元素!!! 1、显式等待  一个显式等待是你定义的一段代码,用于等待某个条件发生然后再继续执行后续代码。显式等待是等元素加载!!! from selenium import webdriverfrom selenium.webdriver.common.by import Byfrom selenium.webdriver.support.ui import

log file sync等待事件

概念: 1、REDO组件: redolog buffer=>位于SGA中,是一块循环使用的内存区域,保存数据库变更的相关信息并以重做条目redoentries形式存储,包含DML及DDL语句; LGWR=>通过此进程把redo buffer的内容写到redo log file中; redo log file=>(在归档模式下被ARC n最终写入归档日志)。最少两组重做日志,每组最少

cisvc.exe进程占用大量内存和CPU的解决方法

推荐:用电脑尽情K歌、练歌,一展歌喉。打造自己的MTV音乐专辑,分享给所有网友   我的电脑现在反映非常的慢,打开任务管理器发现cisvc.exe这个进程占用了大量的内存和CPU,才导致变慢的。   上网查询之后得知,这是微软Windows 操作系统自带的一个程序,CIDAEMON.EXE和CISVC.EXE都不是木马程序,用来监测CIDAEMON.EXE内存信息的,防止可用内存太低

Java - 通过枚举避免大量 if-else

文章目录 Java - 通过枚举避免大量 if-else前提背景枚举实现1、定义枚举2、代码优化 拓展: Java - 通过枚举避免大量 if-else 前提背景 最近写代码有一个方法需要根据不同的 key 值往 Map 集合里存储 url,代码如下: public static void getUrl(String key, Map<String, String

【YashanDB知识库】表数据量不多,lob数据段有大量空间,插入数据报错

问题现象 clob段异常增长,导致磁盘空间满,应用无法使用数据库。 问题风险及影响 lob段空间未复用,lob段空间扩张很大,影响磁盘占用合理分配。 空间不够,插入报错,影响业务。 问题影响的版本 所有版本 问题发生原因 lob类型删除后,空间不会立即复用,需要等待UNDO_RETENTION时间后,空间才会复用。 普通的数据类型表空间段,普通数据被删后插入到undo空间,删除后

使用nssm将fastapi做成服务解决cmd使用命令启动卡顿问题

下载nssm 点击下载 我使用的是64位的操作系统所以选择64位win64 点击进去在地址栏里面输入cmd回车 输入 nssm.exe install "想要做成的服务名称" "python路径精确到python.exe" "程序路径要绝对路径" 然后就做出了服务并且启动 可以在服务管理控制台中(可以通过运行services.msc命令来打开)找到你的服务,并可以右键点击进行启动、停止

c++ 输入法导致玩家玩游戏的时候卡顿:ImmAssociateContext

用到的头文件 #pragma comment (lib ,"imm32.lib") (不需要#include <imm.h>) C++ 的代码如下:HIMC hIMC = nullHWND hWnd = FindWindow(NULL,"AAA"); // 获取窗口句柄,AAA为窗口的名字hIMC = ImmAssociateContext(hWnd, NUL