Rejected the attempt to advance SCN问题的分析处理

2024-05-27 18:28

本文主要是介绍Rejected the attempt to advance SCN问题的分析处理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、故障描述
5月8日下午12点30分左右,应用厂家反馈,IP是130.XXXXX(jyfx)的数据库无法连接,检查数据库告警日志,提示内容如下:
Rejected the attempt to advance SCN over limit by 124166 hours worth to 0x15cb.a9a21069, by distributed transaction remote end, remote DB: GZJYFX.
 Client info : DB logon user GP_USER, machine jt6, program sqlplus@jt6 (TNS V1-V3), and OS user root

由此得知,该数据库已被41(GZJYFX)感染,接着排查41被(13XXXXX17)WYGDB数据库感染,而此库是被ITFCDB库的SCN感染,如下图所示:

和应用沟通后发现其在11::47分,在数据库上创建了一个到总部的dblink。和局方沟通后我们针对信息化部当前所有使用的数据库进行排查,经分测数据库11g已经全感染,和局方沟通后我们最初方案是先断掉和B域的dblink。但数据库dblink每个库均有,网状连接。于14:30左右,发现B域CRM也被传染,多个Oracle10g的多个数据库被感染,其中,核心的计费系统因为SCN的感染,数据库异常宕机。

二、故障定位
在接到应用厂家的反馈并找到数据库异常关闭的原因后,我发迅速与局方负责人进行沟通,定位到本次故障的原因:应用人员在沃易管的数据库创建了一个新dblink,该dblink是连接总部的数据库,由此导致该库被感染,因该库与本地多个库也存在dblink连接,导致本地多个库被感染。
三、处理和结果
1.定位故障原因,迅速与局方负责人确定数据库恢复方案;
2.将受影响的数据库按照重要性进行故障排除,在短时间内迅速恢复核心数据库的运行,保证了前端应用的正常运行,将影响减轻到最小化;
3.针对数据库的重要程度,逐一打上最新的扩展补丁(因此次补丁需要扩展服务权限下载,经过局方协调后,花费了一些时间均获取到了需要的补丁)。实施较顺利,最终受感染数据库在补丁实施后均正常运行;
4.根据不同的版本进行了不同的实施方案,贵州联通信息化的数据库10g主要为10.2.0.4.12和10.2.0.5,实施的方案如下:
安装补丁名称    补丁编号    验证补丁是否安装
DATABASE PATCH SET UPDATE 10.2.0.4.12    Patch 14121009    $ORACLE_HOME/OPatch/opatch lsinv | grep 14121009
DATABASE PATCH SET UPDATE?10.2.0.5.171017 and Patch 14121009 
[**requires extended support]    Patch? 26493118 and?Patch?14121009?[WIP]
**?requires extended support    $ORACLE_HOME/OPatch/opatch lsinv | grep 26493118 

5.目前,系统已完全恢复,并运行正常。

四、结果跟踪
为预防此次SCN导致的数据库其他异常情况,我方针对本次实施补丁的结果进行实时跟踪,确保数据库的健康运行,根据目前的运行情况来看,数据库运行正常,并无其他异常。
6)总结和建议
本次SCN故障导致多个数据库异常关闭,其中,核心的计费系统也受到影响。我方与局方负责人迅速定位问题,准确地判断问题原因,采取及时的措施防止SCN进一步的污染其他数据库,并在短时间内恢复核心系统的正常运行,事后也对系统的运行情况进行了跟踪。
本次事故较为严重,因此我方建议如下:
1、严格控制权限
一般只授予查询权限,其他权限应实行按需赋权,重要操作必须上报局方进行风险评估。

2、规范数据库使用流程
需要使用数据库的厂家或应用人员,应该将自己的使用要求,涉及到的使用内容上报局方,局方与数据库的维护方对该使用要求,涉及内容进行风险评估,在进行合理的评估后,再将结果反馈给各个使用数据库的厂家或应用人员。

        3、梳理dblink,更换取数方式
           建议对当前使用的数据库中的dblink进行梳理,将不在使用的dblink进行清理,减少或禁止在针对核心数据库的dblink,更改取数工具,如ETL取数工具。

这篇关于Rejected the attempt to advance SCN问题的分析处理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1008251

相关文章

Go标准库常见错误分析和解决办法

《Go标准库常见错误分析和解决办法》Go语言的标准库为开发者提供了丰富且高效的工具,涵盖了从网络编程到文件操作等各个方面,然而,标准库虽好,使用不当却可能适得其反,正所谓工欲善其事,必先利其器,本文将... 目录1. 使用了错误的time.Duration2. time.After导致的内存泄漏3. jsO

Python FastAPI+Celery+RabbitMQ实现分布式图片水印处理系统

《PythonFastAPI+Celery+RabbitMQ实现分布式图片水印处理系统》这篇文章主要为大家详细介绍了PythonFastAPI如何结合Celery以及RabbitMQ实现简单的分布式... 实现思路FastAPI 服务器Celery 任务队列RabbitMQ 作为消息代理定时任务处理完整

springboot循环依赖问题案例代码及解决办法

《springboot循环依赖问题案例代码及解决办法》在SpringBoot中,如果两个或多个Bean之间存在循环依赖(即BeanA依赖BeanB,而BeanB又依赖BeanA),会导致Spring的... 目录1. 什么是循环依赖?2. 循环依赖的场景案例3. 解决循环依赖的常见方法方法 1:使用 @La

C#使用SQLite进行大数据量高效处理的代码示例

《C#使用SQLite进行大数据量高效处理的代码示例》在软件开发中,高效处理大数据量是一个常见且具有挑战性的任务,SQLite因其零配置、嵌入式、跨平台的特性,成为许多开发者的首选数据库,本文将深入探... 目录前言准备工作数据实体核心技术批量插入:从乌龟到猎豹的蜕变分页查询:加载百万数据异步处理:拒绝界面

Springboot处理跨域的实现方式(附Demo)

《Springboot处理跨域的实现方式(附Demo)》:本文主要介绍Springboot处理跨域的实现方式(附Demo),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不... 目录Springboot处理跨域的方式1. 基本知识2. @CrossOrigin3. 全局跨域设置4.

Spring事务中@Transactional注解不生效的原因分析与解决

《Spring事务中@Transactional注解不生效的原因分析与解决》在Spring框架中,@Transactional注解是管理数据库事务的核心方式,本文将深入分析事务自调用的底层原理,解释为... 目录1. 引言2. 事务自调用问题重现2.1 示例代码2.2 问题现象3. 为什么事务自调用会失效3

python+opencv处理颜色之将目标颜色转换实例代码

《python+opencv处理颜色之将目标颜色转换实例代码》OpenCV是一个的跨平台计算机视觉库,可以运行在Linux、Windows和MacOS操作系统上,:本文主要介绍python+ope... 目录下面是代码+ 效果 + 解释转HSV: 关于颜色总是要转HSV的掩膜再标注总结 目标:将红色的部分滤

SpringBoot启动报错的11个高频问题排查与解决终极指南

《SpringBoot启动报错的11个高频问题排查与解决终极指南》这篇文章主要为大家详细介绍了SpringBoot启动报错的11个高频问题的排查与解决,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一... 目录1. 依赖冲突:NoSuchMethodError 的终极解法2. Bean注入失败:No qu

找不到Anaconda prompt终端的原因分析及解决方案

《找不到Anacondaprompt终端的原因分析及解决方案》因为anaconda还没有初始化,在安装anaconda的过程中,有一行是否要添加anaconda到菜单目录中,由于没有勾选,导致没有菜... 目录问题原因问http://www.chinasem.cn题解决安装了 Anaconda 却找不到 An

Spring定时任务只执行一次的原因分析与解决方案

《Spring定时任务只执行一次的原因分析与解决方案》在使用Spring的@Scheduled定时任务时,你是否遇到过任务只执行一次,后续不再触发的情况?这种情况可能由多种原因导致,如未启用调度、线程... 目录1. 问题背景2. Spring定时任务的基本用法3. 为什么定时任务只执行一次?3.1 未启用