无法访问存储导致down实例

2024-09-07 12:38

本文主要是介绍无法访问存储导致down实例,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、现象:
SQL/DEVELOPER,连接数据库时报了ORA-12505:TNS:listener does not currently kown of SID given in connect descriptor
二、查看信息:
1、lsnrctl status查看监听正常
2、crs_stat -t  发现:ora.....d1.inst 目标状态和当前状态是OFFLINE,通过ps -ef | grep pmon 发现实例1确实down了
$ crs_stat -t                                                                                                                                                                                           
Name           Type           Target    State     Host        
------------------------------------------------------------
ora.exprd.db   application    ONLINE    ONLINE    trsendb2     
ora.....exp.cs application    ONLINE    ONLINE    trsendb1     
ora....rd1.srv application    ONLINE    ONLINE    trsendb1     
ora....d1.inst application    OFFLINE   OFFLINE   trsendb1    
ora.....flt.cs application    ONLINE    ONLINE    trsendb1     
ora....rd1.srv application    ONLINE    ONLINE    trsendb1      
ora....rd2.srv application    ONLINE    ONLINE    trsendb1     
ora.....mdm.cs application    ONLINE    ONLINE    trsendb2     
ora....rd1.srv application    ONLINE    ONLINE    trsendb1     
ora....rd2.srv application    ONLINE    ONLINE    trsendb2       
ora....rd1.srv application    ONLINE    ONLINE    trsendb1     
ora.....ord.cs application    ONLINE    ONLINE    trsendb2     
ora....rd2.srv application    ONLINE    ONLINE    trsendb1     
ora.....pbl.cs application    ONLINE    ONLINE    trsendb1     
ora....rd1.srv application    ONLINE    ONLINE    trsendb1     
ora.....rpt.cs application    ONLINE    ONLINE    trsendb2     
ora....rd2.srv application    ONLINE    ONLINE    trsendb1     
ora.....rut.cs application    ONLINE    ONLINE    trsendb1    
ora.....stl.cs application    ONLINE    ONLINE    trsendb2     
ora....rd2.srv application    ONLINE    ONLINE    trsendb1     
ora....SM1.asm application    ONLINE    ONLINE    trsendb1     
ora....R1.lsnr application    ONLINE    ONLINE    trsendb1     
ora....vr1.gsd application    ONLINE    ONLINE    trsendb1     
ora....vr1.ons application    ONLINE    ONLINE    trsendb1     
ora....vr1.vip application    ONLINE    ONLINE    trsendb1     
ora....SM2.asm application    ONLINE    ONLINE    trsendb2     
ora....R2.lsnr application    ONLINE    ONLINE    trsendb2     
ora....vr2.gsd application    ONLINE    ONLINE    trsendb2     
ora....vr2.ons application    ONLINE    ONLINE    trsendb2     
ora....vr2.vip application    ONLINE    ONLINE    trsendb2
   
$ ps -ef | grep pmon
  oracle  3222     1  0  Mar 12  ?         9:09 asm_pmon_+ASM1
  oracle  2147  1415  0 17:14:53 pts/1     0:00 grep pmon

3、日志
OS日志
Apr  9 14:37:16 trsen01 sshd[1068]: SSH: Server;LType: Throughput;Remote: 192.168.8.199-56261;IN: 5112;OUT: 1812;Duration: 16.9;tPut_in: 302.7;tPut_out: 107.3
Apr 10 14:45:19 trsen01 vmunix: class : tgtpath, instance 8
Apr 10 14:45:19 trsen01 vmunix: Target path (class=tgtpath, instance=8) has gone offline.  The target path h/w path is 0/0/0/5/0/0/1.0x50001fe1501c8e0a
Apr 10 14:45:19 trsen01 vmunix:
Apr 10 14:45:26 trsen01 vmunix: class : tgtpath, instance 6
Apr 10 14:45:26 trsen01 vmunix: cTlaarsgse t:  ptagtthp a(tchl,a sisn=sttgatnpcaet h7,
Apr 10 14:45:26 trsen01 vmunix:  iTnasrtgaentc e=6) has gone offline.  The target path h/w path is 0/0/0/5/0/0/1.0x50001fe1501c8e0e
Apr 10 14:45:26 trsen01 vmunix: path (class=tgtpath, instance=7) has gone offline.  The target path h/w path is 0/0/0/5/0/0/1.0x50001fe1501c8e0f
Apr 10 14:45:26 trsen01 vmunix:
Apr 10 14:45:27 trsen01 vmunix: class : tgtpath, instance 2
Apr 10 14:45:27 trsen01 vmunix: Target path (class=tgtpath, instance=2) has gone offline.  The target path h/w path is 0/0/0/5/0/0/0.0x50001fe1501c8e0c
Apr 10 14:45:27 trsen01 vmunix: class : tgtpath, instance 3
Apr 10 14:45:27 trsen01 vmunix: Target path (class=tgtpath, instance=3) has gone offline.  The target path h/w path is 0/0/0/5/0/0/0.0x50001fe1501c8e0d
Apr 10 14:45:27 trsen01 vmunix: class : tgtpath, instance 4
Apr 10 14:45:27 trsen01 vmunix: Target path (class=tgtpath, instance=4) has gone offline.  The target path h/w path is 0/0/0/5/0/0/0.0x50001fe1501c8e08
Apr 10 14:45:27 trsen01 vmunix: class : tgtpath, instance 5
Apr 10 14:45:27 trsen01 vmunix: Target path (class=tgtpath, instance=5) has gone offline.  The target path h/w path is 0/0/0/5/0/0/0.0x50001fe1501c8e09
Apr 10 14:45:28 trsen01 vmunix: class : tgtpath, instance 9
Apr 10 14:45:28 trsen01 vmunix: Target path (class=tgtpath, instance=9) has gone offline.  The target path h/w path is 0/0/0/5/0/0/1.0x50001fe1501c8e0b
ALER日志
Thu Apr 10 14:43:46 EAT 2014
Errors in file /u01/app/oracle/product/admin/trsendb/bdump/trsendb1_lgwr_3473.trc:
ORA-00340: IO error processing online log 5 of thread 1
ORA-00345: redo log write error block 436153 count 1
ORA-00312: online log 5 thread 1: '+TDBASM2/trsendb/onlinelog/group_5.5776.752860931'
ORA-65535: Message 65535 not found;  product=RDBMS; facility=ORA
ORA-00345: redo log write error block 436153 count 1
ORA-00312: online log 5 thread 1: '+TDBASM2/trsendb/onlinelog/group_5.5777.752860951'
ORA-65535: Message 65535 not found;  product=RDBMS; facility=ORA
LGWR: terminating instance due to error 340
Thu Apr 10 14:43:46 EAT 2014
Trace dumping is performing id=[cdmp_20140410144346]
Thu Apr 10 14:43:55 EAT 2014
Termination issued to instance processes. Waiting for the processes to exit
Thu Apr 10 14:44:01 EAT 2014
Instance termination failed to kill one or more processes
Instance terminated by LGWR, pid = 3473==================>中断实例
Thu Apr 10 15:15:49 EAT 2014
lgwr trc日志
*** 2014-04-10 14:43:43.930=============>在14:43:43时,报错了LGWR IO失败
Warning: log write time 820ms, size 2KB
WARNING: IO Failed.  au:107090 diskname:/dev/rdisk/asm5disk
     rq:9ffffffffd0018e8 buffer:c000000100640800 au_offset(bytes):189440 iosz:1024 operation:1
     status:2
WARNING: IO Failed.  au:106889 diskname:/dev/rdisk/asm10disk
ocssd日志
[    CSSD]2014-04-10 14:45:26.070 [8] >WARNING: clssnmDiskPMT: voting device offline at 50% fatal, termination in 99613 ms, disk (0//dev/rdisk/votingdisk)==>磁盘心跳出现问题
[    CSSD]2014-04-10 14:46:16.022 [8] >WARNING: clssnmDiskPMT: voting device offline at 75% fatal, termination in 49661 ms, disk (0//dev/rdisk/votingdisk)
[    CSSD]2014-04-10 14:46:46.590 [8] >WARNING: clssnmDiskPMT: voting device offline at 90% fatal, termination in 19093 ms, disk (0//dev/rdisk/votingdisk)
[    CSSD]2014-04-10 14:46:47.600 [8] >WARNING: clssnmDiskPMT: voting device offline at 90% fatal, termination in 18083 ms, disk (0//dev/rdisk/votingdisk)

从整个日志可以看出:
=>LGWR进程43:43.930s在无法写日志,导致出现IO错误
=>44:01s Instance terminated by LGWR
=>45:19~:45:26 os日志记录class : tgtpath, instance x has gone offline
=>45:26.070s 磁盘心跳出现问题
=>在15点左右,开发出现连不上数据问题

从日志初步分析,数据库不能访问存储,导致实例down了

4、
启动实例=>srvctl start instance -d trsendb -i trsendb1;
relocate服务=>srvctl relocate service -d trsendb -s xxx -i trsendb2 -t trsendb1;

这篇关于无法访问存储导致down实例的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1145080

相关文章

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

HDFS—存储优化(纠删码)

纠删码原理 HDFS 默认情况下,一个文件有3个副本,这样提高了数据的可靠性,但也带来了2倍的冗余开销。 Hadoop3.x 引入了纠删码,采用计算的方式,可以节省约50%左右的存储空间。 此种方式节约了空间,但是会增加 cpu 的计算。 纠删码策略是给具体一个路径设置。所有往此路径下存储的文件,都会执行此策略。 默认只开启对 RS-6-3-1024k

安卓链接正常显示,ios#符被转义%23导致链接访问404

原因分析: url中含有特殊字符 中文未编码 都有可能导致URL转换失败,所以需要对url编码处理  如下: guard let allowUrl = webUrl.addingPercentEncoding(withAllowedCharacters: .urlQueryAllowed) else {return} 后面发现当url中有#号时,会被误伤转义为%23,导致链接无法访问

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss

C++操作符重载实例(独立函数)

C++操作符重载实例,我们把坐标值CVector的加法进行重载,计算c3=c1+c2时,也就是计算x3=x1+x2,y3=y1+y2,今天我们以独立函数的方式重载操作符+(加号),以下是C++代码: c1802.cpp源代码: D:\YcjWork\CppTour>vim c1802.cpp #include <iostream>using namespace std;/*** 以独立函数

实例:如何统计当前主机的连接状态和连接数

统计当前主机的连接状态和连接数 在 Linux 中,可使用 ss 命令来查看主机的网络连接状态。以下是统计当前主机连接状态和连接主机数量的具体操作。 1. 统计当前主机的连接状态 使用 ss 命令结合 grep、cut、sort 和 uniq 命令来统计当前主机的 TCP 连接状态。 ss -nta | grep -v '^State' | cut -d " " -f 1 | sort |

速了解MySQL 数据库不同存储引擎

快速了解MySQL 数据库不同存储引擎 MySQL 提供了多种存储引擎,每种存储引擎都有其特定的特性和适用场景。了解这些存储引擎的特性,有助于在设计数据库时做出合理的选择。以下是 MySQL 中几种常用存储引擎的详细介绍。 1. InnoDB 特点: 事务支持:InnoDB 是一个支持 ACID(原子性、一致性、隔离性、持久性)事务的存储引擎。行级锁:使用行级锁来提高并发性,减少锁竞争

Java Websocket实例【服务端与客户端实现全双工通讯】

Java Websocket实例【服务端与客户端实现全双工通讯】 现很多网站为了实现即时通讯,所用的技术都是轮询(polling)。轮询是在特定的的时间间隔(如每1秒),由浏览器对服务器发 出HTTP request,然后由服务器返回最新的数据给客服端的浏览器。这种传统的HTTP request 的模式带来很明显的缺点 – 浏 览器需要不断的向服务器发出请求,然而HTTP

STM32 ADC+DMA导致写FLASH失败

最近用STM32G070系列的ADC+DMA采样时,遇到了一些小坑记录一下; 一、ADC+DMA采样时进入死循环; 解决方法:ADC-dma死循环问题_stm32 adc dma死机-CSDN博客 将ADC的DMA中断调整为最高,且增大ADCHAL_ADC_Start_DMA(&hadc1, (uint32_t*)adc_buffer, ADC_Buffer_Size); 的ADC_Bu

828华为云征文|华为云Flexus X实例docker部署rancher并构建k8s集群

828华为云征文|华为云Flexus X实例docker部署rancher并构建k8s集群 华为云最近正在举办828 B2B企业节,Flexus X实例的促销力度非常大,特别适合那些对算力性能有高要求的小伙伴。如果你有自建MySQL、Redis、Nginx等服务的需求,一定不要错过这个机会。赶紧去看看吧! 什么是华为云Flexus X实例 华为云Flexus X实例云服务是新一代开箱即用、体