crs harmony驱动_RAC集群故障恢复CRS-4047,CRS-4000

2024-02-02 13:30

本文主要是介绍crs harmony驱动_RAC集群故障恢复CRS-4047,CRS-4000,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

知识点:

RAC是real application clusters的缩写,译为“实时应用集群”,是高可用性的一种,也是Oracle数据库支持网格计算环境的核心技术。

主要作用:

(1)多节点负载均衡;

(2)提供高可用:故障容错和无缝切换功能,将硬件和软件错误造成的影响最小化;

带来好处的同时,RAC管理复杂,维护难度大。

本文涉及到几个组件和进程介绍

OCR:用于存储所有与集群,RAC数据库相关的配置信息。

OHAS:集群高可用服务,并负责生成agent进程。

背景

操作系统:Red Hat 6.5

数据库:  RAC集群双节点(11.2.0.1)

由于受台风“山竹“影响,服务器异常关机,集群服务无法启动,业务中断,棘手的问题是客户没有任何备份。

精简后的操作过程:

节点1,集群状态报错

54f59719ab442983992ec56ca5365669.png

节点2

d0ddde205957174f1e7eab1b8c02405f.png

asm无法启动

d87bc2199dca35bbf1a0f92bc0edddbb.png

检查crsd.log

1e4ac998bc1af01e4534dd9f3e77af89.png

发现ocr.loc和olr.loc全部丢失,这两个文件非常重要,分别记录了ocr和olr的位置

acca576a7c11238e20b04340c44667e3.png

查看ocr没有备份,正常情况下OCR每4小时自动备份一次

3683035f73044d6a69969516b0bca9c5.png

Ocr的备份也没有,已经基本上无解了,只剩最后一招重建集群(风险操作)

重建集群过程:

rootcrs.pl  -verbose -deconfig -force

a8ee8df4907ff1a3a0b5b9bdcc351b5b.png

52994a0d676dd430291c09504acd8a2a.png

执行root.sh脚本

404c85a0419991e29a221d8fa15185af.png

重建脚本的时候继续报错,这个报错说明OHAS没有起来

f0f69d6f20fe38693cb1cab2469510a7.png

解决方法:

在执行root.sh脚本时出现Adding daemon to inittab的时候,在另一个窗口使用root执行以下命令:

bb36a8a64f0593c64ac786a12af26a80.png

之后创建文件输入以下命令,oracle-ohasd.conf必须创建,否则重启系统后无法自动启动OHAS

3f2ab8a6517f1482077dacf6a2d4db01.png

说明OHAS已经启动

bc904a9889c0798d24eb9ef467f69998.png

集群重建之后,集群已经无法管理数据库资源,报下面错误

2190c5c0883ad445069e8dcba63c1307.png

需要把数据库注册到到集群,发现已经存在

6693b92a075d1f4d23c3d5b0c85faeb9.png

需要执行如下命令删掉serverpool再添加

25f6cb8f09639c29104258ce45aac754.png

已经成功把数据库注册到集群管理

6e0b2bc3c64a0acdcbe79ba40399c8e8.png

查看集群状态,已经正常。

d20353e19772d4dfb5194a8e01a76f5b.png

至此恢复结束。能恢复成功是一种幸运,所幸硬件和存储没出问题。

这篇关于crs harmony驱动_RAC集群故障恢复CRS-4047,CRS-4000的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/670846

相关文章

Git中恢复已删除分支的几种方法

《Git中恢复已删除分支的几种方法》:本文主要介绍在Git中恢复已删除分支的几种方法,包括查找提交记录、恢复分支、推送恢复的分支等步骤,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录1. 恢复本地删除的分支场景方法2. 恢复远程删除的分支场景方法3. 恢复未推送的本地删除分支场景方法4. 恢复

Window Server创建2台服务器的故障转移群集的图文教程

《WindowServer创建2台服务器的故障转移群集的图文教程》本文主要介绍了在WindowsServer系统上创建一个包含两台成员服务器的故障转移群集,文中通过图文示例介绍的非常详细,对大家的... 目录一、 准备条件二、在ServerB安装故障转移群集三、在ServerC安装故障转移群集,操作与Ser

windos server2022的配置故障转移服务的图文教程

《windosserver2022的配置故障转移服务的图文教程》本文主要介绍了windosserver2022的配置故障转移服务的图文教程,以确保服务和应用程序的连续性和可用性,文中通过图文介绍的非... 目录准备环境:步骤故障转移群集是 Windows Server 2022 中提供的一种功能,用于在多个

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

centos7基于keepalived+nginx部署k8s1.26.0高可用集群

《centos7基于keepalived+nginx部署k8s1.26.0高可用集群》Kubernetes是一个开源的容器编排平台,用于自动化地部署、扩展和管理容器化应用程序,在生产环境中,为了确保集... 目录一、初始化(所有节点都执行)二、安装containerd(所有节点都执行)三、安装docker-

如何在一台服务器上使用docker运行kafka集群

《如何在一台服务器上使用docker运行kafka集群》文章详细介绍了如何在一台服务器上使用Docker运行Kafka集群,包括拉取镜像、创建网络、启动Kafka容器、检查运行状态、编写启动和关闭脚本... 目录1.拉取镜像2.创建集群之间通信的网络3.将zookeeper加入到网络中4.启动kafka集群

如何测试计算机的内存是否存在问题? 判断电脑内存故障的多种方法

《如何测试计算机的内存是否存在问题?判断电脑内存故障的多种方法》内存是电脑中非常重要的组件之一,如果内存出现故障,可能会导致电脑出现各种问题,如蓝屏、死机、程序崩溃等,如何判断内存是否出现故障呢?下... 如果你的电脑是崩溃、冻结还是不稳定,那么它的内存可能有问题。要进行检查,你可以使用Windows 11

Nacos客户端本地缓存和故障转移方式

《Nacos客户端本地缓存和故障转移方式》Nacos客户端在从Server获得服务时,若出现故障,会通过ServiceInfoHolder和FailoverReactor进行故障转移,ServiceI... 目录1. ServiceInfoHolder本地缓存目录2. FailoverReactorinit

Nacos集群数据同步方式

《Nacos集群数据同步方式》文章主要介绍了Nacos集群中服务注册信息的同步机制,涉及到负责节点和非负责节点之间的数据同步过程,以及DistroProtocol协议在同步中的应用... 目录引言负责节点(发起同步)DistroProtocolDistroSyncChangeTask获取同步数据getDis

服务器集群同步时间手记

1.时间服务器配置(必须root用户) (1)检查ntp是否安装 [root@node1 桌面]# rpm -qa|grep ntpntp-4.2.6p5-10.el6.centos.x86_64fontpackages-filesystem-1.41-1.1.el6.noarchntpdate-4.2.6p5-10.el6.centos.x86_64 (2)修改ntp配置文件 [r