PostgreSQL 高可用集群 repmgr 与 头疼的问题

2024-03-11 00:40

本文主要是介绍PostgreSQL 高可用集群 repmgr 与 头疼的问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

PostgreSQL 的高可用的方案,基本上不是原生的,大多是依靠第三方的公司来进行开发的,挂名的有那么几种 Patroni, PGPOOL-II, Repmgr  , 等等几种。PGPOOL-II 在安装适用中遇到很多问题,按理说一家日本公司做的东西应该靠谱,可惜问题太多,所以不能被作为 HA 的方式使用。

一个HA 的方式应该是简单的,高效的,并且抗X 的。 (我没有提分布式,只说HA)

  Repmgr 作为几大PG支持的公司 2ndQuadrant,产品也是比较靠谱的。目前repmgr 4.4的版本已经支持了 PG11 。文字中的PG 版本都是基于目前PG 11的版本。

安装的过程其实没有什么说的就是编译安装,但是我在安装的时候遇到了一些事情,如果有遇到的同行可以快速解决问题。

1 你POSTGRESQL 编译安装后,是否设置了系统变量,如果不设置系统变量就会遇到不少问题

2 不设置系统变量,你的BIN目录下的 PSQL PG_CONFIG 等文件是你编译的文件。

如果你在编译repmgr 时遇到版本不对等问题,多半你的从这里查起。

以下文字均建立在

1 您已经会独立安装POSTGRESQL 并无故障的基础上

2 您理解并可以进行流复制的设置和部分问题的故障排查

下面会有两台机器,

IP 分别为 192.168.198.110

              192.168.198.111

在此基础上,PG 的部分配置在主库上是必须进行配置的

max_wal_senders = 10

max_replication_slots = 10  

wal_level = replica 

hot_standby = on

archive_mode = on 

archive_command = 'test ! -f /pgdata/archive/%f && cp %p /pgdata/archive/%f'

如果您不知道上面的都是什么,这里大致的介绍一下,PG的复制其中有流式复制和逻辑复制两种,我们采用的是流式复制。

以上的配置中前四个都是与流式复制有关的配置信息,后面两个是LOG 的 archive的设置。

后面需要设置的就是 repmgr 的操作数据库的用户和相关repmgr 存储元数据的数据库。

创建repmgr用户 ,以及创建repmgr 数据库

create user repmgr superuser login;

 alter user  repmgr with password 'repmgr';

create database repmgr;

alter database repmgr owner to repmgr;

ALTER USER repmgr SET search_path TO repmgr, "$user", public;

在设置完这些,还需要进行 pg_hba.conf的设置

local   repmgr     repmgr                                        trust

host    repmgr     repmgr             127.0.0.1/32        trust

host    repmgr     repmgr             ::1/128                 trust

host    repmgr     repmgr             192.168.198.0/24 trust

对下载的rpemgr 进行编译,需要提前设置好相关的数据库的变量,如不清楚可以翻阅之前的关于POSTGRESQL 安装的一篇文字,大约在2个月前。

repmgr -f /etc/repmgr.conf primary register

repmgr.conf中必须包含的内容

node_id=1                        

node_name='192.168.198.110'                conninfo='host=192.168.198.110 user=repmgr dbname=repmgr connect_timeout=2'

data_directory='/pgdata/data'

repmgr -f /etc/repmgr.conf cluster show

在注册完主节点后,可以通过上面的命令来进行验证是否成功注册

在standy 从库也安装 repmgr 并且设置 repmgr.conf 到 /etc/目录下

相关的内容

我们需要去验证我们马上要进行的clone 是否能够成功

如果之间有问题,会在打印的信息报错,无法有以下几种

1你的主从库网络连接问题

2 账号的问题,无法通过你给的账号进行联通

3 你的从库的PG 启动并且在数据目录里面有数据

下面就直接进行命令的操作,可以蛋刀数据整个的一体化操作都完成了,数据的拷贝, standy 的注册等。

启动从库

我们在主从库之间验证相关的复制是否已经工作

主库

从库

下面将注册信息存储在复制集中

并且主从中通过命令都可以查到相关的注册信息

在做完这一切后,我们可以演练一下,如何手动的来切换,主从库

再次运行命令来验证是否切换成功

可以看到主从切换成功了。

我们再次进入到主机进行验证,你可以通过主机名来看到切换是成功了

当然你还可以在切换回来和刚才的操作一样

通过这一轮简单的操作,repmgr 的主机主从切换是如此简单,当然他的功能还不止于此,自动在故障的时候,进行切换他也很在行,我可以认为他是POSTGRESQL 界中的 MHA 。 

在总结一下repmgr 的优点

1 安装简单

2 功能强大

3 有较清晰的文档

4 背后有PG 业界知名公司做后盾

5 支持到目前最新版本的 PG 11

下次的找机会做一次自动切换  待续

至于头痛的问题,自己还是学的太慢,成长的速度跟不上产品迭代的速度,周三听大佬视频,都到 PG 12 preview 功能更牛X,  这11的丰富功能学的还都半铲子,快吐血了。

这篇关于PostgreSQL 高可用集群 repmgr 与 头疼的问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/796051

相关文章

Vue3绑定props默认值问题

《Vue3绑定props默认值问题》使用Vue3的defineProps配合TypeScript的interface定义props类型,并通过withDefaults设置默认值,使组件能安全访问传入的... 目录前言步骤步骤1:使用 defineProps 定义 Props步骤2:设置默认值总结前言使用T

Web服务器-Nginx-高并发问题

《Web服务器-Nginx-高并发问题》Nginx通过事件驱动、I/O多路复用和异步非阻塞技术高效处理高并发,结合动静分离和限流策略,提升性能与稳定性... 目录前言一、架构1. 原生多进程架构2. 事件驱动模型3. IO多路复用4. 异步非阻塞 I/O5. Nginx高并发配置实战二、动静分离1. 职责2

解决升级JDK报错:module java.base does not“opens java.lang.reflect“to unnamed module问题

《解决升级JDK报错:modulejava.basedoesnot“opensjava.lang.reflect“tounnamedmodule问题》SpringBoot启动错误源于Jav... 目录问题描述原因分析解决方案总结问题描述启动sprintboot时报以下错误原因分析编程异js常是由Ja

MySQL 表空却 ibd 文件过大的问题及解决方法

《MySQL表空却ibd文件过大的问题及解决方法》本文给大家介绍MySQL表空却ibd文件过大的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考... 目录一、问题背景:表空却 “吃满” 磁盘的怪事二、问题复现:一步步编程还原异常场景1. 准备测试源表与数据

PostgreSQL简介及实战应用

《PostgreSQL简介及实战应用》PostgreSQL是一种功能强大的开源关系型数据库管理系统,以其稳定性、高性能、扩展性和复杂查询能力在众多项目中得到广泛应用,本文将从基础概念讲起,逐步深入到高... 目录前言1. PostgreSQL基础1.1 PostgreSQL简介1.2 基础语法1.3 数据库

Redis中哨兵机制和集群的区别及说明

《Redis中哨兵机制和集群的区别及说明》Redis哨兵通过主从复制实现高可用,适用于中小规模数据;集群采用分布式分片,支持动态扩展,适合大规模数据,哨兵管理简单但扩展性弱,集群性能更强但架构复杂,根... 目录一、架构设计与节点角色1. 哨兵机制(Sentinel)2. 集群(Cluster)二、数据分片

解决Nginx启动报错Job for nginx.service failed because the control process exited with error code问题

《解决Nginx启动报错Jobfornginx.servicefailedbecausethecontrolprocessexitedwitherrorcode问题》Nginx启... 目录一、报错如下二、解决原因三、解决方式总结一、报错如下Job for nginx.service failed bec

SysMain服务可以关吗? 解决SysMain服务导致的高CPU使用率问题

《SysMain服务可以关吗?解决SysMain服务导致的高CPU使用率问题》SysMain服务是超级预读取,该服务会记录您打开应用程序的模式,并预先将它们加载到内存中以节省时间,但它可能占用大量... 在使用电脑的过程中,CPU使用率居高不下是许多用户都遇到过的问题,其中名为SysMain的服务往往是罪魁

MySQ中出现幻读问题的解决过程

《MySQ中出现幻读问题的解决过程》文章解析MySQLInnoDB通过MVCC与间隙锁机制在可重复读隔离级别下解决幻读,确保事务一致性,同时指出性能影响及乐观锁等替代方案,帮助开发者优化数据库应用... 目录一、幻读的准确定义与核心特征幻读 vs 不可重复读二、mysql隔离级别深度解析各隔离级别的实现差异

C++ vector越界问题的完整解决方案

《C++vector越界问题的完整解决方案》在C++开发中,std::vector作为最常用的动态数组容器,其便捷性与性能优势使其成为处理可变长度数据的首选,然而,数组越界访问始终是威胁程序稳定性的... 目录引言一、vector越界的底层原理与危害1.1 越界访问的本质原因1.2 越界访问的实际危害二、基