在PG或HGDB上启用块校验checksum

2024-03-06 16:36
文章标签 校验 pg 启用 checksum hgdb

本文主要是介绍在PG或HGDB上启用块校验checksum,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

**瀚高数据库

目录

环境
文档用途
详细信息**

环境

系统平台:Linux x86-64 Red Hat Enterprise Linux 7
版本:14,N/A

文档用途

用途

使用checksum,对数据库提供块校验,以发现隐藏的块损坏问题,注意仅适用于原生PG或HGDB企业版,或未使用SM4加密的HGDB安全版。

HGDB安全版假如使用了SM4加密,会与checksum冲突导致数据文件损坏。

什么是坏块

坏块通常是指读取或写入的数据文件,由于存储介质故障、突然断电等问题,导致的数据块中存储的信息丢失,或由于没来得及写入完成导致的块断裂,坏块通常会带来数据损坏甚至数据丢失的风险。

checksum

PostgreSQL在9.3版本开始,引入了checksum,使用checksum可以检验数据块的损坏

checksum校验发生在数据页落盘之前和进入sharedbuffer之前。

checksum写入

当将页面从缓冲区缓存写入到操作系统页面缓存(OS Cache)时,就会计算checksum值并写入数据页中。

checksum校验

每次读取该块时,checksum值就会重新计算,并与所存储的checksum值进行比较。这可以检验数据是否损坏。

使用pg_checksums命令的注意事项

pg_checksums 命令:启用、禁用或检查PostgreSQL数据库集簇中的数据校验和(checksum)

在运行pg_checksums之前必须彻底关闭服务器。

验证checksum时:

(1)如果没有校验和错误,则退出状态为零;

(2)如果检测到至少一个checksum校验失败,则退出状态为非零。

(3)启用或禁用checksum时,如果操作失败,退出状态为非零。

验证checksum时,会扫描数据库集簇中的每个文件。

(1)启用校验和时,每个具有已更改校验和的relotion file block都会立刻重写。

(2)禁用checksum只会更新文件pg_control。

额外注意点:

(1)在大型数据库集簇中启用checksum可能需要很长时间。在此操作过程中,不得启动数据库或其他写入数据目录的程序,否则可能会导致数据丢失。

(2)当使用replication或执行关系文件块直接复制的工具(例如pg_rewind)时,如果没有在所有节点上做相同的操作(例如主库打开了checksum,备库没打开),

启用或禁用校验和可能会导致checksum计算错误。

(3)假如流复制环境下,那么建议停止和删除所有备库,在主库上执行启用checksum,最后重做所有备用数据库。

(4)如果在启用或禁用校验和时pg_checksums被中止,集群的数据校验和不会改变,可以通过重新运行pg_checksums来继续打开或关闭checksum。

详细信息

checksum使用示例

1. 检查数据库是否开启checksum

[postgres@centos7 data]$ pg_controldata -D $PGDATA |grep checksumData page checksum version:           0           <--0表示未启用,1表示打开

2. 创建并查询表的物理位置

create  table tab1(a int primary key ,b text);insert into tab1 values (1,'hello postgres');select pg_relation_filepath('tab1');

物理位置如下:

postgres=# select pg_relation_filepath('tab1');pg_relation_filepath ----------------------base/5/16397(1 row)

3. 关闭数据库,启用checksum

[postgres@centos7 data]$ pg_checksums -D $PGDATA --enable --progress22/22 MB (100%) computedChecksum operation completedFiles scanned:   953Blocks scanned:  2816Files written:  786Blocks written: 2816pg_checksums: syncing data directorypg_checksums: updating control fileChecksums enabled in cluster

–enable :-e, --enable 启用data checksums

–progress :-P, --progress 显示进度报告

检查pg_controldata

[postgres@centos7 data]$ pg_controldata -D $PGDATA |grep checksumData page checksum version:           1   <--checksum已经打开

4. 手动制造坏块

先看一下当前块的内容:物理文件是8KB,只有一个块

image.png

[postgres@centos7 5]$ dd bs=8192 count=1 seek=1 of=/data/highgo/data/base/5/16397 if=/data/highgo/data/base/5/163971+0 records in1+0 records out8192 bytes (8.2 kB) copied, 0.000373582 s, 21.9 MB/s

解释:使用seek=1偏移8K,也就是在原来的一个块后再追加一个块,这样假如未开启checksum,实际是能查出2行数据的

image.png

由1个块变成2个块

5. 此时启动数据库,查询该表

发现:

postgres=# select * from tab1;WARNING:  page verification failed, calculated checksum 5783 but expected 5782  <--提示checksum不一致了,事务直接中止ERROR:  invalid page in block 1 of relation base/5/16397

6. 停掉数据库,使用checksum检查数据页的错误

[postgres@centos7 5]$ pg_checksums -D $PGDATA --checkpg_checksums: error: checksum verification failed in file "/data/highgo/data/base/5/16397", block 1: calculated checksum 1697 but block contains 1696Checksum operation completedFiles scanned:   953Blocks scanned:  2817Bad checksums:  1Data checksum version: 1

这里提示的:1696是16进制,转换为10进制,正好是5782,和数据库中的报错相同

7. 关闭checksum,检查发现异常块也可以被读取

[postgres@centos7 5]$ pg_checksums -D $PGDATA --disable --progresspg_checksums: syncing data directorypg_checksums: updating control fileChecksums disabled in cluster
[postgres@centos7 5]$ pg_ctl start[postgres@centos7 5]$ psqlpostgres=# select * from tab1;a |       b        ---+----------------1 | hello postgres1 | hello postgres     <-- 原来只有1行,dd到文件后追加了1个块,导致查出2行了(2 rows)

8. 如何忽略坏块错误?

可以通过:

(1). ignore_checksum_failure:该参数仅在开启checksum下生效,作用就是忽略checksum的报错,读出坏块中的数据,但是假如page header错误,那么也读不出来,事务依旧会中止。

(2). zero_damaged_pages:数据库会在内存中将损坏的page都置为空,然后获取剩下的结果,即使page header损坏,执行事务也不会退出,只会报warning,这个参数,官方文档上说不会写入物理文件,但是实际情况下,还是建议先原样备份后,再打开该参数。

下面进行测试:

重新开启checksum并制造坏块:

pg_ctl stoppg_checksums -D $PGDATA --enable --progressdd bs=8192 count=1 seek=1 of=/data/highgo/data/base/5/16397 if=/data/highgo/data/base/5/16397

发现有坏块了:

[postgres@centos7 5]$ pg_checksums -D $PGDATA --checkpg_checksums: error: checksum verification failed in file "/data/highgo/data/base/5/16397", block 1: calculated checksum 8E26 but block contains 8E27Checksum operation completedFiles scanned:   953Blocks scanned:  2817Bad checksums:  1Data checksum version: 1

8.1 使用ignore_checksum_failure参数忽略checksum

该参数仅当启用checksum时才有效,在读取过程中检测到checksum失败通常会导致PG报告错误,从而中止当前事务。设置ignore_checksum_failure为 on 会导致系统忽略故障(但仍报告警告),并继续处理。此行为可能会导致崩溃、传播或隐藏损坏或其他严重问题。但是,如果page header仍然正常,它可能允许您克服错误并检索可能仍然存在于表中的未损坏的元组。如果page header损坏,即使启用此选项,也会报告错误。默认设置为off。只有超级用户和具有适当SET权限的用户才能更改此设置。
postgres=# show ignore_checksum_failure;ignore_checksum_failure -------------------------off(1 row)postgres=# set ignore_checksum_failure = on;SETpostgres=# select * from tab1;WARNING:  page verification failed, calculated checksum 36390 but expected 36391a |       b        ---+----------------1 | hello postgres1 | hello postgres    <--忽略了checksum的报错,直接读出2个块的数据(2 rows)

8.2 使用参数 zero_damaged_pages忽略坏块

该参数不要求启用checksum,它总会让数据库忽略坏块。

检测到损坏的page header通常会导致PostgreSQL报告错误,从而中止当前事务。设置zero_damaged_pages = on 会导致系统报告警告,将内存中损坏的页面清零,然后继续处理。此行为会破坏数据,即损坏页上的所有行。但是,它确实允许您克服错误并从表中可能存在的任何未损坏的页面中检索行。如果由于硬件或软件错误而发生损坏,它对于恢复数据很有用。通常,在您放弃从表的损坏页恢复数据的希望之前,不应将其设置为打开。清零页不会强制写入磁盘,因此建议在再次关闭此参数之前重新创建表或索引。默认设置为off。只有超级用户和具有适当SET权限的用户才能更改此设置。

该参数是最后的希望,在使用该参数之前,必须要对原始数据进行完整的物理备份。

[postgres@centos7 5]$ pg_ctl restart[postgres@centos7 5]$ psqlpostgres=# show zero_damaged_pages;zero_damaged_pages --------------------off(1 row)postgres=# set zero_damaged_pages=on;SETpostgres=# select * from tab1;WARNING:  page verification failed, calculated checksum 36390 but expected 36391WARNING:  invalid page in block 1 of relation base/5/16397; zeroing out pagea |       b        ---+----------------1 | hello postgres(1 row)

可以看到,该参数会忽略实际损坏的块,而不是像ignore_checksum_failure那样,仅是忽略checksum错误。

注意:使用这两种方式后,应当尽快采用逻辑导出对应表,并重建表后导入。

9.数据库恢复期间遇到坏块怎么办?

还有一个其他的参数,仅在恢复期间使用的

ignore_invalid_pages(boolean)

如果设置为off(默认值),则数据库在恢复期间检测到引用无效page的WAL记录,会导致PostgreSQL引发PANIC级错误,从而中止恢复。设置ignore_invalid_pages为on会导致系统忽略 WAL 记录中的无效页面引用(但仍报告警告),并继续恢复。此行为可能会导致崩溃、数据丢失、传播或隐藏损坏或其他严重问题。但是,它可能允许您克服 PANIC级错误,完成恢复并启动服务器。该参数只能在服务器启动时设置。它仅在recovery或standby模式下有效。

这篇关于在PG或HGDB上启用块校验checksum的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/780674

相关文章

Ubuntu 怎么启用 Universe 和 Multiverse 软件源?

《Ubuntu怎么启用Universe和Multiverse软件源?》在Ubuntu中,软件源是用于获取和安装软件的服务器,通过设置和管理软件源,您可以确保系统能够从可靠的来源获取最新的软件... Ubuntu 是一款广受认可且声誉良好的开源操作系统,允许用户通过其庞大的软件包来定制和增强计算体验。这些软件

spring 参数校验Validation示例详解

《spring参数校验Validation示例详解》Spring提供了Validation工具类来实现对客户端传来的请求参数的有效校验,本文给大家介绍spring参数校验Validation示例详... 目录前言一、Validation常见的校验注解二、Validation的简单应用三、分组校验四、自定义校

校验码:奇偶校验,CRC循环冗余校验,海明校验码

文章目录 奇偶校验码CRC循环冗余校验码海明校验码 奇偶校验码 码距:任何一种编码都由许多码字构成,任意两个码字之间最少变化的二进制位数就称为数据检验码的码距。 奇偶校验码的编码方法是:由若干位有效信息(如一个字节),再加上一个二进制位(校验位)组成校验码。 奇校验:整个校验码中1的个数为奇数 偶校验:整个校验码中1的个数为偶数 奇偶校验,可检测1位(奇数位)的错误,不可纠错。

web登录校验

基础登录功能 LoginController @PostMapping("/login")Result login(@RequestBody Emp emp) {log.info("前端,发送了一个登录请求");Emp e = empService.login(emp);return e!=null?Result.success():Result.error("用户" +"名或密码错误");

checksum 与 CRC的不同之处

实际应用: CRC:在外发电压时,在报文的最后两个字节做了CRC计算。 checksum : 在按键状态外发,在报文的最后一个字节做了checksum计算。 它们的共同之处:目的都是为了数据的错误检测功能。 只是在算法的复杂度上有较大的区别: 总的来说,CRC算法更复杂,可检测的错误也比较丰富。 CRC与checksum的计算方式都是固定的吗? 在实际应用中,并没有通知对方,所用

spring数据校验Validation

文章目录 需要的依赖创建校验对象Validator 需要的依赖 <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-validation</artifactId></dependency> 创建校验对象Validator 测试的实体类 //创建实体

两步搞定 Tomcat 下启用 https:// 访问

这个简单教程中我们通过简单的两步就可以在 Tomcat 7 中启用 HTTPS 访问。 第一步:创建 .keystore 文件 使用如下命令生成 .keystore 文件 windows : 1 %JAVA_HOME%\bin\keytool -genkey -alias tomcat -keyalg RSA Linux: 1 $JAVA_HOM

spring项目使用邮箱验证码校验

本项目采用免费QQ邮箱验证码方式进行登录安全的校验。 前期工作 申请邮箱安全授权码 打开QQ邮箱官网点击设置 进入设置页面后点击账户按钮  进入账户后一直往下拉页面找到POP3服务栏,然后点击管理服务(如果没有开启服务需要先开启服务,按照邮箱提示操作即可) 进入管理服务页面后如果没有授权码,点击生成授权码,如果有即可进入授权码管理页面查看。 授权码过一段时间会自动过期,需要重

zdppy+vue3+onlyoffice文档管理系统实战 20240906 上课笔记 整合权限校验中间件

基于角色方法的中间件基本用法 import zdppy_api as apiimport zdppy_apimidauthasync def index(request):return api.resp.success()async def login(request):token = zdppy_apimidauth.get_role_token(role="admin")return ap

Spring源码学习--使用XML Schema文档对XML实例文档校验

文章摘要 在实际开发中读取xml文档的时候,一般都需要先校验,如果使用Sun的XML相关软件包会令你云里雾里。W3C这块的XML相关的规范相当的多,这也是导致XML处理器起来费劲的主要原因。如果xml对应的xsd文档已经定义好,则可以之间复用下面代码对xml文档格式和内容是否合法进行验证。 一、xsd校验xml工具类 import javax.xml.parsers.SA