Mysql在线安全变更工具 gh-ost

2024-09-06 13:36

本文主要是介绍Mysql在线安全变更工具 gh-ost,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

gh-ost(GitHub Online Schema Translater)是一个用于安全地进行 MySQL 数据库表结构变更的工具,专门为在线数据库迁移而设计。它的主要优点是可以在不中断业务的情况下,不影响数据库的可用性和性能,进行表结构的修改。

主要特点

  1. 在线迁移gh-ost 允许在高负载的生产环境中进行表结构的更改,而不需要锁定表,确保数据库的可用性。

  2. 渐进式复制:通过逐步复制行,gh-ost 可以在针对大量数据的情况下,避免短时间内的负载高峰。

  3. 安全性:它具备自动回滚功能,如果迁移过程中出现问题,可以安全地回滚到原始状态。

  4. 编程和操作简便:工具使用简单、直观,与 MySQL 客户端兼容,支持使用 SQL 语句进行表结构的更改。

  5. 多种配置选项:支持多种选项用于配置操作,例如并行迁移、最大移动速度等。

使用场景

  • 发布新字段:添加新的列而不影响应用的访问。
  • 修改现有字段类型:安全地改变列的数据类型,比如从 VARCHARTEXT
  • 重命名列:而不影响运行中的系统。

基本用法

  1. 安装:可以通过 github 下载可执行文件,或使用 Homebrew(在 macOS 上)进行安装。

    brew install gh-ost
    
  2. 基本命令
    以下是一个使用 gh-ost 进行表结构变更的基本示例:

    gh-ost \
    --max-load=Threads_running=25 \
    --critical-load=Threads_running=1000 \
    --host=127.0.0.1 \
    --user=username \
    --password=your_password \
    --database=your_database \
    --table=your_table \
    --alter="ADD COLUMN new_col INT DEFAULT 0" \
    --execute
    

    这个命令将向 your_table 表中添加一个名为 new_col 的新列,字段类型为 INT,默认值为 0。

配置选项

  • --max-load:指定允许的最大负载。
  • --critical-load:指定触发回滚的负载。
  • --host--user--password:数据库连接信息。
  • --database--table:要修改的数据库和表名。
  • --alter:指定 ALTER 语句。
  • --execute:表示执行迁移;如果不加这个选项,则只进行干运行(dry run),不实际执行。

gh-ost 数据迁移流程

1. 准备与初始化
  • 安装与配置:确保你的 MySQL 数据库已启用二进制日志(binlog),并安装 gh-ost 工具。
  • 参数设置:使用合适的参数启动 gh-ost,包括连接信息、要迁移的表、变更语句等。
2. 创建临时表
  • 临时表的结构gh-ost 首先会创建一个新的临时表,并按照你的 ALTER 语句的定义,将原有表的结构复制到临时表中
  • 开始复制数据:临时表一旦创建,gh-ost 即可开始将原始表中的现有数据逐行复制到临时表中。
3. 数据复制与变更监控
  • 逐行复制gh-ost 以增量的方式逐行将原始表的数据复制到临时表,这个复制过程是渐进的,确保了对数据库的负载最低。

  • 使用事务隔离:在数据复制的过程中,gh-ost 使用 REPEATABLE READ 事务隔离级别。这意味着在数据复制期间,原始表的读取是一个快照,不会受到其他事务的影响。

  • 监控二进制日志(binlog)

    • 同时,gh-ost 启动一个线程,实时监控 MySQL 的 binlog,捕获所有对原始表的变更(包括 INSERT、UPDATE、DELETE)。
    • 这允许 gh-ost 捕获到在数据复制过程中对原始表的任何更新。
4. 实时同步变更
  • 处理变更

    • 任何在数据复制过程中对原始表的变更(例如:INSERT 或 UPDATE)都会被 gh-ost 监控到并记录在 binlog 中。
    • gh-ost 会将这些变化实时应用到临时表中(不会等到复制完成后,再处理变更数据),确保临时表里的数据与原始表保持同步。
  • 最终更新操作

    • 对于原始表的更新操作,如果在复制到某一行时,该行数据已经被修改,gh-ost 将依赖于二进制日志来更新临时表,以阻止出现数据不一致的情况。
5. 表切换
  • 完成复制与更新

    • 一旦所有的数据都已复制,并且所有的二进制日志变更均已同步到临时表,gh-ost 将进行最后的检查。
  • 原子重命名

    • gh-ost 进行原子操作,将原始表重命名为备份名称(例如:your_table_old),然后将临时表重命名为原始表的名称(例如:your_table)。
    • 这一过程确保在任何时刻,数据库中的数据都是一致的,并且整个迁移操作对外界是透明的。
6. 清理与回滚
  • 删除旧表:如果配置允许,gh-ost 可以安全删除旧表,以释放资源。
  • 回滚机制
    • 如果在迁移过程中发生错误,gh-ost 会提供回滚功能,能够安全地将数据库恢复到原始状态,从而确保错误不会影响数据库的运作和数据的完整性。

总结

gh-ost 通过以上步骤实现了在线、安全、逐渐的 MySQL 数据迁移。其设计保证了在整个过程中,数据的一致性和准确性,以及对生产系统的影响最小。利用事务隔离和二进制日志捕获gh-ost 确保所有变更都在迁移过程中得以有效处理,最终实现平滑的表结构更新。

这篇关于Mysql在线安全变更工具 gh-ost的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1142148

相关文章

java图像识别工具类(ImageRecognitionUtils)使用实例详解

《java图像识别工具类(ImageRecognitionUtils)使用实例详解》:本文主要介绍如何在Java中使用OpenCV进行图像识别,包括图像加载、预处理、分类、人脸检测和特征提取等步骤... 目录前言1. 图像识别的背景与作用2. 设计目标3. 项目依赖4. 设计与实现 ImageRecogni

Mysql虚拟列的使用场景

《Mysql虚拟列的使用场景》MySQL虚拟列是一种在查询时动态生成的特殊列,它不占用存储空间,可以提高查询效率和数据处理便利性,本文给大家介绍Mysql虚拟列的相关知识,感兴趣的朋友一起看看吧... 目录1. 介绍mysql虚拟列1.1 定义和作用1.2 虚拟列与普通列的区别2. MySQL虚拟列的类型2

mysql数据库分区的使用

《mysql数据库分区的使用》MySQL分区技术通过将大表分割成多个较小片段,提高查询性能、管理效率和数据存储效率,本文就来介绍一下mysql数据库分区的使用,感兴趣的可以了解一下... 目录【一】分区的基本概念【1】物理存储与逻辑分割【2】查询性能提升【3】数据管理与维护【4】扩展性与并行处理【二】分区的

MySQL中时区参数time_zone解读

《MySQL中时区参数time_zone解读》MySQL时区参数time_zone用于控制系统函数和字段的DEFAULTCURRENT_TIMESTAMP属性,修改时区可能会影响timestamp类型... 目录前言1.时区参数影响2.如何设置3.字段类型选择总结前言mysql 时区参数 time_zon

Python MySQL如何通过Binlog获取变更记录恢复数据

《PythonMySQL如何通过Binlog获取变更记录恢复数据》本文介绍了如何使用Python和pymysqlreplication库通过MySQL的二进制日志(Binlog)获取数据库的变更记录... 目录python mysql通过Binlog获取变更记录恢复数据1.安装pymysqlreplicat

基于Python开发电脑定时关机工具

《基于Python开发电脑定时关机工具》这篇文章主要为大家详细介绍了如何基于Python开发一个电脑定时关机工具,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 简介2. 运行效果3. 相关源码1. 简介这个程序就像一个“忠实的管家”,帮你按时关掉电脑,而且全程不需要你多做

使用SQL语言查询多个Excel表格的操作方法

《使用SQL语言查询多个Excel表格的操作方法》本文介绍了如何使用SQL语言查询多个Excel表格,通过将所有Excel表格放入一个.xlsx文件中,并使用pandas和pandasql库进行读取和... 目录如何用SQL语言查询多个Excel表格如何使用sql查询excel内容1. 简介2. 实现思路3

基于C#实现PDF文件合并工具

《基于C#实现PDF文件合并工具》这篇文章主要为大家详细介绍了如何基于C#实现一个简单的PDF文件合并工具,文中的示例代码简洁易懂,有需要的小伙伴可以跟随小编一起学习一下... 界面主要用于发票PDF文件的合并。经常出差要报销的很有用。代码using System;using System.Col

redis-cli命令行工具的使用小结

《redis-cli命令行工具的使用小结》redis-cli是Redis的命令行客户端,支持多种参数用于连接、操作和管理Redis数据库,本文给大家介绍redis-cli命令行工具的使用小结,感兴趣的... 目录基本连接参数基本连接方式连接远程服务器带密码连接操作与格式参数-r参数重复执行命令-i参数指定命

Mysql DATETIME 毫秒坑的解决

《MysqlDATETIME毫秒坑的解决》本文主要介绍了MysqlDATETIME毫秒坑的解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 今天写代码突发一个诡异的 bug,代码逻辑大概如下。1. 新增退款单记录boolean save = s