数据库冷热隔离方案

2023-11-09 20:30
文章标签 数据库 方案 隔离 冷热

本文主要是介绍数据库冷热隔离方案,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数据现装

目前项目中的数据存储在mysql数据库中,虽然mysql按照业务域分库(16个),单库256张表。但是表数据量目前300W,每日新增560w,平均每张物理表日新增数据量560W/256=2.18W。每张表数据量上限按照800W条计算,距离每张表的上限需要(800-300)/2.18=229天。

业务还在持续增长,提前对DB做冷热隔离。

前期技术选型

压缩选型

压缩比

性能

CPU消耗

archive

1/10-1/15

一般,只支持insert和select,不支持update

未知

tokudb

大约25%

较差

innodb

25%-50%

3倍tokudb

高,5倍于x-engine

X-Engine

10%-50%

和innodb相似(LSM-tree)

后期技术调研

直接将数据存储在Hbase或者ES等基于HDFS分布式存储架构中,当数据量持续增长时,如果遇到存储瓶颈直接加机器即可。目前主流的大数据量也按照此方案存储。例如阿里的lindorm(Hbase上做的封装),腾讯的基于ES的一个技术栈(具体叫啥名记不清了)。

隔离方案

91dc768c1c8cad306d1c75fe3edc4532.png

全量数据同步方案

mysql每天会同步数据至数据仓库hive中(odps),考虑到有业务持续写入,减少db的压力,采用离线同步方案,将hive(odps)中的数据采用快照方式同步到Hbase中(lindorm)。

增量数据同步方案

方案1.采用消费mysql binlog的方式去同步数据至冷库(Hbase)中。

方案2.a.先采用方案1执行。b.当mysql业务数据写成功之后发一条mq消息。c.创建消费者消费此主题消息,写冷库(Hbase)。d.停止a这一步。

如果采用方案1同步增量数据,为了保证数据的安全性和一致性,可以在全量任务开始前就启动增量任务,但是增量任务此时不消费binlog同步数据,将消费binlog的位点前置(早于全量任务开始,或者和全量任务开始时间一致).当全量任务跑完的时间点增量任务开始消费binlog。

如果采用方案2同步增量数据,此方案可能会有重复数据出现,但是Hbase中修改操作也是新增一条数据,每条数据对应一个时间戳做多版本,当查询数据时,会按照时间戳取最新的那条数据。为了节省预算资源和保证数据的安全性,必须采用方案1先执行,然后消费mq,再停止方案1。

注意:为保证全量任务迁移安全,全量任务执行期间,不要往热库写数据。

当数据迁移完成后删除热库(mysql)中100天之后的数据,这样就保证了mysql的空间资源,同时需要对mysql做optimize。

需要分库分表的扫描,然后按照主键id删除数据。

接口改造

逻辑层再加一层路由层,判断数据的创建时间,如果大于90天就请求冷DB,如果小于90天就请求热DB。

测试及其灰度配置

此外 可以在diamond(阿里)或者Apollo(携程)或者wconfig(58)等可配置化平台配置白名单,采用变动推送新配置方式,项目实时读取新配置。通过白名单做测试用。同时在diamond上采用分桶方式在上线之后做灰度百分比,如果一旦发现问题将请求冷DB流量切换至0%,及时回滚。

下面这个是我在diamond上的配置:

{
    "experiment": "AHIM_DB_B2C",
    "totalBucket": 1000,
    "divideType": "cid",
    "config": {
        "buckets": [{
            "startBucket": 0,
            "endBucket": -1,
            "whiteList": ["111","222","333"],
            "bucketType": 1
        }],
        "defaultBuckets": 0
    }
}

可以在代码中加开关控制,有问题随时关闭开关,停止走冷库逻辑

这篇关于数据库冷热隔离方案的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/378298

相关文章

SpringBoot3.X 整合 MinIO 存储原生方案

《SpringBoot3.X整合MinIO存储原生方案》本文详细介绍了SpringBoot3.X整合MinIO的原生方案,从环境搭建到核心功能实现,涵盖了文件上传、下载、删除等常用操作,并补充了... 目录SpringBoot3.X整合MinIO存储原生方案:从环境搭建到实战开发一、前言:为什么选择MinI

SQL server数据库如何下载和安装

《SQLserver数据库如何下载和安装》本文指导如何下载安装SQLServer2022评估版及SSMS工具,涵盖安装配置、连接字符串设置、C#连接数据库方法和安全注意事项,如混合验证、参数化查... 目录第一步:打开官网下载对应文件第二步:程序安装配置第三部:安装工具SQL Server Manageme

C#连接SQL server数据库命令的基本步骤

《C#连接SQLserver数据库命令的基本步骤》文章讲解了连接SQLServer数据库的步骤,包括引入命名空间、构建连接字符串、使用SqlConnection和SqlCommand执行SQL操作,... 目录建议配合使用:如何下载和安装SQL server数据库-CSDN博客1. 引入必要的命名空间2.

Java通过驱动包(jar包)连接MySQL数据库的步骤总结及验证方式

《Java通过驱动包(jar包)连接MySQL数据库的步骤总结及验证方式》本文详细介绍如何使用Java通过JDBC连接MySQL数据库,包括下载驱动、配置Eclipse环境、检测数据库连接等关键步骤,... 目录一、下载驱动包二、放jar包三、检测数据库连接JavaJava 如何使用 JDBC 连接 mys

Knife4j+Axios+Redis前后端分离架构下的 API 管理与会话方案(最新推荐)

《Knife4j+Axios+Redis前后端分离架构下的API管理与会话方案(最新推荐)》本文主要介绍了Swagger与Knife4j的配置要点、前后端对接方法以及分布式Session实现原理,... 目录一、Swagger 与 Knife4j 的深度理解及配置要点Knife4j 配置关键要点1.Spri

MySQL数据库中ENUM的用法是什么详解

《MySQL数据库中ENUM的用法是什么详解》ENUM是一个字符串对象,用于指定一组预定义的值,并可在创建表时使用,下面:本文主要介绍MySQL数据库中ENUM的用法是什么的相关资料,文中通过代码... 目录mysql 中 ENUM 的用法一、ENUM 的定义与语法二、ENUM 的特点三、ENUM 的用法1

Java中调用数据库存储过程的示例代码

《Java中调用数据库存储过程的示例代码》本文介绍Java通过JDBC调用数据库存储过程的方法,涵盖参数类型、执行步骤及数据库差异,需注意异常处理与资源管理,以优化性能并实现复杂业务逻辑,感兴趣的朋友... 目录一、存储过程概述二、Java调用存储过程的基本javascript步骤三、Java调用存储过程示

Go语言数据库编程GORM 的基本使用详解

《Go语言数据库编程GORM的基本使用详解》GORM是Go语言流行的ORM框架,封装database/sql,支持自动迁移、关联、事务等,提供CRUD、条件查询、钩子函数、日志等功能,简化数据库操作... 目录一、安装与初始化1. 安装 GORM 及数据库驱动2. 建立数据库连接二、定义模型结构体三、自动迁

SQLite3 在嵌入式C环境中存储音频/视频文件的最优方案

《SQLite3在嵌入式C环境中存储音频/视频文件的最优方案》本文探讨了SQLite3在嵌入式C环境中存储音视频文件的优化方案,推荐采用文件路径存储结合元数据管理,兼顾效率与资源限制,小文件可使用B... 目录SQLite3 在嵌入式C环境中存储音频/视频文件的专业方案一、存储策略选择1. 直接存储 vs

嵌入式数据库SQLite 3配置使用讲解

《嵌入式数据库SQLite3配置使用讲解》本文强调嵌入式项目中SQLite3数据库的重要性,因其零配置、轻量级、跨平台及事务处理特性,可保障数据溯源与责任明确,详细讲解安装配置、基础语法及SQLit... 目录0、惨痛教训1、SQLite3环境配置(1)、下载安装SQLite库(2)、解压下载的文件(3)、