数据库冷热隔离方案

2023-11-09 20:30
文章标签 数据库 方案 隔离 冷热

本文主要是介绍数据库冷热隔离方案,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数据现装

目前项目中的数据存储在mysql数据库中,虽然mysql按照业务域分库(16个),单库256张表。但是表数据量目前300W,每日新增560w,平均每张物理表日新增数据量560W/256=2.18W。每张表数据量上限按照800W条计算,距离每张表的上限需要(800-300)/2.18=229天。

业务还在持续增长,提前对DB做冷热隔离。

前期技术选型

压缩选型

压缩比

性能

CPU消耗

archive

1/10-1/15

一般,只支持insert和select,不支持update

未知

tokudb

大约25%

较差

innodb

25%-50%

3倍tokudb

高,5倍于x-engine

X-Engine

10%-50%

和innodb相似(LSM-tree)

后期技术调研

直接将数据存储在Hbase或者ES等基于HDFS分布式存储架构中,当数据量持续增长时,如果遇到存储瓶颈直接加机器即可。目前主流的大数据量也按照此方案存储。例如阿里的lindorm(Hbase上做的封装),腾讯的基于ES的一个技术栈(具体叫啥名记不清了)。

隔离方案

91dc768c1c8cad306d1c75fe3edc4532.png

全量数据同步方案

mysql每天会同步数据至数据仓库hive中(odps),考虑到有业务持续写入,减少db的压力,采用离线同步方案,将hive(odps)中的数据采用快照方式同步到Hbase中(lindorm)。

增量数据同步方案

方案1.采用消费mysql binlog的方式去同步数据至冷库(Hbase)中。

方案2.a.先采用方案1执行。b.当mysql业务数据写成功之后发一条mq消息。c.创建消费者消费此主题消息,写冷库(Hbase)。d.停止a这一步。

如果采用方案1同步增量数据,为了保证数据的安全性和一致性,可以在全量任务开始前就启动增量任务,但是增量任务此时不消费binlog同步数据,将消费binlog的位点前置(早于全量任务开始,或者和全量任务开始时间一致).当全量任务跑完的时间点增量任务开始消费binlog。

如果采用方案2同步增量数据,此方案可能会有重复数据出现,但是Hbase中修改操作也是新增一条数据,每条数据对应一个时间戳做多版本,当查询数据时,会按照时间戳取最新的那条数据。为了节省预算资源和保证数据的安全性,必须采用方案1先执行,然后消费mq,再停止方案1。

注意:为保证全量任务迁移安全,全量任务执行期间,不要往热库写数据。

当数据迁移完成后删除热库(mysql)中100天之后的数据,这样就保证了mysql的空间资源,同时需要对mysql做optimize。

需要分库分表的扫描,然后按照主键id删除数据。

接口改造

逻辑层再加一层路由层,判断数据的创建时间,如果大于90天就请求冷DB,如果小于90天就请求热DB。

测试及其灰度配置

此外 可以在diamond(阿里)或者Apollo(携程)或者wconfig(58)等可配置化平台配置白名单,采用变动推送新配置方式,项目实时读取新配置。通过白名单做测试用。同时在diamond上采用分桶方式在上线之后做灰度百分比,如果一旦发现问题将请求冷DB流量切换至0%,及时回滚。

下面这个是我在diamond上的配置:

{
    "experiment": "AHIM_DB_B2C",
    "totalBucket": 1000,
    "divideType": "cid",
    "config": {
        "buckets": [{
            "startBucket": 0,
            "endBucket": -1,
            "whiteList": ["111","222","333"],
            "bucketType": 1
        }],
        "defaultBuckets": 0
    }
}

可以在代码中加开关控制,有问题随时关闭开关,停止走冷库逻辑

这篇关于数据库冷热隔离方案的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/378298

相关文章

IDEA如何切换数据库版本mysql5或mysql8

《IDEA如何切换数据库版本mysql5或mysql8》本文介绍了如何将IntelliJIDEA从MySQL5切换到MySQL8的详细步骤,包括下载MySQL8、安装、配置、停止旧服务、启动新服务以及... 目录问题描述解决方案第一步第二步第三步第四步第五步总结问题描述最近想开发一个新应用,想使用mysq

Oracle数据库使用 listagg去重删除重复数据的方法汇总

《Oracle数据库使用listagg去重删除重复数据的方法汇总》文章介绍了在Oracle数据库中使用LISTAGG和XMLAGG函数进行字符串聚合并去重的方法,包括去重聚合、使用XML解析和CLO... 目录案例表第一种:使用wm_concat() + distinct去重聚合第二种:使用listagg,

Java读取InfluxDB数据库的方法详解

《Java读取InfluxDB数据库的方法详解》本文介绍基于Java语言,读取InfluxDB数据库的方法,包括读取InfluxDB的所有数据库,以及指定数据库中的measurement、field、... 首先,创建一个Java项目,用于撰写代码。接下来,配置所需要的依赖;这里我们就选择可用于与Infl

详谈redis跟数据库的数据同步问题

《详谈redis跟数据库的数据同步问题》文章讨论了在Redis和数据库数据一致性问题上的解决方案,主要比较了先更新Redis缓存再更新数据库和先更新数据库再更新Redis缓存两种方案,文章指出,删除R... 目录一、Redis 数据库数据一致性的解决方案1.1、更新Redis缓存、删除Redis缓存的区别二

oracle数据库索引失效的问题及解决

《oracle数据库索引失效的问题及解决》本文总结了在Oracle数据库中索引失效的一些常见场景,包括使用isnull、isnotnull、!=、、、函数处理、like前置%查询以及范围索引和等值索引... 目录oracle数据库索引失效问题场景环境索引失效情况及验证结论一结论二结论三结论四结论五总结ora

C#实现文件读写到SQLite数据库

《C#实现文件读写到SQLite数据库》这篇文章主要为大家详细介绍了使用C#将文件读写到SQLite数据库的几种方法,文中的示例代码讲解详细,感兴趣的小伙伴可以参考一下... 目录1. 使用 BLOB 存储文件2. 存储文件路径3. 分块存储文件《文件读写到SQLite数据库China编程的方法》博客中,介绍了文

Android数据库Room的实际使用过程总结

《Android数据库Room的实际使用过程总结》这篇文章主要给大家介绍了关于Android数据库Room的实际使用过程,详细介绍了如何创建实体类、数据访问对象(DAO)和数据库抽象类,需要的朋友可以... 目录前言一、Room的基本使用1.项目配置2.创建实体类(Entity)3.创建数据访问对象(DAO

SQL Server数据库磁盘满了的解决办法

《SQLServer数据库磁盘满了的解决办法》系统再正常运行,我还在操作中,突然发现接口报错,后续所有接口都报错了,一查日志发现说是数据库磁盘满了,所以本文记录了SQLServer数据库磁盘满了的解... 目录问题解决方法删除数据库日志设置数据库日志大小问题今http://www.chinasem.cn天发

Java解析JSON的六种方案

《Java解析JSON的六种方案》这篇文章介绍了6种JSON解析方案,包括Jackson、Gson、FastJSON、JsonPath、、手动解析,分别阐述了它们的功能特点、代码示例、高级功能、优缺点... 目录前言1. 使用 Jackson:业界标配功能特点代码示例高级功能优缺点2. 使用 Gson:轻量

Redis KEYS查询大批量数据替代方案

《RedisKEYS查询大批量数据替代方案》在使用Redis时,KEYS命令虽然简单直接,但其全表扫描的特性在处理大规模数据时会导致性能问题,甚至可能阻塞Redis服务,本文将介绍SCAN命令、有序... 目录前言KEYS命令问题背景替代方案1.使用 SCAN 命令2. 使用有序集合(Sorted Set)