听小董谝存储七

2023-11-05 15:21
文章标签 存储 小董

本文主要是介绍听小董谝存储七,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

序章

一些设定

关于WAL

恢复


我爱glt

序章

前面几章,我们已经明白了particle层的读写流程。但是我们还有问题如果机器断电了,数据怎么恢复。

一些设定

首先我们得先确定下面几个问题

1 什么时候需要恢复数据?

    当进程挂掉的时候

    当机器直接死机了

2 什么时候恢复的数据会真的被使用?

    我们有三个副本,当一个或者两个副本死掉了,我们会指向搬迁操作,把数据在新的地方变成新的三副本。只有当3个机器都死掉了,我们才需要使用恢复的数据。

3 哪些数据需要恢复?

                           

                                                                                  图一 particle层的数据分布

       如上图,我们先分析一下,图里面的几个模块都在什么地方。

       共享内存里:黄色的索引块,DataRegion里面的数据

       磁盘里:那就是已经下刷到磁盘里面的数据。

不管是否断电,磁盘里的数据都在,跑不了。我们不用管。

如果只是进程死掉了,那么进程重启的时候,只要重新把共享内存拉起来就能继续工作了。

如果是机器之间挂掉了,重新启动机器后,共享内存没有了。如果我们此时什么都不做,那我们面对的情况就是一个磁盘,磁盘里面有一堆数据,但是我压根不知道哪个key在哪个位置。

没有桥,老子就过不了河了么?

我tm绕着地球走一圈照样能过去!

就好像你给我一个没有了索引的字典,你让我怎么查?

没有索引的字典就不能查了么?

当然可以。我把字典的正文一页页的看,然后看到一个字就把它记录到索引里。我手动恢复索引不就OK了。

我们要恢复的其实就是内存里的索引。

                                                       

                                                                                         图二 丢失了索引

如上图二,我们没有任何数据索引。可是我们有BlockManager的索引,(前面每次下刷数据,回收block的时候,blockmanager的数据都会落盘)我们按照block生成的顺序从最早到最近依次遍历所有的block就能把数据索引反向补充回来。

                                                                         图三 根据blockManager 依次遍历block

图三有两个block里面都有DataB,该怎么处理呢?还需要说么?

搞定了,数据都恢复了。

恢复个屁!

还有一些数据在DataRegion里面呢,那些数据还没有进磁盘呢!断电就没有了。

关于WAL

刚才提到在dataregion里面的数据还没有下刷,都在内存里,断电自然就没有了。那么,咱们就把它们也放到磁盘里。写内存之前,就先放到磁盘里。也就是所谓的WAL(Write Ahead Log)。具体什么流程呢?如下图四的左半部分,就是数据在写入dataregion之前,就先写入缓存,如果缓存里面的数据大于8KB,就下刷到磁盘里的binlog文件里。 (这个文件在mysql里面叫redo log)

(有人说又要下刷磁盘,这恐怕对性能又损失。没办法,我们做的就是一个平衡的事情,而且顺序写ssd,速度也不是慢点不可接受,如果不下刷,或者说压根就不引人binlog机制,速度确实能快点,但是一旦断电就麻烦了) 

那磁盘里面的binlog得有多大?换句话说,binlog得保存多久。 看图四的右半部分。Binlog的长度不会大于dataregion的长度。每次从dataregion里面取数据下刷的时候,就会更新binlog的起点。

这样一来,任何时候断电,我们最多损失8KB的数据。(当然,我们也可以来一个数据,就顺序写一次binlog到ssd,但是前面也说了,这就是个平衡,你也可以当缓存大于80KB的时候下刷。)

                                                       

                                                                                  图四 引入wal的写流程                             

恢复

                      

                                                                    图五 恢复流程                        

主体流程就不解释了,你就想想你拿到一个只有正文的字典,怎么自己整理出索引。

关于最后还有一个设置服务状态,即使数据全部恢复了,也不会立即对外服务,需要后台开发任务手动设置一个标志位。毕竟三个机器都死的概率不大,真的需要从磁盘恢复数据的频率也不高,具体什么时候开始服务还是需要后台开发再评估一下的。

这篇关于听小董谝存储七的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/350752

相关文章

Redis存储的列表分页和检索的实现方法

《Redis存储的列表分页和检索的实现方法》在Redis中,列表(List)是一种有序的数据结构,通常用于存储一系列元素,由于列表是有序的,可以通过索引来访问元素,因此可以很方便地实现分页和检索功能,... 目录一、Redis 列表的基本操作二、分页实现三、检索实现3.1 方法 1:客户端过滤3.2 方法

C++中使用vector存储并遍历数据的基本步骤

《C++中使用vector存储并遍历数据的基本步骤》C++标准模板库(STL)提供了多种容器类型,包括顺序容器、关联容器、无序关联容器和容器适配器,每种容器都有其特定的用途和特性,:本文主要介绍C... 目录(1)容器及简要描述‌php顺序容器‌‌关联容器‌‌无序关联容器‌(基于哈希表):‌容器适配器‌:(

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

使用JavaScript操作本地存储

《使用JavaScript操作本地存储》这篇文章主要为大家详细介绍了JavaScript中操作本地存储的相关知识,文中的示例代码讲解详细,具有一定的借鉴价值,有需要的小伙伴可以参考一下... 目录本地存储:localStorage 和 sessionStorage基本使用方法1. localStorage

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

HDFS—存储优化(纠删码)

纠删码原理 HDFS 默认情况下,一个文件有3个副本,这样提高了数据的可靠性,但也带来了2倍的冗余开销。 Hadoop3.x 引入了纠删码,采用计算的方式,可以节省约50%左右的存储空间。 此种方式节约了空间,但是会增加 cpu 的计算。 纠删码策略是给具体一个路径设置。所有往此路径下存储的文件,都会执行此策略。 默认只开启对 RS-6-3-1024k

速了解MySQL 数据库不同存储引擎

快速了解MySQL 数据库不同存储引擎 MySQL 提供了多种存储引擎,每种存储引擎都有其特定的特性和适用场景。了解这些存储引擎的特性,有助于在设计数据库时做出合理的选择。以下是 MySQL 中几种常用存储引擎的详细介绍。 1. InnoDB 特点: 事务支持:InnoDB 是一个支持 ACID(原子性、一致性、隔离性、持久性)事务的存储引擎。行级锁:使用行级锁来提高并发性,减少锁竞争

ORACLE语法-包(package)、存储过程(procedure)、游标(cursor)以及java对Result结果集的处理

陈科肇 示例: 包规范 CREATE OR REPLACE PACKAGE PACK_WMS_YX IS-- Author : CKZ-- Created : 2015/8/28 9:52:29-- Purpose : 同步数据-- Public type declarations,游标 退休订单TYPE retCursor IS REF CURSOR;-- RETURN vi_co_co

OpenStack离线Train版安装系列—11.5实例使用-Cinder存储服务组件

本系列文章包含从OpenStack离线源制作到完成OpenStack安装的全部过程。 在本系列教程中使用的OpenStack的安装版本为第20个版本Train(简称T版本),2020年5月13日,OpenStack社区发布了第21个版本Ussuri(简称U版本)。 OpenStack部署系列文章 OpenStack Victoria版 安装部署系列教程 OpenStack Ussuri版

多云架构下大模型训练的存储稳定性探索

一、多云架构与大模型训练的融合 (一)多云架构的优势与挑战 多云架构为大模型训练带来了诸多优势。首先,资源灵活性显著提高,不同的云平台可以提供不同类型的计算资源和存储服务,满足大模型训练在不同阶段的需求。例如,某些云平台可能在 GPU 计算资源上具有优势,而另一些则在存储成本或性能上表现出色,企业可以根据实际情况进行选择和组合。其次,扩展性得以增强,当大模型的规模不断扩大时,单一云平