听小董谝存储 八

2023-11-05 15:21
文章标签 存储 小董

本文主要是介绍听小董谝存储 八,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

序章

Dispatcher

Mover

几个问题


我爱glt

序章

前面几章,其实已经把这个存储系统的核心模块说清楚了。但是一些附属模块,例如dispatcher与mover还是没有讲。这一节,作为整个系统的最后一篇,就说说这两个模块。

Dispatcher

其实整个dispatcher的功能很简单的,就是发现集群里面的不稳定因素,然后找人处理而已。

那么具体什么情况算是不稳定因素呢?

  •       某个datashard的体积太大(单个datashard理论上可以达到一个卷的体积那么大)
  •       某个particle或者某个卷dead
  •       某个业务用的datashard太多了,需要合并
  •       某个业务用的datashard太少了,读写性能不够,需要分裂
  •       某组机器上占用的体积超过、少于平均值n个百分点

发生类似上面的情况,就说明数据需要发生搬迁分裂合并等操作了,然后dispatcher就计算应该几个并发,在不影响现网读写的情况下,指挥mover进行数据搬迁分裂合并。

完了,dispatcher的功能就是这么简单。那么再问一句,它所需要的原始数据从哪里来呢?答案就是Master。

Mover

前文已经不止一次说了mover的功能就是进行数据搬迁分裂与合并。

那咱们就以搬迁为例,说说它具体怎么操作。如下图一,就是particle的简略写数据流程。

                                              

 

                                                                                            图一 particle简略的写流程                       

具体搬迁的时候,Mover只需要把历史数据搬迁走就OK了,新增数据protal那一层已经采用了双写模式,不用担心。那具体的历史数据怎么读取呢。直接把要搬迁的data shard所属的block打包搬迁走就OK了。如下图二。

                       

 

                                                                                            图二 Mover执行搬迁任务

新的机器那边,收到一个block后,先放到自己的磁盘里,然后把里面的每一个值都解析一下,反向更新到索引节点里。

那搬迁什么时候算是个头呢?老的机器那边数据一直在下刷,一直有新的block产生。

那就在搬迁的过程中,禁止这个data shard的DataRegion下刷。

这样一来,历史的数据占据了几个磁盘里面的block就是确定的了,终归是能搬迁完的。

几个问题

  • 可是如果搬迁需要很长时间,然后数据又一直写,dataregion的长度不够了怎么办?

我们设定了搬迁的最长时间,绝大多数的data shard在这个时间内都能搬迁完成。

  • 那如果就是有一个data shard写入的速度很快,时间就是不够怎么办?

首先,因为整体的路由是经过hash的,所以data shard的写入频率是和它负责的区域长度相关的,如果一个data shard负责的范围太大,前面的dispatcher就会识别到这种问题,先一步进行数据分裂。如果真的dispatcher出问题了,导致有一个data shard的增长速度特别快,在给定的时间内不能搬迁完成,那就只能手动调整搬迁时间了。

 

这篇关于听小董谝存储 八的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/350754

相关文章

C# WinForms存储过程操作数据库的实例讲解

《C#WinForms存储过程操作数据库的实例讲解》:本文主要介绍C#WinForms存储过程操作数据库的实例,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、存储过程基础二、C# 调用流程1. 数据库连接配置2. 执行存储过程(增删改)3. 查询数据三、事务处

Oracle存储过程里操作BLOB的字节数据的办法

《Oracle存储过程里操作BLOB的字节数据的办法》该篇文章介绍了如何在Oracle存储过程中操作BLOB的字节数据,作者研究了如何获取BLOB的字节长度、如何使用DBMS_LOB包进行BLOB操作... 目录一、缘由二、办法2.1 基本操作2.2 DBMS_LOB包2.3 字节级操作与RAW数据类型2.

Java实现数据库图片上传与存储功能

《Java实现数据库图片上传与存储功能》在现代的Web开发中,上传图片并将其存储在数据库中是常见的需求之一,本文将介绍如何通过Java实现图片上传,存储到数据库的完整过程,希望对大家有所帮助... 目录1. 项目结构2. 数据库表设计3. 实现图片上传功能3.1 文件上传控制器3.2 图片上传服务4. 实现

C语言中的浮点数存储详解

《C语言中的浮点数存储详解》:本文主要介绍C语言中的浮点数存储详解,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、首先明确一个概念2、接下来,讲解C语言中浮点型数存储的规则2.1、可以将上述公式分为两部分来看2.2、问:十进制小数0.5该如何存储?2.3 浮点

MySQL常见的存储引擎和区别说明

《MySQL常见的存储引擎和区别说明》MySQL支持多种存储引擎,如InnoDB、MyISAM、MEMORY、Archive、CSV和Blackhole,每种引擎有其特点和适用场景,选择存储引擎时需根... 目录mysql常见的存储引擎和区别说明1. InnoDB2. MyISAM3. MEMORY4. A

Golang基于内存的键值存储缓存库go-cache

《Golang基于内存的键值存储缓存库go-cache》go-cache是一个内存中的key:valuestore/cache库,适用于单机应用程序,本文主要介绍了Golang基于内存的键值存储缓存库... 目录文档安装方法示例1示例2使用注意点优点缺点go-cache 和 Redis 缓存对比1)功能特性

Redis存储的列表分页和检索的实现方法

《Redis存储的列表分页和检索的实现方法》在Redis中,列表(List)是一种有序的数据结构,通常用于存储一系列元素,由于列表是有序的,可以通过索引来访问元素,因此可以很方便地实现分页和检索功能,... 目录一、Redis 列表的基本操作二、分页实现三、检索实现3.1 方法 1:客户端过滤3.2 方法

C++中使用vector存储并遍历数据的基本步骤

《C++中使用vector存储并遍历数据的基本步骤》C++标准模板库(STL)提供了多种容器类型,包括顺序容器、关联容器、无序关联容器和容器适配器,每种容器都有其特定的用途和特性,:本文主要介绍C... 目录(1)容器及简要描述‌php顺序容器‌‌关联容器‌‌无序关联容器‌(基于哈希表):‌容器适配器‌:(

使用MongoDB进行数据存储的操作流程

《使用MongoDB进行数据存储的操作流程》在现代应用开发中,数据存储是一个至关重要的部分,随着数据量的增大和复杂性的增加,传统的关系型数据库有时难以应对高并发和大数据量的处理需求,MongoDB作为... 目录什么是MongoDB?MongoDB的优势使用MongoDB进行数据存储1. 安装MongoDB

使用JavaScript操作本地存储

《使用JavaScript操作本地存储》这篇文章主要为大家详细介绍了JavaScript中操作本地存储的相关知识,文中的示例代码讲解详细,具有一定的借鉴价值,有需要的小伙伴可以参考一下... 目录本地存储:localStorage 和 sessionStorage基本使用方法1. localStorage