华为云计算IE面试笔记-fusionstorage相对于传统集中式存储的优势

本文主要是介绍华为云计算IE面试笔记-fusionstorage相对于传统集中式存储的优势,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

fusionstorage是华为研发的一款分布式存储软件,可以将X86架构的服务器组成一个存储池,向上提供统一的存储能力。

传统存储:一般是指SAN存储、NAS存储、对象存储,是一种硬件存储,硬件和软件是强耦合的。

1. 数据保护方式:FusionStorage是副本机制,传统存储是RAID

2. 成本:FS价格比较低廉,性价比较高,传统存储价格比较昂贵

3. 组网:传统存储的组网成本高,但是组网逻辑简单;Fusionstorage组网成本低(由于都是通用设备),但是组网逻辑复杂(区分开管理网络和存储网络)。

4. 部署方面:传统存储部署简单;Fusionstorage部署过程较为复杂

5. 性能:Fusionstorage大场景使用性能比较好,因为采用分布式架构,数据分散存放,多个控制进程的存在,处理并发IO;传统存储小场景使用性能比较好,传统存储数据处理上并发IO容易产生瓶颈,多种不同业务使用相同控制器会导致控制器压力过大造成性能下降(控制器瓶颈)。

6. 维护/扩展:传统存储,在多厂商异构的时候,维护工具太多,维护平台和维护的方法由于厂家的不同,会不一样;受控制器的限制,扩展比较困难,通常是2—16控(控制器最大达到16控,中端8控,高端16控),高端存储可以实现32甚至到64控的。存在元数据瓶颈。

Fusionstorage,由于Fusionstorage可以由不同厂家的服务器来组成的存储池,在组成存储池时已经去差异化了。管理界面统一,易于维护;采用分布式控制器(分布式软件机头VBS),可线性扩展到4096个节点。

7. 场景:对业务稳定性可靠性要求比较高的场景用传统存储。 

FusionStorage由于是服务器组成的存储池,受制于X86架构服务器本身的稳定性,适合追求高性能的应用。由于Fusionstorage对虚拟化的支持较好,可以和虚拟化环境合布,充分利用服务器本地的资源。所以说虚拟化场景选择Fusionstorage相对来说多一点。适合大规模存储场景(虚拟化数据中心或者私有云场景等)

8. 数据重建:fs 数据重建时间短  传统存储数据重建时间较长

9. cache:fs通常为TB级,分布式cache(每个服务器上加一个SSD盘做分布式Cache,众多的SSD盘做Cache空间);传统存储cache由内存提供通常为GB级,可以达到TB,但是成本高

10. 掉电保护:FusionStorage使用保电介质来保存元数据和缓存数据,程序运行过程中会把元数据和缓存数据写入保电介质中,以防掉电而丢失

10. 管理 专用的存储管理(bcmanager)

 

*FusionStorage对比传统存储有哪些缺点、劣势?(考到)

1. FusionStorage至少三点节起步,并且在节点数据量/节点数达到一定规模后性能才能赶上传统存储

2. 小规模场景, FusionStorage 的实施比传统存储复杂许多

3. 资源要求过高:存储要求、计算要求(CPU、内存)

4. FusionStorage并不支持数据容灾,在应用FusionStorage的场景,只能通过上层完成

5. FusionStorage由于采用分布式架构,延迟较大些,不适用于对时延敏感的业务(如OLTP)传统存储可使用FusionCompute链路,延时较低,利用率高

6. FusionStorage采用两副本或三副本的机制,存储利用率较低

7. FusionStorage目前不像某些传统存储(例如华为的统一存储)同时提供文件存储、对象存储服务(不支持同时提供)

小规模场景:至少三台服务器,共 12 盘,服务器级安全

大规模场景:至少 12 台服务器,至少三个机柜,机柜级安全

*传统存储的优点:

1. 读写连续,适用于高IO密度的读写。

2. 专业存储设备,设备可靠性较高。

*Server SAN 是什么?有哪些特征?

FS是Server SAN的一种。

概念:由多个独立服务器自带的存储组成一个存储资源池,同时融合了计算和存储资源

特征:1、专有设备(传统存储)变通用设备(x86部署fs)  

2、计算与存储线性扩展  

3、简单管理、低TCO

*FusionStorage对比传统存储有什么优势? 

 

目前,部分传统存储进行IB组网,但并非标配。

V3存储使用smartcache特性,将SSD盘作为介质提供读缓存,使读缓存也能够达到TB级别。

教材中介绍,传统存储数据重建慢,指的是T系列存储的盘级虚拟化技术,以整块盘为单位,重构到热备盘,数据重构的时候无法实现并发性重构。而V3存储底层使用的是raid 2.0+技术,同样可以实现并发性的重构,重构速度较快。

 

*为什么用 VBS 就可以扩展到 4096 个节点?

VBS等于传统存储的控制器 可以扩展到4096节点 因为他是分布式 无状态的 

首先,4096 个节点是指 FusionStorage 产品规格上支持分布式无状态软件控制器节点的数量;其次,元数据服务是由 VBS 负责,而元数据服务是由控制器提供。

*何为线性扩展?(考到)

1. 在增加节点的同时,即能扩展存储系统的性能也能扩展存储系统的容量。(扩展计算和存储)

2. 在增加 VBS 节点数量时性能线性增长。

*元数据服务集中于机头,易出现性能瓶项?

传统存储,针对于某个LUN而言,它的元数据集中于某个控制器,当过多的主机使用同一个LUN的时候,都要经过机头访问它的元数据,所以这种情况下,元数据就会出现瓶颈。

而FusionStorage是分布的无状态的,当访问同一个LUN的时候,或者去操作元数据的时候,都是通过VBS来操作的,且通过DHT算法算出来的。

*FusionStorage 扩展到4096 个节点,会带来什么问题?

1. 节点多,VBS占用存储多,浪费磁盘空间多;

2. 不够绿色节能;

3. 系统启动会变慢;主VBS性能瓶颈

4. 数据庞大,无法进行容灾;

*FusionStorage 如何保障数据的可靠性

副本机制:数据存储时被分片打散到多个节点上,这些分片数据支持分布在不同的存储节点、不同的机柜之间,同时数据存储时采用多副本技术、支持两副本或三副本(副本数量可在初次配置时进行设置,运行后不可更改),数据会自动保存多份,每一个分片的不同副本也被分散保存到不同的存储节点上。 

快速数据重建:在硬件发生故障导致数据不一致时,FusionStorage通过内部的自检机制,通过比较不同节点上的副本分片,自动发现数据故障。发现故障后启动数据修复机制,在后台修复数据。由于数据被分散到多个不同的存储节点上保存,数据修复时,在不同的节点上同时启动修复,每个节点上只需修复一小部分数据,多个节点并行工作,有效避免单个节点修复大量数据所产生的性能瓶颈,对上层业务的影响做到最小化。 

掉电保护:系统运行过程中可能会出现服务器突然掉电的情况,FusionStorage使用保电介质来保存元数据和缓存数据,以防掉电而丢失。FusionStorage支持的保电介质为NVDIMM内存条或SSD。程序运行过程中会把元数据和缓存数据写入保电介质中,节点异常掉电并重启后,系统自动恢复保电介质中的元数据和缓存数据。 

*怎么看待以后存储的方向

1. 偏向于分布式的架构,比如 FusionStorage 这种分布式块存储软件

2. 机头,io,网络没有瓶颈 

3. 管理方便,中低端存储可能被 server SAN 替代,高端领域仍然是高端存储的天下;

*FusionStorage存储池要求:

1. 磁盘类型一致

2. 磁盘大小一致(按照最小的来算)

3. 最小12块盘(OSD)

4. 非SSD场景下,要有一块SSD作为缓存盘

5. 2两副本 228块盘,3副本 2048块盘

 

*FusionStorage资源池具有什么特点?

1. 系统自动保证多个数据副本分布在不同的服务器上。

2. 系统自动保证多个数据副本之间的数据强一致性。

3. 用户数据以Key-Value的方式存储在硬盘上。

4. 对上层应用提供卷设备(Volume),使用简单。

5. 系统自动保证每个硬盘上的数据量均衡,避免出现集中的热点。

6. 资源池内所有硬盘都可用作资源池的热备盘,在 2副本场景下,单个资源池最大支持96块硬盘。在3副本场景下,单个资源池最大支持 2048块硬盘。

*FusionCompute 所支持的虚拟磁盘文件格式有哪些?

1、普通硬盘: raw   2、普通延迟置零、精简: vhd

*FusionStorage是不是虚拟化数据存储?

不是,虚拟化数据存储特指由CNA自身实现的虚拟化特性,例如快照、精简磁盘等,即对应存储虚拟化为主机存储虚拟化+文件系统。FusionStorage支持虚拟化特性,是通过 FusionStorage存储系统自身机制实现的,CNA并未参与。

*传统存储和 FusionStorage 可靠性方面如何考虑?

传统块存储:是通过一些机制保障了可靠性;(阵列和算法);有 BBU 掉电保护(掉电后BBU 供电将缓存的数据存放在内置的保险盘中)

FusionStorage:是通过副本机制保证;数据重建,掉电保护

*推荐客户用 FusionStorage 有什么难处?(fs的劣势)

1. 客户对分布式存储认识比较少,推广得不够;

2. 因为国内案例比较少,客户担心一个稳定性问题;

3. 不支持 FusionCompute 网络,担心性能问题;

4. 无法备份数据,客户担心数据的安全性;

5. 不支持数据容灾,需要通过上层完成

6. 传统存储有专业的运维人员;分布式存储没有形成专门的维护团队;

7. 小规模场景部署 FusionStorage 比较复杂

*针对部分业务,为什么客户会偏向使用传统存储?

1. 传统存储具有部署简单,上线快等优点;

2. 传统存储安装调试简单;

3. 一些核心关键业务需要传统存储,保证最低延迟,高IOPS

4. 传统存储支持许多高级特性

5. FusionStorage 初始投资高

*FusionStorage是如何实现分布式的?

FusionStorage Block存储软件的采用全分布式的架构:分布式管理集群,分布式哈希数据路由算法,分布式无状态机头、分布式智能Cache等,这种架构使得整个存储系统没有单点故障。

*什么情况下应该选择传统存储?

1. 小规模场景;

2. 需要高级特性场景;

3. 对延迟有一定要求的场景;

*IOPS 较高数据库场景为什么选择传统存储?

1. 传统存储支持 FusionCompute 组网,FusionCompute 具备更好的网络访问性能;FusionStorage 不支持;

2. 数据库对延迟要求比较小;

3. 因为高性能的数据库对文件系统有依赖

*传统存储是否可以统一管理?

可以。需要单独引入存储统一管理软件,它利用南向对接不同厂商、系列的存储设备,北向提供统一的界面,达到统一管理的目的。但这相对于FusionStorage统一管理而言,它并非天生就具备的,而是引入外物实现,且体验度有待探究

*适合使用FusionStorage的应用场景有哪些?

FusionStorage 的主要应用场景分为两大类:

1. 一类是在大规模云计算数据中心中,将通用X86存储服务器池化,建立大规模块存储资源池,提供标准的块存储数据访问接口(SCSI和iSCSI等)。支持各种虚拟化Hypervisor 平 台和各种业务应用(如SQL、Web、行业应用等等);可以和各种云平台集成,如华为 FusionSphere、VMware、开源Openstack 等,按需分配存储资源。

2. 适用于数据成本、价值低的场景,比如说爱奇艺、腾讯视频等视频存放。

*SmartCache特性

SmartCache特性是一种采用SSD盘作为介质提供读缓存的特性,与普通缓存资源 RAM Cache 配合实现了对热点数据的读加速,提高整个存储系统的性能。

SmartCache特性在对SSD盘资源进行管理上,分为智能缓存池和SmartCache 分区两部分。 开启SmartCache功能前,数据不区分冷热程度,都存放在机械硬盘中。由于机械硬盘需要占用一定的寻道时间,所以读取数据所需的时间较长,数据的读性能不高。

开启SmartCache功能后,存储系统将热点数据拷贝至 SSD盘组成的智能缓存池中。由于SSD 盘与机械硬盘相比,没有寻道时间,所以利用SSD盘的优势可以大大减少热点数据的读取时间,提高热点数据的读性能。

*FusionStorage的容灾特性

FusionStorage 双活特性中的两个数据中心互为备份,且都处于运行状态。当一个数据中心发生设备故障,甚至数据中心整体故障时,业务自动切换到另一个数据中心,解决了传统灾备中心不能承载业务和业务无法自动切换的问题。提供给用户高级别的数据可靠性以及业务连续性的同时,提高存储系统的资源利用率。

FusionStorage 远程复制特性通过对主从两端的数据进行周期性同步,实现系统容灾,从而最大限度减少由于数据远程传输的时延而造成的业务性能下降。

补充:

双活:FusionStorage V100R006C20版本及其后续版本。

远程复制:FusionStorage V100R006C30 版本及其后续版本。

目前6.3.1 LAB考试配套版本为FusionStorage Block V100R006C20SPC200

分布式存储软件系统通常具备怎样的特点?

第一,高性能:分布式哈希数据路由,数据分散存放,实现全局负载均衡,不存在集中的数据热点,大容量分布式缓存;

第二,高可靠:采用集群管理方式,不存在单点故障,灵活配置多数据副本,不同数据副本存放在不同的机架、服务器和硬盘上,单个物理设备故障不影响业务的使用,系统检测到设备故障后可以自动重建数据副本;

第三,高扩展:没有集中式机头,支持平滑扩容,容量几乎不受限制;

第四,易管理:存储软件直接部署在服务器上,没有单独的存储专用硬件设备,通过 Web UI的方式进行软件管理,配置简单。

数据存储的有哪些? 

1、虚拟化数据存储: 虚拟化本地硬盘、虚拟化SAN存储、NAS存储、FusionStorage存储池 

2、RDM (Raw Device Mapping)是VMware服务器虚拟化环境中,用以允许一个虚拟机直接访问SAN(Storage Area Networking)中的一个存储LUN(Logical Unit Number)。从VMware ESX 2.5开始,RDM(Raw Device Mapping)允许VMFusionStorage文件卷中一个特殊的文件当作一个Raw Device (裸设备)的代理。RDM也可以叫做裸设备映射,虚拟机直接使用存储中的LUN,而不经过虚拟化层。

数据存储是虚拟化或非虚拟化的本质差别。

1、当数据存储的虚拟化特性是由主机侧去实现时,其根本就是将存储设备格式化为文件系统。本地存储格式成 ext4,共享存储格式成 vims。 

2、非虚拟数据存储,就是一个块设备。

FusionStorage容灾特性的部署方式

容灾功能既可以部署在独立的节点上,也可以部署在存储节点上。即复制节点既可以独立存在,也可以与存储节点合一。容灾服务包括复制控制和复制业务。

    复制业务:用于pair、一致性组的管理和数据搬移操作。

    复制控制:用于管理集群节点和集群元数据,支持3个或5个或7个节点,其中复制控制集群的ZK和CCDB 进程需要本地存储用于记录元数据信息。

融合部署:容灾服务与存储服务融合部署方式是指将容灾服务安装在存储节点上,没有单独的复制节点,由存储节点提供容灾服务。

 

独立部署方式是指将容灾服务安装在独立的复制节点上。

 

考试追问:

传统存储的SSD缓存与FS存储的SSD缓存有什么区别?

传统存储的SSD缓存是集中的,

FS的SSD是分布式的,动态线性增长。

两个缓存的写缓存有什么区别?

副本机制怎么实现?

归属MDC负责partition划分,更新partition view给OSD,决定OSD主备也就是副本关系,VBS根据DHT算法找到partition和OSD对应关系,OSD主与备通过RSM同步数据,OSD切块。

传统存储怎么实现数据重建?

可能通过RAID或RAID2.0+来进行数据重建。

EC机制怎么实现的,EC机制只有FS有吗?

EC:纠删码机制,相当于传统存储的RAID,类似于用软件实现的RAID。在保护数据的时候通过数据盘+校验盘的方式来做,然后4D+1P(4块数据盘+1块校验盘)一共5块盘,坏了一块盘无影响,可以被恢复。

EC机制不是只有FS有。

机头瓶颈中VBS是什么?为什么是4096个,他是部署在每个服务器上吗?

VBS是分布式无状态机头。

VBS之间要形成集群关系,fs规格最大支持4096个,若更多会对性能产生更大影响。

是部署在每个服务器上的。

MDC故障怎么处理?

主MDC故障,ZK会进行MDC的重新选主。

其他MDC故障,会上报告警。

VBS故障怎么处理?

主VBS故障,其他VBS会向主MDC注册,进行重新选主。

其它VBS故障,会上报告警。

传统存储与FS的数据可靠性谁有优势?容灾呢?

数据可靠性和容灾都是传统存储更有优势。

FS和集中式存储应用场景

集中式存储(传统存储)适用于业务要求高并发、低延迟场景,FS适用于海量存储、多业务应用场景。

数据库适合什么存储?

传统存储

fs和传统存储哪个性能好

小规模传统好

大规模 fs好,FS有时延问题

这篇关于华为云计算IE面试笔记-fusionstorage相对于传统集中式存储的优势的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/311156

相关文章

使用C#代码计算数学表达式实例

《使用C#代码计算数学表达式实例》这段文字主要讲述了如何使用C#语言来计算数学表达式,该程序通过使用Dictionary保存变量,定义了运算符优先级,并实现了EvaluateExpression方法来... 目录C#代码计算数学表达式该方法很长,因此我将分段描述下面的代码片段显示了下一步以下代码显示该方法如

使用JavaScript操作本地存储

《使用JavaScript操作本地存储》这篇文章主要为大家详细介绍了JavaScript中操作本地存储的相关知识,文中的示例代码讲解详细,具有一定的借鉴价值,有需要的小伙伴可以参考一下... 目录本地存储:localStorage 和 sessionStorage基本使用方法1. localStorage

你的华为手机升级了吗? 鸿蒙NEXT多连推5.0.123版本变化颇多

《你的华为手机升级了吗?鸿蒙NEXT多连推5.0.123版本变化颇多》现在的手机系统更新可不仅仅是修修补补那么简单了,华为手机的鸿蒙系统最近可是动作频频,给用户们带来了不少惊喜... 为了让用户的使用体验变得很好,华为手机不仅发布了一系列给力的新机,还在操作系统方面进行了疯狂的发力。尤其是近期,不仅鸿蒙O

如何用Java结合经纬度位置计算目标点的日出日落时间详解

《如何用Java结合经纬度位置计算目标点的日出日落时间详解》这篇文章主详细讲解了如何基于目标点的经纬度计算日出日落时间,提供了在线API和Java库两种计算方法,并通过实际案例展示了其应用,需要的朋友... 目录前言一、应用示例1、天安门升旗时间2、湖南省日出日落信息二、Java日出日落计算1、在线API2

异构存储(冷热数据分离)

异构存储主要解决不同的数据,存储在不同类型的硬盘中,达到最佳性能的问题。 异构存储Shell操作 (1)查看当前有哪些存储策略可以用 [lytfly@hadoop102 hadoop-3.1.4]$ hdfs storagepolicies -listPolicies (2)为指定路径(数据存储目录)设置指定的存储策略 hdfs storagepolicies -setStoragePo

HDFS—存储优化(纠删码)

纠删码原理 HDFS 默认情况下,一个文件有3个副本,这样提高了数据的可靠性,但也带来了2倍的冗余开销。 Hadoop3.x 引入了纠删码,采用计算的方式,可以节省约50%左右的存储空间。 此种方式节约了空间,但是会增加 cpu 的计算。 纠删码策略是给具体一个路径设置。所有往此路径下存储的文件,都会执行此策略。 默认只开启对 RS-6-3-1024k

字节面试 | 如何测试RocketMQ、RocketMQ?

字节面试:RocketMQ是怎么测试的呢? 答: 首先保证消息的消费正确、设计逆向用例,在验证消息内容为空等情况时的消费正确性; 推送大批量MQ,通过Admin控制台查看MQ消费的情况,是否出现消费假死、TPS是否正常等等问题。(上述都是临场发挥,但是RocketMQ真正的测试点,还真的需要探讨) 01 先了解RocketMQ 作为测试也是要简单了解RocketMQ。简单来说,就是一个分

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

poj 1113 凸包+简单几何计算

题意: 给N个平面上的点,现在要在离点外L米处建城墙,使得城墙把所有点都包含进去且城墙的长度最短。 解析: 韬哥出的某次训练赛上A出的第一道计算几何,算是大水题吧。 用convexhull算法把凸包求出来,然后加加减减就A了。 计算见下图: 好久没玩画图了啊好开心。 代码: #include <iostream>#include <cstdio>#inclu