浅谈VAST DATA公司

2023-10-12 19:50
文章标签 浅谈 data 公司 vast

本文主要是介绍浅谈VAST DATA公司,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

浅谈VAST DATA公司

    • 1. 概述
    • 2. White Paper
      • 2.1 Why Universal Storage
      • 2.2 Defining Universal Storage
      • 2.3 New Tech Lay A New Storage Fondation
      • 2.4 DASE(DisAggregated Shared Everything)

导师让了解一下VAST DATA这家企业,不知道要干嘛,看了一下它的白皮书,很多东西还是不太了解。不过总体架构还是能够基本理解,这里简单记录一下。

请添加图片描述

1. 概述

  • 理念:全闪存消灭机械硬盘

  • 思路:Universal Storage避免存储分层,采用最便宜的QLC介质(四层存储单元,Quad-Level Cell),利用独特的数据保护和缩减技术,成本可以做到硬盘的水平

  • 架构:控制器采用容器技术部署,全部都是无状态的,可以扩充到1000个节点,后端通过NVMe-oF网状连接闪存框,闪存框里面有少量的SCM做写Cache,后面插大量的QLC盘。这种架构的好处就是容量和性能可以单独扩展,有分布式存储的好处,但是和一般的SDS不同的就是,控制框可以看到所有的SSD盘,这得依赖NVMe-oF。
    请添加图片描述

  • 关键技术:回答以下问题

    • QLC的写寿命那么差,如何支持生产系统?

      寿命方面:系统通过NVMe-oF可以看到所有QLC Flash,做全局磨损均衡。

      保护方面:使用长条带,分组生成额外冗余位减少坏盘重构时间。在SCM里面做快速构建。

    • 还有,QLC的介质虽然可以采用消费级颗粒,但单位成本还是要比硬盘高啊?

      长条带实现高达98%的得盘率

    • 如何在数据缩减上下功夫,使得有效成本低于硬盘?

      传统重删和压缩:传统重删一般是KB粒度,不能基于Byte做重删;传统压缩基于Byte,但不是全局的

      VAST提出的数据缩减方案:全局去重、算指纹,相似指纹做压缩。

2. White Paper

2.1 Why Universal Storage

  • 用户需要把数据拷贝到相应的存储层去,用户不友好;
  • 自动化数据管理框架也不能简化“Where is my data ?”这个问题,频繁地移动数据对资源、性能都是一种损耗;
  • 数据全局化才更好,特别是对于AI训练来说,而不是局限在某个Flash层上;

2.2 Defining Universal Storage

  • 速度快,可以达到传统或现代应用需求
  • 可拓展
  • 成本低
  • 易访问

2.3 New Tech Lay A New Storage Fondation

  • Hyperscal Flash

请添加图片描述

  • Stateless Containers

    无状态容器通过NVMe-oF网络连接到存储设备上,使得① 部署方便② 可靠性更强;

  • Storage Class Memory(SCM,3D-XPoint)

    SCM以其低写入延迟、较长的持久能力,而被作为写缓冲、全局元数据存储的存储介质,优势在于:

    • 写延时优化:在SCM种可以做数据缩减、全局磨损均衡,避免高QLC写入延迟
    • 写寿命优化:SCM具有长期存储能力,避免temp数据对QLC造成不必要的磨损
    • 数据保护性能优化:合并写入,一次性写到QLC中,避免QLC
    • 数据缩减索引优化:作为元数据存储容器,提供全局压缩字典,避免将索引数据拷贝到DRAM中
  • NVMe-over-Fabric(NVMe-oF)

    高速,可实现存算分离

    为什么要实现存算分离?因为存算一体不容易扩展,不灵活,且不容易做到全局数据缩减,以及数据保护(RAID)。

2.4 DASE(DisAggregated Shared Everything)

请添加图片描述
DASE结构是VAST的架构,它依靠NVMe-oF连接实现存算分离,如上图。这是一种全局结构,其各个技术点在前文已基本描述,不再赘述。

这篇关于浅谈VAST DATA公司的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/198064

相关文章

浅谈主机加固,六种有效的主机加固方法

在数字化时代,数据的价值不言而喻,但随之而来的安全威胁也日益严峻。从勒索病毒到内部泄露,企业的数据安全面临着前所未有的挑战。为了应对这些挑战,一种全新的主机加固解决方案应运而生。 MCK主机加固解决方案,采用先进的安全容器中间件技术,构建起一套内核级的纵深立体防护体系。这一体系突破了传统安全防护的局限,即使在管理员权限被恶意利用的情况下,也能确保服务器的安全稳定运行。 普适主机加固措施:

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

CentOS下mysql数据库data目录迁移

https://my.oschina.net/u/873762/blog/180388        公司新上线一个资讯网站,独立主机,raid5,lamp架构。由于资讯网是面向小行业,初步估计一两年内访问量压力不大,故,在做服务器系统搭建的时候,只是简单分出一个独立的data区作为数据库和网站程序的专区,其他按照linux的默认分区。apache,mysql,php均使用yum安装(也尝试

创业者该如何设计公司的股权架构

本文来自七八点联合IT橘子和车库咖啡的一系列关于设计公司股权结构的讲座。 主讲人何德文: 在公司发展的不同阶段,创业者都会面临公司股权架构设计问题: 1.合伙人合伙创业第一天,就会面临股权架构设计问题(合伙人股权设计); 2.公司早期要引入天使资金,会面临股权架构设计问题(天使融资); 3.公司有三五十号人,要激励中层管理与重要技术人员和公司长期走下去,会面临股权架构设计问题(员工股权激

浅谈PHP5中垃圾回收算法(Garbage Collection)的演化

前言 PHP是一门托管型语言,在PHP编程中程序员不需要手工处理内存资源的分配与释放(使用C编写PHP或Zend扩展除外),这就意味着PHP本身实现了垃圾回收机制(Garbage Collection)。现在如果去PHP官方网站(php.net)可以看到,目前PHP5的两个分支版本PHP5.2和PHP5.3是分别更新的,这是因为许多项目仍然使用5.2版本的PHP,而5.3版本对5.2并不是完

使用Spring Boot集成Spring Data JPA和单例模式构建库存管理系统

引言 在企业级应用开发中,数据库操作是非常重要的一环。Spring Data JPA提供了一种简化的方式来进行数据库交互,它使得开发者无需编写复杂的JPA代码就可以完成常见的CRUD操作。此外,设计模式如单例模式可以帮助我们更好地管理和控制对象的创建过程,从而提高系统的性能和可维护性。本文将展示如何结合Spring Boot、Spring Data JPA以及单例模式来构建一个基本的库存管理系统

15 组件的切换和对组件的data的使用

划重点 a 标签的使用事件修饰符组件的定义组件的切换:登录 / 注册 泡椒鱼头 :微辣 <!DOCTYPE html><html lang="en"><head><meta charset="UTF-8"><meta name="viewport" content="width=device-width, initial-scale=1.0"><meta http-equiv="X-UA-

12C 新特性,MOVE DATAFILE 在线移动 包括system, 附带改名 NID ,cdb_data_files视图坏了

ALTER DATABASE MOVE DATAFILE  可以改名 可以move file,全部一个命令。 resue 可以重用,keep好像不生效!!! system照移动不误-------- SQL> select file_name, status, online_status from dba_data_files where tablespace_name='SYSTEM'

浅谈java向上转型和乡下转型

首先学习每一种知识都需要弄明白这知识是用来干什么使用的 简单理解:当对象被创建时,它可以被传递给这些方法中的任何一个,这意味着它依次被向上转型为每一个接口,由于java中这个设计接口的模式,使得这项工作不需要程序员付出任何特别的努力。 向上转型的作用:1、为了能够向上转型为多个基类型(由此而带来的灵活性) 2、使用接口的第二个原因却是与使用抽象基类相同,防止客户端创建该类的对象,并确保这仅仅

某公司笔试编程题

参加了某公司编程题,这些题都来自牛客网,记录总结吧! 一、蛇形矩阵 题目描述 蛇形矩阵是有1开始的自然数依次排列成的一个上三角矩阵. 接口说明 void GetResult(int Num, int* pResult);输入参数:int Num :输入的正整数N输出参数:int *pResult: 指向放蛇形矩阵的字符串指针指针指向的内存区域保证有效 样例输入: 4