精彩回顾 l Rust唠嗑室:Xline跨数据中心一致性管理

2024-02-05 17:40

本文主要是介绍精彩回顾 l Rust唠嗑室:Xline跨数据中心一致性管理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 

2022年10月15日,达坦科技和Rust语言中文社区合作,在Rust唠嗑室活动中,由达坦科技(DatenLord)联合创始人施继成做了关于开源分布式存储技术的分享,着重介绍了达坦科技新的开源项目Xline,这一跨云的metadata(元数据)KV存储的产品是如何实现高性能跨数据中心的数据一致性管理的。

内容介绍

施继成首先介绍了做Xline这个产品的动机。最初2021年UCBerkeley 提出了Sky Computing(“天空计算”)的概念。与我们都熟知的cloud computing(“云计算”)不同的是,sky computing,如其表面意义所讲,是天空中有很多的云,是解决跨云的问题。如何打破不同云之间的隔阂,或者打通和最大化利用跨云数据是当前面临的一个难题,也是我们的目标所在。如今谈论云计算时,我们不需要考虑云资源的部署,可扩展性等问题,因为云厂商已经都帮忙做了。但是,一旦跨云,则无论算力的迁移,或数据的迁移,都是摆在我们眼前要攻克的难题。达坦科技在做的就是解决“如何做跨云数据交互”的问题,我们致力于将分布式系统从数据中心范围扩散至全球范围,这样即使单个数据中心宕机,却仍不影响用户使用数据。

跨云存储最重要的是解决共识一致性的问题。随着业务量的增长,server数量也从最早的一个增长到了后来的多个。虽然可以使算力分开,让请求不会集中在一个server上,但同时也带来了挑战,即不同server间如何保证数据一致性,以及在少数server宕机时先前的决定还能够保存。不会出现“公说公有理、婆说婆有理”的局面,而是始终保留一致结果,且确保高可用性,这是共识算法想要达成的目的。

随即,施继成引入了Raft和Paxos算法的概念,简单介绍了二者的发展以及操作过程。它们的思路和传递的message大同小异,但是后者没有一个确定的leader。就传递多少message而言,没有很大差异,两者均会经过两个Round Trip Time(2RRT)才完成一个共识协议的request。

在全球数据中心间的延迟问题严重的情况下,multi-raft解决方案应运而生,其不在协议上做深究,仅做数据切片。这种情况下虽然看似完善,但是仍然存在问题。例如,如果某数据中心区域因为某些原因不available,那么运行在该数据中心的raft group就无法响应请求,其对应的数据也就不可获得了。

那是不是把该数据备份在不同的数据中心可以解决该问题呢?可以解决问题。但是正如前面提到的完成一次请求需要耗费2RRT。若放置于不同的数据中心,Latency则太大。所以,我们不经要问“是不是一定要有2RRT”?

这个问题促使大家重新审视Raft协议。需要回顾我们拥有两个RRT的原因到底是什么?一个是确定request在log中的位置,即全局顺序,另一个是分发request给followers以确保数据不被丢失。后者RRT作为共识算法的能力是无法被放弃,因此,我们就着手从前者进行完善。 

就全局顺序的原因,不得不提到MVCC的概念。MVCC要求系统维护物理或者逻辑上的时钟,而全局顺序的version就是某种程度上的逻辑时钟,刚好共识协议的log id就可以被当作是version。此时问题看似并没有得到解决,但如果假设没有contention,那也就不需要version的保护。论文“Exploiting Commutativity For Practical Fast Replication”恰巧讲的就是这个原理,即CURP协议。CURP的优势在于一方面在无冲突的情况下,一个RRT就可以完成请求,另一方面,在有冲突的情况下,可以退化成后端协议,即Raft或者Paxos等,最终保证没有请求都可以具有全局的version。

我们的产品:Xline 

基于CURP这套协议,达坦科技开发了我们的产品Xline,它是兼容etcd接口的metadata存储接口。施继成最后提出,我们最终的希望是在跨云部署的情况下可以替代etcd取得更好的性能,同时能够将CURP协议剥离出来,后续可以被其他人复用。

现在Xline项目仍然处在早期状态,已经拥有了几个接口并且做了基本的测试。但是接口方面还有待完善,以及后续稳定性方面还需要迭代。我们手动搭建了一个容器环境模拟跨云场景,手动增加网络链接的延迟,当Client和Leader在一起时,Xline延迟性方面的优越还无法体现,但当Client和Leader不在一个数据中心时,Xline的优势就相当明显,这一测试结果也符合最初我们对原理的论述。

Xline项目是以Rust语言写就,欢迎大家参与我们开源项目,GitHub链接: https://github.com/datenlord/Xline

欲观看此次Rust唠嗑室-Xline:跨数据中心一致性管理,请点击以下B站链接:

《Rust唠嗑室》第41期-开源分布式存储技术分享-施继成_哔哩哔哩_bilibili

 

这篇关于精彩回顾 l Rust唠嗑室:Xline跨数据中心一致性管理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/681679

相关文章

SpringBoot中使用 ThreadLocal 进行多线程上下文管理及注意事项小结

《SpringBoot中使用ThreadLocal进行多线程上下文管理及注意事项小结》本文详细介绍了ThreadLocal的原理、使用场景和示例代码,并在SpringBoot中使用ThreadLo... 目录前言技术积累1.什么是 ThreadLocal2. ThreadLocal 的原理2.1 线程隔离2

在Rust中要用Struct和Enum组织数据的原因解析

《在Rust中要用Struct和Enum组织数据的原因解析》在Rust中,Struct和Enum是组织数据的核心工具,Struct用于将相关字段封装为单一实体,便于管理和扩展,Enum用于明确定义所有... 目录为什么在Rust中要用Struct和Enum组织数据?一、使用struct组织数据:将相关字段绑

Linux内存泄露的原因排查和解决方案(内存管理方法)

《Linux内存泄露的原因排查和解决方案(内存管理方法)》文章主要介绍了运维团队在Linux处理LB服务内存暴涨、内存报警问题的过程,从发现问题、排查原因到制定解决方案,并从中学习了Linux内存管理... 目录一、问题二、排查过程三、解决方案四、内存管理方法1)linux内存寻址2)Linux分页机制3)

浅析Rust多线程中如何安全的使用变量

《浅析Rust多线程中如何安全的使用变量》这篇文章主要为大家详细介绍了Rust如何在线程的闭包中安全的使用变量,包括共享变量和修改变量,文中的示例代码讲解详细,有需要的小伙伴可以参考下... 目录1. 向线程传递变量2. 多线程共享变量引用3. 多线程中修改变量4. 总结在Rust语言中,一个既引人入胜又可

Rust 数据类型详解

《Rust数据类型详解》本文介绍了Rust编程语言中的标量类型和复合类型,标量类型包括整数、浮点数、布尔和字符,而复合类型则包括元组和数组,标量类型用于表示单个值,具有不同的表示和范围,本文介绍的非... 目录一、标量类型(Scalar Types)1. 整数类型(Integer Types)1.1 整数字

高效管理你的Linux系统: Debian操作系统常用命令指南

《高效管理你的Linux系统:Debian操作系统常用命令指南》在Debian操作系统中,了解和掌握常用命令对于提高工作效率和系统管理至关重要,本文将详细介绍Debian的常用命令,帮助读者更好地使... Debian是一个流行的linux发行版,它以其稳定性、强大的软件包管理和丰富的社区资源而闻名。在使用

SpringBoot使用minio进行文件管理的流程步骤

《SpringBoot使用minio进行文件管理的流程步骤》MinIO是一个高性能的对象存储系统,兼容AmazonS3API,该软件设计用于处理非结构化数据,如图片、视频、日志文件以及备份数据等,本文... 目录一、拉取minio镜像二、创建配置文件和上传文件的目录三、启动容器四、浏览器登录 minio五、

Rust中的Option枚举快速入门教程

《Rust中的Option枚举快速入门教程》Rust中的Option枚举用于表示可能不存在的值,提供了多种方法来处理这些值,避免了空指针异常,文章介绍了Option的定义、常见方法、使用场景以及注意事... 目录引言Option介绍Option的常见方法Option使用场景场景一:函数返回可能不存在的值场景

IDEA中的Kafka管理神器详解

《IDEA中的Kafka管理神器详解》这款基于IDEA插件实现的Kafka管理工具,能够在本地IDE环境中直接运行,简化了设置流程,为开发者提供了更加紧密集成、高效且直观的Kafka操作体验... 目录免安装:IDEA中的Kafka管理神器!简介安装必要的插件创建 Kafka 连接第一步:创建连接第二步:选

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖