Talent Plan Rust课程总结

2024-03-28 15:32
文章标签 rust 总结 课程 plan talent

本文主要是介绍Talent Plan Rust课程总结,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

首先非常感谢PingCAP能组织一个非常专业的Rust课程,这对于Rust爱好者来说是一次非常好学习的机会,感谢PingCAP为Rust做出的贡献。该课程持续的做了一个月左右,感谢Brian Anderson大神提供优秀的实现供学员参考。

课程的目标是用Rust逐步实现一个BitCask数据库,详细请看https://github.com/pingcap/talent-plan/tree/master/courses/rust

Project-1

通过内存的KVStore学习了如下内容

  1. Rust项目工具cargo的作用以及cargo相关的命令
  2. clap库的使用
  3. 理解rust工程保组织结构
  4. 熟悉了标准库HashMap
Project-2

在project-1的基础上增加了error处理,以及数据持久化至硬盘。基本思路是内存的HashMap作为索引,Map的value中是键值对的文件id以及偏移地址和长度。

数据是序列化为json格式后以append log方式写,当旧的数据和删除的数据达到一定阈值,开启合并操作,合并操作是把当前内存索引中存在的数据写入新的文件中。

另外值得一提的是删除是写入一条记录来表示数据删除,同时删除该key索引。后续会执行Merge操作。

Project-3

本次实验主要增加了网络通信和基准测试的模块,对存储引擎抽象为KvsEngine Trait,实现分别是kvstore和sled wrapper。网络模块主要熟悉标准库的API以及通信的Message的定义。

通过的sled以及BW-tree的调研发现 bw-tree的实践并不能超越传统b+tree。在基准测试模块中是对单线程下的set和get进行测试,发现sled的flush会特别的慢,导致测试一直卡在set阶段,sled flush操作将会调用fsync同步整个page,慢是必然的。 sled会定时的执行刷盘操作,因此没必要每次set都进行flush操作。

Project-4

简单的说本次的实验就增加一个点,即所有的接口支持并发的调用,接下来解决的问题是什么数据共享,什么不共享,什么操作需要同步,什么不需要同步?

当然最简单办法是所有的操作都同步起来,顺序执行,但是性能存在问题。整体思路是所有的set和remove操作同步,读操做不同步。
索引以及不变的数据共享,读缓冲不共享,线程私有。

有个问题是索引在写线程中会修改,读线程需要根据索引来定位数据,如果`Arc来共享,那么写线程不能得到可变的引用,如果是用Arc<Mutex>则是同步的方式,直接pass,如果用Arc<RwLock>,还是存在读写互斥的情况,当然会比Mutex效率好点。采用线程安全的SkipListMap会更简单粗暴一些。

总结

其实看着简单的一个系统,做起来其实也会遇到大大小小的问题,整体的感受是Rust真的适合写底层的系统,即有c的力量感又有python的抽象能力,接下来一段时间会做dss课程,有兴趣的朋友可以互相交流学习。

https://github.com/TheLudlows/talent-plan-rs

这篇关于Talent Plan Rust课程总结的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/855994

相关文章

java常见报错及解决方案总结

《java常见报错及解决方案总结》:本文主要介绍Java编程中常见错误类型及示例,包括语法错误、空指针异常、数组下标越界、类型转换异常、文件未找到异常、除以零异常、非法线程操作异常、方法未定义异常... 目录1. 语法错误 (Syntax Errors)示例 1:解决方案:2. 空指针异常 (NullPoi

Java反转字符串的五种方法总结

《Java反转字符串的五种方法总结》:本文主要介绍五种在Java中反转字符串的方法,包括使用StringBuilder的reverse()方法、字符数组、自定义StringBuilder方法、直接... 目录前言方法一:使用StringBuilder的reverse()方法方法二:使用字符数组方法三:使用自

Python依赖库的几种离线安装方法总结

《Python依赖库的几种离线安装方法总结》:本文主要介绍如何在Python中使用pip工具进行依赖库的安装和管理,包括如何导出和导入依赖包列表、如何下载和安装单个或多个库包及其依赖,以及如何指定... 目录前言一、如何copy一个python环境二、如何下载一个包及其依赖并安装三、如何导出requirem

Rust中的注释使用解读

《Rust中的注释使用解读》本文介绍了Rust中的行注释、块注释和文档注释的使用方法,通过示例展示了如何在实际代码中应用这些注释,以提高代码的可读性和可维护性... 目录Rust 中的注释使用指南1. 行注释示例:行注释2. 块注释示例:块注释3. 文档注释示例:文档注释4. 综合示例总结Rust 中的注释

Rust格式化输出方式总结

《Rust格式化输出方式总结》Rust提供了强大的格式化输出功能,通过std::fmt模块和相关的宏来实现,主要的输出宏包括println!和format!,它们支持多种格式化占位符,如{}、{:?}... 目录Rust格式化输出方式基本的格式化输出格式化占位符Format 特性总结Rust格式化输出方式

Rust中的Drop特性之解读自动化资源清理的魔法

《Rust中的Drop特性之解读自动化资源清理的魔法》Rust通过Drop特性实现了自动清理机制,确保资源在对象超出作用域时自动释放,避免了手动管理资源时可能出现的内存泄漏或双重释放问题,智能指针如B... 目录自动清理机制:Rust 的析构函数提前释放资源:std::mem::drop android的妙

Rust中的BoxT之堆上的数据与递归类型详解

《Rust中的BoxT之堆上的数据与递归类型详解》本文介绍了Rust中的BoxT类型,包括其在堆与栈之间的内存分配,性能优势,以及如何利用BoxT来实现递归类型和处理大小未知类型,通过BoxT,Rus... 目录1. Box<T> 的基础知识1.1 堆与栈的分工1.2 性能优势2.1 递归类型的问题2.2

在Rust中要用Struct和Enum组织数据的原因解析

《在Rust中要用Struct和Enum组织数据的原因解析》在Rust中,Struct和Enum是组织数据的核心工具,Struct用于将相关字段封装为单一实体,便于管理和扩展,Enum用于明确定义所有... 目录为什么在Rust中要用Struct和Enum组织数据?一、使用struct组织数据:将相关字段绑

Python中连接不同数据库的方法总结

《Python中连接不同数据库的方法总结》在数据驱动的现代应用开发中,Python凭借其丰富的库和强大的生态系统,成为连接各种数据库的理想编程语言,下面我们就来看看如何使用Python实现连接常用的几... 目录一、连接mysql数据库二、连接PostgreSQL数据库三、连接SQLite数据库四、连接Mo

Git提交代码详细流程及问题总结

《Git提交代码详细流程及问题总结》:本文主要介绍Git的三大分区,分别是工作区、暂存区和版本库,并详细描述了提交、推送、拉取代码和合并分支的流程,文中通过代码介绍的非常详解,需要的朋友可以参考下... 目录1.git 三大分区2.Git提交、推送、拉取代码、合并分支详细流程3.问题总结4.git push