MooseFS源代码分析(二)——mfsmount模块

2023-10-23 08:18

本文主要是介绍MooseFS源代码分析(二)——mfsmount模块,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.fuse介绍

客户端上需要安装有fusemfsmount使用了fuse模块,以拥有一个和文件操作一样的操作入口。

fuse的功能简单概括一下,fuse提供一个文件操作的接口,然后fuse在这个接口上监听文件操作,并把这些对文件的操作传给我们自己的相关代码进行处理。也就是说,fuse提供一个挂载点,然后他会在这个挂在点上进行监听,一旦有操作(新建、读取、修改)发生,他会把控制权交给我们的代码,这些操作的具体代码都在mfsmount模块中实现。

fuse中的fuse_lowlevel_ops结构用来指定自定义的文件操作,mfsmount中定义的结构如下:

1. mfsmount模块main.c代码片段

1.  staticstruct fuse_lowlevel_ops mfs_oper = {

2.      .statfs        = mfs_statfs,

3.      .lookup        = mfs_lookup,

4.      .getattr    = mfs_getattr,

5.      .setattr    = mfs_setattr,

6.      .mknod        = mfs_mknod,

7.      .unlink        = mfs_unlink,

8.      .mkdir        = mfs_mkdir,

9.      .rmdir        = mfs_rmdir,

10.    .symlink    = mfs_symlink,

11.    .readlink    = mfs_readlink,

12.    .rename        = mfs_rename,

13.    .link        = mfs_link,

14.    .opendir    = mfs_opendir,

15.    .readdir    = mfs_readdir,

16.    .releasedir    = mfs_releasedir,

17.    .create        = mfs_create,

18.    .open        = mfs_open,

19.    .release    = mfs_release,

20.    .flush        = mfs_flush,

21.    .fsync        = mfs_fsync,

22.    .read        = mfs_read,

23.    .write        = mfs_write,

24.    .access        = mfs_access,

25.};

这里面的mfs_statfsmfs_lookup…mfs_writemfs_access是由mfsmount去实现的函数,一共23种文件操作,mfsmount全部要自己去实现一遍。当在fuse注册的挂载点上(默认对应/mnt/mfs)进行文件操作时,fuse就会使用mfsmount的实现去实现这些操作。例如,我们在/mnt/mfs创建一个text.txt文件,fuse就会调用mfs_create去进行操作(当然需要传递文件名等必要的参数),至于我们的代码在什么地方去创建具体的文件,fuse不管。

看一下mfsmount中这些文件操作函数在头文件中的定义:

mfs_fuse.h代码片段

1.  void mfs_access(fuse_req_t req, fuse_ino_t ino,int mask);

2.  void mfs_lookup(fuse_req_t req, fuse_ino_t parent,constchar *name);

3.  void mfs_getattr(fuse_req_t req, fuse_ino_t ino,struct fuse_file_info *fi);

4.  void mfs_setattr(fuse_req_t req, fuse_ino_t ino,struct stat *stbuf,int to_set, struct fuse_file_info *fi);

5.  void mfs_mknod(fuse_req_t req, fuse_ino_t parent,constchar *name, mode_t mode, dev_t rdev);

6.  void mfs_unlink(fuse_req_t req, fuse_ino_t parent,constchar *name);

7.  void mfs_mkdir(fuse_req_t req, fuse_ino_t parent,constchar *name, mode_t mode);

8.  void mfs_rmdir(fuse_req_t req, fuse_ino_t parent,constchar *name);

9.  void mfs_symlink(fuse_req_t req,constchar *path, fuse_ino_t parent,constchar *name);

10.void mfs_readlink(fuse_req_t req, fuse_ino_t ino);

11.void mfs_rename(fuse_req_t req, fuse_ino_t parent,constchar *name, fuse_ino_t newparent,constchar *newname);

12.void mfs_link(fuse_req_t req, fuse_ino_t ino, fuse_ino_t newparent,constchar *newname);

13.void mfs_opendir(fuse_req_t req, fuse_ino_t ino,struct fuse_file_info *fi);

注意每个函数都有一个fuse_ino_t类型的参数ino,每个文件都对应一个唯一的ino值,fuse需要用到这个值。在文件的目录结构中(masterserver的元数据中),这个ino用来作为文件和文件夹的标识。在创建文件和文件夹的过程中,这个些目录结构的数据被存在了masterserver上,客户端是没有这些数据的。根目录(/mnt/mfs)ino被定为0

以删除一个目录为例具体解释一下代码,下面的函数就是mfsmount模块里面注册的删除目录操作所对应的函数:

2. 目录删除所对应的函数

1.  void mfs_rmdir(fuse_req_t req, fuse_ino_t parent,constchar *name) {

2.      uint32_t nleng;

3.      int status;

4.      conststruct fuse_ctx *ctx;

5.   

6.      /*...........*/

7.   

8.      ctx = fuse_req_ctx(req);

9.      status = fs_rmdir(parent,nleng,(const uint8_t*)name,ctx->uid,ctx->gid);

10.    status = mfs_errorconv(status);

11.    if (status!=0) {

12.        fuse_reply_err(req, status);

13.    }else {

14.        fuse_reply_err(req, 0);

15.    }

16.}

mfs_rmdir函数的各个参数会由fuse传过来,注意看第9行的fs_rmdir,它会与masterserver通信进行真正的删除操作。

总之,这里fuse的作用就是提供一个中间层,用来把用户(或者程序)在挂载点上的文件操作捕捉后转交给mfsmount自己的代码来处理,并把处理的结构再反馈给用户。对于用户来说,在这个挂载点上读写文件和在普通的文件夹里读写文件是一样的,用户感觉不到任何差别。

2.mfsmount的工作过程

mfsmount启动后,首先会读取命令行的参数和配置。

然后使用fuse定义好挂载点,并对应上mfsmount实现的文件操作函数。

设置好到masterserver的连接参数。

启动线程fs_nop_thread用于保持与masterserver的连接状态。fs_receive_thread,连接到masterserver并进行通讯,在masterserver上注册,并做一些初始化工作。

开始响应客户端的输入(fuse中转)

重点解释下响应用户输入的过程,输入就是我们所做的创建、修改文件的操作,这些操作会被移交到在fuse_lowlevel_ops中定义好的各个具体的函数,在这些具体的函数中去和masterserver进行通信。

每次用户所做一个文件操作,就会生成一个threc类型的数据:

threc结构

1.  typedefstruct _threc {

2.      pthread_t thid;

3.      pthread_mutex_t mutex;

4.      pthread_cond_t cond;

5.      uint8_t *buff;

6.      uint32_t buffsize;

7.      uint8_t sent;

8.      uint8_t status;

9.      uint8_t release;    // cond variable

10.    uint32_t size;

11.    uint32_t cmd;

12.    uint32_t packetid;

13.    struct _threc *next;

14.} threc;

里面主要是一些状态字段,其中最重要的是buffbuff里面的数据会被发送给masterserver

buff的前12个字节存放的是三个整数。后面的空间用于存放发送的具体信息。buff里面的具体内容如下:

1~4个字节(存放一个整数),是具体的命令,说明了需要取什么样的数据。

5~8个字节(存放一个整数),所发送数据的大小。

9~12个字节(存放一个整数),表示的是packetid,这个packetid是唯一的,对应了每一次的操作。

13~**个字节,更具第5~8个字节的情况而定。

我们看一下创建目录(fs_makedir)的时候的代码片段:

fs_makedir代码片段

1.  ...

2.  ptr = fs_createpacket(rec,CUTOMA_FUSE_MKDIR,15+nleng);

3.  PUT32BIT(parent,ptr);

4.  PUT8BIT(nleng,ptr);

5.  memcpy(ptr,name,nleng);

6.  ptr+=nleng;

7.  PUT16BIT(mode,ptr);

8.  PUT32BIT(uid,ptr);

9.  PUT32BIT(gid,ptr);

10.ptr = fs_sendandreceive(rec,MATOCU_FUSE_MKDIR,&i);

11....

在上面第2行代码中,fs_createpacket会创建一个threc结构,并设置它的buffer大小为15+nleng+12字节。

后面的这12个字节是固定作为buffer头的,是在创建threc结构的时候填充进去的,在前面说threc结构的时候有描述过。

其中的15+nleng字节的内容就是后面的第345789行所放进去的发送给masterserver的内容。对于不同的操作,具体发送给masterserver的内容会不同。masterserver返回的数据同样也是放在这个threc结构里面。下面是对于创建目录操作对应的threc结构里面的buffer在发送数据给masterserver时的内容:

数据从masterserver返回后,将数据再从threc结构中取出,把文件夹的参数交给fuse,剩下的就是fuse拿着这些参数去做它自己的事情了(例如,显示信息给用户)

3.读取、写入文件数据的处理

之前在介绍fuse时说到mfsmount会定义自己的文件操作,其中readwrite这两个与实际数据打交道的操作比较特殊。除了readwrite外,其它操作都只需要从masterserver获取数据。而readwrite操作则需要先和masterserver通信,取得数据所在的chunkserver的地址和端口后,再从chunkserver读写数据。readwritemasterserver通讯的时候仍然使用threc结构

masterserver上获取chunkserverIPPort,这个过程和其它非readwrite操作的过程类似,主要代码如下:

fs_readchunk代码片段

1.  ptr = fs_createpacket(rec,CUTOMA_FUSE_READ_CHUNK,8);

2.  PUT32BIT(inode,ptr);

3.  PUT32BIT(indx,ptr);

4.  ptr = fs_sendandreceive(rec,MATOCU_FUSE_READ_CHUNK,&i);

5.  //... ...

6.  GET64BIT(t64,ptr);

7.  *length = t64;

8.  GET64BIT(t64,ptr);

9.  *chunkid = t64;

10.GET32BIT(t32,ptr);

11.*version = t32;

12.if (i==20) {

13.    *csip = 0;

14.    *csport = 0;

15.}else {

16.    GET32BIT(t32,ptr);

17.    *csip = t32;

18.    GET16BIT(t16,ptr);

19.    *csport = t16;

20.}

masterserver会返回文件的版本、长度、ID以及chunkserver的信息。mfsmount然后更具这些信息与chunkserver通信去获取数据,数据读取到后控制权交还给fuse

 

这篇关于MooseFS源代码分析(二)——mfsmount模块的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/266645

相关文章

python: 多模块(.py)中全局变量的导入

文章目录 global关键字可变类型和不可变类型数据的内存地址单模块(单个py文件)的全局变量示例总结 多模块(多个py文件)的全局变量from x import x导入全局变量示例 import x导入全局变量示例 总结 global关键字 global 的作用范围是模块(.py)级别: 当你在一个模块(文件)中使用 global 声明变量时,这个变量只在该模块的全局命名空

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57

衡石分析平台使用手册-单机安装及启动

单机安装及启动​ 本文讲述如何在单机环境下进行 HENGSHI SENSE 安装的操作过程。 在安装前请确认网络环境,如果是隔离环境,无法连接互联网时,请先按照 离线环境安装依赖的指导进行依赖包的安装,然后按照本文的指导继续操作。如果网络环境可以连接互联网,请直接按照本文的指导进行安装。 准备工作​ 请参考安装环境文档准备安装环境。 配置用户与安装目录。 在操作前请检查您是否有 sud

线性因子模型 - 独立分量分析(ICA)篇

序言 线性因子模型是数据分析与机器学习中的一类重要模型,它们通过引入潜变量( latent variables \text{latent variables} latent variables)来更好地表征数据。其中,独立分量分析( ICA \text{ICA} ICA)作为线性因子模型的一种,以其独特的视角和广泛的应用领域而备受关注。 ICA \text{ICA} ICA旨在将观察到的复杂信号

【软考】希尔排序算法分析

目录 1. c代码2. 运行截图3. 运行解析 1. c代码 #include <stdio.h>#include <stdlib.h> void shellSort(int data[], int n){// 划分的数组,例如8个数则为[4, 2, 1]int *delta;int k;// i控制delta的轮次int i;// 临时变量,换值int temp;in

三相直流无刷电机(BLDC)控制算法实现:BLDC有感启动算法思路分析

一枚从事路径规划算法、运动控制算法、BLDC/FOC电机控制算法、工控、物联网工程师,爱吃土豆。如有需要技术交流或者需要方案帮助、需求:以下为联系方式—V 方案1:通过霍尔传感器IO中断触发换相 1.1 整体执行思路 霍尔传感器U、V、W三相通过IO+EXIT中断的方式进行霍尔传感器数据的读取。将IO口配置为上升沿+下降沿中断触发的方式。当霍尔传感器信号发生发生信号的变化就会触发中断在中断

kubelet组件的启动流程源码分析

概述 摘要: 本文将总结kubelet的作用以及原理,在有一定基础认识的前提下,通过阅读kubelet源码,对kubelet组件的启动流程进行分析。 正文 kubelet的作用 这里对kubelet的作用做一个简单总结。 节点管理 节点的注册 节点状态更新 容器管理(pod生命周期管理) 监听apiserver的容器事件 容器的创建、删除(CRI) 容器的网络的创建与删除