Linux-文件系统理解(磁盘的物理与逻辑结构、什么是inode、OS如何管理磁盘)

2024-04-14 16:44

本文主要是介绍Linux-文件系统理解(磁盘的物理与逻辑结构、什么是inode、OS如何管理磁盘),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、磁盘

磁盘的物理结构

        磁盘的本质是一个机械设备,可以存储大量的二进制信息,是实现数据存储的基础硬件设施,磁盘的盘片类似于光盘,不过盘片的两面都是可读可写可擦除的,每个盘面都有一个磁头马达可以使盘片旋转起,磁头悬浮在非常接近盘片表面的位置,通过感应磁性变化来读取或改变磁性以读写数据。

        

        

磁盘的存储结构

        一个磁盘可能拥有多个盘片,一个盘片存在两个盘面,而每个盘面以距离圆心的远近可以分为许多磁道,每个磁道又会被分为许多的扇区,同一径向位置的所有磁道组成一个柱面。

        盘片的旋转是为了定位对应扇区,磁头左右摇摆是为了确定对应的磁道

  1. 盘片(Platters)

    • 硬盘内部包含一组或多组圆形的薄金属盘片,它们堆叠在一起,并且每个盘片表面都涂覆一层磁性材料,用于记录二进制数据。
    • 磁盘片可以双面存储数据,即每个盘片通常会有两个磁化表面。
  2. 磁道(Tracks)

    • 每个盘片表面被划分为一系列同心圆,这些圆轨迹被称为磁道。磁道是记录数据的基本轨道,磁道越靠近中心,其直径越小,容纳的比特密度相对较高。
  3. 扇区(Sectors)

    • 每个磁道进一步被划分为多个扇区,扇区是磁盘上能够独立寻址并存储固定大小数据块的最小单元,常见的扇区大小是512字节或4KB。
  4. 柱面(Cylinders)

    • 同一径向位置的所有磁道组成一个柱面。也就是说,硬盘中所有盘片上相同半径的磁道构成一个柱面。在访问数据时,磁头同时移动到对应柱面上的同一磁道位置。
  5. 磁头(Heads)

    • 每个盘面都有一个读写磁头,它们安装在磁臂(Actuator Arm)上。当磁盘旋转时,磁头悬浮在非常接近盘片表面的位置,通过感应磁性变化来读取或改变磁性以读写数据。

磁盘的逻辑结构

        对于磁带我们知道它是一个线性的存储介质,在录音机中通过磁带在两个圈的旋转便可以访问其中的数据,对于磁盘,我们也可以把他抽象的想象为一个线性的结构,将每个盘面展开,将磁道连接到一起,此时该线性结构就为一个以扇区为基本单位的一个数组,通过数组下标就可以访问对应扇区的内容,只要有扇区对应的下标就可以通过一些简单的计算找到其在磁盘的物理位置。故文件就是在磁盘中占几个扇区的问题

例如:若扇区的下标为index,一个盘面有10个磁道,一个磁道分为了100个扇区,那么一个盘面就拥有1000个扇区,index/1000为该扇区位于哪个盘面,tmp=(index%1000),tmp为该扇位于哥这个盘面的第几个扇区,tmp/100为位于该盘面的哪个磁道,tmp%100为位于该磁道到的第几个扇区。

所以找到一个指定扇区分为三步:

  1. 找到对应的磁头(Header)
  2. 找到对应的磁道(Cylinder)
  3. 找到对应扇区(Sector)

该方法成为CHS定址法

        一个扇区为512个字节,在操作系统与磁盘进行交互的时候,OS认为一次读取512个字节的内容太少了,所以规定与磁盘交互的基本单位为4kb,也就是8个连续的扇区,所以我们可以进一步对磁盘进行抽象,将每8个扇区抽象为一个块,这样磁盘就被抽象为了一个以块为基本单位的数组,称为LBA 逻辑区块地址(块中的8个扇区最后是连续的,不然磁头和盘片要进行大量的旋转寻址,会影响效率),通过块数组下标,我们就可以找到对应扇区的数组下标,n*8就为该块对应第一个扇区的下标,而该块的8个扇区都是连续的,这样就可以锁定该块所有的扇区了。

        所以只要有一个起始,知道磁盘的总大小,该磁盘有多少块,每个块的块号,如何转换到对应的多个CHS地址我们就全部知道了。

        综上所述,一个磁盘被分为了许多的块,操作系统维护这么多的块其实是有一定难度的,一般会对磁盘在进行分区,其实我们的电脑一般就只有一个磁盘,其中的C盘、D盘就是所谓的分区,只要能管理好一个分区就能管理好整个磁盘

二、inode与文件系统

        为了管理好一个分区,OS还会将一个分区进行分组,此时问题就到了如何管理好一个分组?

这样一层一层剥开分析的思想叫做分治。接下来就讲解一下如何管理好一个分组:

文件=内容+属性,文件储存在磁盘的本质就是文件的内容与文件的属性数据保存在磁盘,在Linux下,文件的内容与属性数据是分开保存的

  • Data Blocks:数据区,及保存文件内容的地方,在数据区内抽象存在着许多的块,每个块都有自己的块号,数据就保存在这些快中
  • Block Bitmap:块位图,Block Bitmap中记录着Data Block中哪个数据块已经被占用,哪个数据块没 有被占用
  • inode:文件的类型与内容是不同的,但是描述文件的属性却是相同的,例如文件的大小,文件的创建时间等等,这些数据被保存在一个一个结构体中,这个结构体就称为inode。一般这个结构体的大小是固定的128个字节,每一个文件被一个inode描述,但是inode中并不会保存文件的名字,在内核层面上每一个inode都会有一个inode_number,只要有inode号就可以在inode表中定位一个inode,其中inode中还会存在一个数组:datablock[N],这个数组会保存文件内容保存在Data Blocks中块的下标,通过这个数组就可以找到文件的内容了,总之只要有了inode号就可以找到文件的内容+属性
  • inode Table:inode表就是管理inode的结构,保存着分组内部所有的可用(已经使用 + 没有使用)inode。
  • inode Bitmap: inode位图,每一个比特位表示一个inode是否空闲可用
  • GDT,Group Descriptor Table:块组描述符,描述块组属性信息,记录了当前块inode与块的使用情况等等
  • super block:超级块,super block中保存的是整个分区的使用情况,记录的信息主要有:bolck 和 inode的总量, 未使用的block和inode的数量,一个block和inode的大小,最近一次挂载的时间,最近一次写入数据的 时间,最近一次检验磁盘的时间等其他文件系统的相关信息。Super Block的信息被破坏,可以说整个 文件系统结构就被破坏了
  • 补充:inode的编号是分区级别的,一个分区中的inode不能相同,分区之间的inode可以有重复,每个组都有自己起始的inode编号与结束inode编号,保存在GDT中,而超级块保存着整个分区所有分组的start_inode_num与end_inode_num,这样只要有inode编号,就可以快速定位inode的位置(Data Block也是这样做的)
  • 为什么超级块保存在组中呢,不应该是分区级别的吗?要知道磁盘信息的写入与读取离不了盘片的旋转与磁头的摆动,如果发生了一些意外情况,将分区超级块的信息刮花了,那么这个分区就损坏掉了,其实并不是所有的分组都会保存超级块,一般是隔几个组保存一个,这么做的原因是当一个组中的超级块数据发生错误,可以将其他组超级块正确的内容加载过来,这样提高了磁盘的复用性。
  • 将分区进行分组,并将GDT等文件管理信息写入,这个操作叫做格式化,这样整个分区的文件系统框架就搭建好了

想要得到一个文件的信息,首先需要这个文件的inode编号,我们平常使用的是文件名是怎么获取inode呢?

        首先我们谈一谈目录,目录也是文件,既然是文件就有文件的属性和文件的内容,而目录的内容其实保存的是文件名与inode编号的映射关系,这样我们通过文件名就可以找到该文件的inode编号了,而目录中不允许出现同名文件就是为了避免找到错误的映射关系,并且我们知道在一个目录中想要创建新文件就需要写权限,这是因为新建一个文件需要在所处目中内容中写入文件名与inode的映射关系

        通过上面的讲述我们理解了,想要管理一个文件,只要找到其所在目录下文件名与inode的映射关系就好了,及访问一个文件需要先访问其目录,而目录也是文件,这样就会一层一层的进行逆向路径解析,在Linux下当遇到根目录时就会停止,因为在机器开机时就会导入数据,OS是知道根目录保存在哪里的,这就是为什么我们进行文件操作时必须带文件的路径

inode编号是分区级别的,那怎么判断文件的inode是哪个分区的呢?

        一个分区想要使用,必须与一个目录进行挂载,也就是进入这个分区就相当于进入了这个目录,这样当我们访问一个文件时,只需要对比该文件的路径前缀是与哪个目录相同,然后确定该目录是与哪个分区挂载的,这样就可以找到这个文件的分区了

这篇关于Linux-文件系统理解(磁盘的物理与逻辑结构、什么是inode、OS如何管理磁盘)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/903496

相关文章

Linux使用nload监控网络流量的方法

《Linux使用nload监控网络流量的方法》Linux中的nload命令是一个用于实时监控网络流量的工具,它提供了传入和传出流量的可视化表示,帮助用户一目了然地了解网络活动,本文给大家介绍了Linu... 目录简介安装示例用法基础用法指定网络接口限制显示特定流量类型指定刷新率设置流量速率的显示单位监控多个

ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法

《ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法》本文介绍了Elasticsearch的基本概念,包括文档和字段、索引和映射,还详细描述了如何通过Docker... 目录1、ElasticSearch概念2、ElasticSearch、Kibana和IK分词器部署

Linux流媒体服务器部署流程

《Linux流媒体服务器部署流程》文章详细介绍了流媒体服务器的部署步骤,包括更新系统、安装依赖组件、编译安装Nginx和RTMP模块、配置Nginx和FFmpeg,以及测试流媒体服务器的搭建... 目录流媒体服务器部署部署安装1.更新系统2.安装依赖组件3.解压4.编译安装(添加RTMP和openssl模块

linux下多个硬盘划分到同一挂载点问题

《linux下多个硬盘划分到同一挂载点问题》在Linux系统中,将多个硬盘划分到同一挂载点需要通过逻辑卷管理(LVM)来实现,首先,需要将物理存储设备(如硬盘分区)创建为物理卷,然后,将这些物理卷组成... 目录linux下多个硬盘划分到同一挂载点需要明确的几个概念硬盘插上默认的是非lvm总结Linux下多

SpringBoot中使用 ThreadLocal 进行多线程上下文管理及注意事项小结

《SpringBoot中使用ThreadLocal进行多线程上下文管理及注意事项小结》本文详细介绍了ThreadLocal的原理、使用场景和示例代码,并在SpringBoot中使用ThreadLo... 目录前言技术积累1.什么是 ThreadLocal2. ThreadLocal 的原理2.1 线程隔离2

Python中顺序结构和循环结构示例代码

《Python中顺序结构和循环结构示例代码》:本文主要介绍Python中的条件语句和循环语句,条件语句用于根据条件执行不同的代码块,循环语句用于重复执行一段代码,文章还详细说明了range函数的使... 目录一、条件语句(1)条件语句的定义(2)条件语句的语法(a)单分支 if(b)双分支 if-else(

linux进程D状态的解决思路分享

《linux进程D状态的解决思路分享》在Linux系统中,进程在内核模式下等待I/O完成时会进入不间断睡眠状态(D状态),这种状态下,进程无法通过普通方式被杀死,本文通过实验模拟了这种状态,并分析了如... 目录1. 问题描述2. 问题分析3. 实验模拟3.1 使用losetup创建一个卷作为pv的磁盘3.

使用Navicat工具比对两个数据库所有表结构的差异案例详解

《使用Navicat工具比对两个数据库所有表结构的差异案例详解》:本文主要介绍如何使用Navicat工具对比两个数据库test_old和test_new,并生成相应的DDLSQL语句,以便将te... 目录概要案例一、如图两个数据库test_old和test_new进行比较:二、开始比较总结概要公司存在多

Linux环境变量&&进程地址空间详解

《Linux环境变量&&进程地址空间详解》本文介绍了Linux环境变量、命令行参数、进程地址空间以及Linux内核进程调度队列的相关知识,环境变量是系统运行环境的参数,命令行参数用于传递给程序的参数,... 目录一、初步认识环境变量1.1常见的环境变量1.2环境变量的基本概念二、命令行参数2.1通过命令编程

Linux之进程状态&&进程优先级详解

《Linux之进程状态&&进程优先级详解》文章介绍了操作系统中进程的状态,包括运行状态、阻塞状态和挂起状态,并详细解释了Linux下进程的具体状态及其管理,此外,文章还讨论了进程的优先级、查看和修改进... 目录一、操作系统的进程状态1.1运行状态1.2阻塞状态1.3挂起二、linux下具体的状态三、进程的