Linux入门真经-031Linux文件系统初探

2024-03-04 17:48

本文主要是介绍Linux入门真经-031Linux文件系统初探,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数据存放于磁盘之中。从物理角度上去看,存于硬盘的扇区或页之间。但是人作为使用者来讲,很难记住文件存于磁盘的哪个物理位置,即使记住也很难去使用和管理。因此便出现了文件系统(VFS:virtual file system),帮助我们去寻址文件地址、分配存储空间、提供各式文件格式的支持、提供备份功能等等。为了应对不同的场景和时代需求,文件系统有很多种实现且各有特点,但是从逻辑上来讲都是提供上述功能的,如:


Linux文件系统:ext2/ext3/ext4、xfs、btrfs、swap等。

Windows文件系统:fat32、ntfs等。

网络文件系统:nfs等。

分布式文件系统:ceph、mogilefs等。

伪文件系统:proc、sysfs等

等等等……

 

其中,即将给大家介绍的是:Centos6默认的文件系统ext4,Centos7默认文件系统xfs,以及交换分区swap。

 

本节给大家讲一下linux文件系统一些普适性的东西,最后给大家介绍一下swap。

 

1、文件系统相关基础知识

 

inode

我们前面讲过每一个文件都有元数据,包括了自己的名称、大小、权限、修改时间等等。保存元数据的地方我们称之为inode。

文件系统中有许许多多的inode,每一个inode都有一个inode号。他们记录了文件的元数据,也是通往文件真正数据的一扇门。保存文件数据的区块我们称之为block。inode中记录了该文件的block位于磁盘中的什么位置,便于文件系统进一步的寻址。一个文件系统占用一个或者多个inode,但是一个inode不能同时记录多个文件的信息。

 

block

block用来记录文件的真正数据。每一个block也有一个block号。一个文件可以占用多个block。一个block不能记录多个文件的数据。

block过大的时候,可能会造成空间上的浪费。

比如说,我有1000个1k的小文件。block的大小是4K,那么我需要1000个inode和1000个block,数据主体占据的空间是1000*4K而不是1000*1K哦。

block过小时,大文件的inode会不得不去记录更多的block号,严重时可能会导致inode空间不够用。

无论是inode用完还是block用完,这个文件系统剩余的空间都不能继续使用了,所以创建时inode和block的大小最好过脑子设计一下。好在,默认的参数相当合理。除非你明确知道该文件系统会大量存放小文件或存放巨大文件,一般没必要做过多调整。

 

superblock

记录文件系统的整体信息。包括这个文件系统有多少inode、多少block;还剩下多少inode、block可用等等。

 

block bitmap

我们在新增文件的时候,我们需要知道哪些block已经使用,哪些block可以使用。block bitmap就记录了这些信息

 

inode bitmap

类比block bitmap,记录了哪些inode可以使用,哪些已经使用。

 

2、SWAP文件系统简介

 

在linux中,swap是一个单独的分区、单独的文件系统。所以有人习惯称swap分区,有人习惯称swap文件系统。然而怎么称呼其实不重要,我们得搞清楚它是干嘛的。

说到swap不得不扯到Linux的内存使用机制。

linux会将经常用到的数据存入内存中(称之为cache/buffer,这两者有区别,但是你暂时可以理解成都是缓存)。因此,当用户再次需要这部分数据的时候,就可以直接从内存里拿了,速度会快得多得多。因此,你会发现,跑着业务的服务器运行一段时间后空闲内存几乎为零,因为大量空间被缓存占据了,这是linux本身的运行机制。

然而,当服务器负荷过重、内存不够用的时候怎么办呢?这个时候swap就派上用场了。系统会根据最少使用算法,把最不常用的数据填进swap中,以腾出部分内存给业务使用。我们知道,swap本质还是硬盘,所以性能要比内存差得多。所以当你发现系统开始使用swap时,证明你该采取措施降低系统负荷了。我们一般会加内存(纵向扩容)或者使用一些负载均衡的措施(横向扩容)。

 

本节的内容就到这里,下一节给大家介绍常见文件系统的创建与管理。

关注本公众号获取每日更新

这篇关于Linux入门真经-031Linux文件系统初探的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/773957

相关文章

linux如何复制文件夹并重命名

《linux如何复制文件夹并重命名》在Linux系统中,复制文件夹并重命名可以通过使用“cp”和“mv”命令来实现,使用“cp-r”命令可以递归复制整个文件夹及其子文件夹和文件,而使用“mv”命令可以... 目录linux复制文件夹并重命名我们需要使用“cp”命令来复制文件夹我们还可以结合使用“mv”命令总

Linux使用cut进行文本提取的操作方法

《Linux使用cut进行文本提取的操作方法》Linux中的cut命令是一个命令行实用程序,用于从文件或标准输入中提取文本行的部分,本文给大家介绍了Linux使用cut进行文本提取的操作方法,文中有详... 目录简介基础语法常用选项范围选择示例用法-f:字段选择-d:分隔符-c:字符选择-b:字节选择--c

Linux使用nload监控网络流量的方法

《Linux使用nload监控网络流量的方法》Linux中的nload命令是一个用于实时监控网络流量的工具,它提供了传入和传出流量的可视化表示,帮助用户一目了然地了解网络活动,本文给大家介绍了Linu... 目录简介安装示例用法基础用法指定网络接口限制显示特定流量类型指定刷新率设置流量速率的显示单位监控多个

ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法

《ElasticSearch+Kibana通过Docker部署到Linux服务器中操作方法》本文介绍了Elasticsearch的基本概念,包括文档和字段、索引和映射,还详细描述了如何通过Docker... 目录1、ElasticSearch概念2、ElasticSearch、Kibana和IK分词器部署

Linux流媒体服务器部署流程

《Linux流媒体服务器部署流程》文章详细介绍了流媒体服务器的部署步骤,包括更新系统、安装依赖组件、编译安装Nginx和RTMP模块、配置Nginx和FFmpeg,以及测试流媒体服务器的搭建... 目录流媒体服务器部署部署安装1.更新系统2.安装依赖组件3.解压4.编译安装(添加RTMP和openssl模块

linux下多个硬盘划分到同一挂载点问题

《linux下多个硬盘划分到同一挂载点问题》在Linux系统中,将多个硬盘划分到同一挂载点需要通过逻辑卷管理(LVM)来实现,首先,需要将物理存储设备(如硬盘分区)创建为物理卷,然后,将这些物理卷组成... 目录linux下多个硬盘划分到同一挂载点需要明确的几个概念硬盘插上默认的是非lvm总结Linux下多

linux进程D状态的解决思路分享

《linux进程D状态的解决思路分享》在Linux系统中,进程在内核模式下等待I/O完成时会进入不间断睡眠状态(D状态),这种状态下,进程无法通过普通方式被杀死,本文通过实验模拟了这种状态,并分析了如... 目录1. 问题描述2. 问题分析3. 实验模拟3.1 使用losetup创建一个卷作为pv的磁盘3.

Linux环境变量&&进程地址空间详解

《Linux环境变量&&进程地址空间详解》本文介绍了Linux环境变量、命令行参数、进程地址空间以及Linux内核进程调度队列的相关知识,环境变量是系统运行环境的参数,命令行参数用于传递给程序的参数,... 目录一、初步认识环境变量1.1常见的环境变量1.2环境变量的基本概念二、命令行参数2.1通过命令编程

Linux之进程状态&&进程优先级详解

《Linux之进程状态&&进程优先级详解》文章介绍了操作系统中进程的状态,包括运行状态、阻塞状态和挂起状态,并详细解释了Linux下进程的具体状态及其管理,此外,文章还讨论了进程的优先级、查看和修改进... 目录一、操作系统的进程状态1.1运行状态1.2阻塞状态1.3挂起二、linux下具体的状态三、进程的

Linux编译器--gcc/g++使用方式

《Linux编译器--gcc/g++使用方式》文章主要介绍了C/C++程序的编译过程,包括预编译、编译、汇编和链接四个阶段,并详细解释了每个阶段的作用和具体操作,同时,还介绍了调试和发布版本的概念... 目录一、预编译指令1.1预处理功能1.2指令1.3问题扩展二、编译(生成汇编)三、汇编(生成二进制机器语