Linux- 由映射文件I/O问题引出的SIGBUS 空洞文件(Sparse File)

2023-10-27 04:01

本文主要是介绍Linux- 由映射文件I/O问题引出的SIGBUS 空洞文件(Sparse File),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

SIGBUS

SIGBUS是一个在Unix-like操作系统中的信号,它通常表示非法访问内存,而这种非法访问的原因与常见的SIGSEGV(段错误)有所不同。以下是可能导致SIGBUS的常见情况:

  1. 未对齐的内存访问:某些硬件平台要求数据(如整数或浮点数)在内存中以特定的地址对齐(如2或4的倍数)。如果程序试图在这些平台上访问未对齐的数据,就可能收到SIGBUS

  2. 映射文件I/O问题:使用mmap()系统调用映射文件到内存并尝试访问文件后面的内容可能会产生SIGBUS。例如,如果文件在被映射后被截断,那么当程序尝试访问被截断部分的数据时,就会得到SIGBUS

  3. 硬件故障:虽然不常见,但内存损坏或其他硬件问题有时可能导致SIGBUS

  4. 堆栈溢出:在某些系统上,尝试超出预分配的堆栈空间可能会导致SIGBUS,而不是更常见的SIGSEGV

  5. 访问不存在的内存页:如果程序尝试访问一个标记为不存在的内存页,那么可能会得到SIGBUS

应对SIGBUS的策略与处理其他运行时错误类似,需要检查代码以找出可能的问题,并使用调试工具帮助诊断。


映射文件I/O问题

当使用 mmap() 系统调用将文件映射到进程的内存地址空间时,基本上是在告诉操作系统:“请将这个文件的内容让我像内存一样直接访问它。” 实际的文件内容并不会立即加载到物理内存中;相反,操作系统会设置页面表条目以反映文件的内容,然后只在实际访问这些地址时才从磁盘加载内容。这被称为按需分页(demand paging)。

考虑以下场景:

  1. 使用 mmap() 映射了一个文件,长度为100字节。
  2. 接着,另一个进程(或可能是同一个进程的另一个部分)截断该文件,使其长度变为50字节。
  3. 现在,我们的进程尝试访问映射中的第60字节。

由于该字节已经不再文件中,操作系统不知道应该返回什么。这时,它会发送 SIGBUS 信号给进程。这样,进程就知道它试图访问的数据不再存在。

为什么不使用 SIGSEGV(通常用于无效的内存访问)呢?因为这不是一个真正的段错误。地址本身是有效的,但由于文件被截断,该地址不再反映任何文件内容。为了区分这两种情况,操作系统选择发送 SIGBUS

如何处理这种情况?通常,我们需要确保在使用 mmap() 映射的文件不会在需要它时被其他进程或线程截断。如果这种情况可能发生,我们的程序需要能够适当地处理 SIGBUS,或者至少在这种情况下能够优雅地失败。

在UNIX和类UNIX系统上,ftruncate() 函数经常与文件系统上的"空洞"(holes)相关联。下面,我们来详细了解一下。


空洞文件(Sparse File)

空洞文件(sparse file)是一个文件,其中有些部分没有分配存储空间,通常这些部分的内容都被视为零。这些未分配空间的部分就是所谓的“空洞”。这意味着,如果我们有一个大部分由零组成的非常大的文件,只为其中的非零部分分配磁盘空间,而为零部分不分配,那么该文件在磁盘上实际占用的空间会小于其表面大小。文件系统知道这些“空洞”并会在需要时适当地处理它们。

使用ftruncate()创建空洞文件:

ftruncate() 函数可以调整已打开文件的大小。如果我们使用 ftruncate() 将文件扩展到比其当前大小更大的大小,新添加的部分不会有实际磁盘空间与之关联,从而形成一个空洞。

例如,考虑以下的程序段:

int fd = open("sparsefile", O_RDWR | O_CREAT, 0666);
ftruncate(fd, 1024 * 1024); // 将文件大小设置为1MB
close(fd);

在上面的代码执行后,sparsefile 的大小会报告为1MB,但它在磁盘上可能实际上占用的空间远远小于这个数值,因为文件中的内容全都是未初始化的,并被视为零。这样,文件系统就为我们创建了一个空洞文件。

为什么要使用空洞文件?

  1. 节省空间:特别是在处理大量包含零的数据时,使用空洞文件可以节省大量磁盘空间。

  2. 快速文件创建:如果我们知道将创建一个非常大的文件,但一开始只需要使用其中的一小部分,使用空洞文件可以避免预先分配大量不必要的磁盘空间。

需要注意的是,不是所有的文件系统都支持空洞文件,但许多现代文件系统(如ext3、ext4和xfs)都支持。

这篇关于Linux- 由映射文件I/O问题引出的SIGBUS 空洞文件(Sparse File)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/285921

相关文章

Linux换行符的使用方法详解

《Linux换行符的使用方法详解》本文介绍了Linux中常用的换行符LF及其在文件中的表示,展示了如何使用sed命令替换换行符,并列举了与换行符处理相关的Linux命令,通过代码讲解的非常详细,需要的... 目录简介检测文件中的换行符使用 cat -A 查看换行符使用 od -c 检查字符换行符格式转换将

Linux系统配置NAT网络模式的详细步骤(附图文)

《Linux系统配置NAT网络模式的详细步骤(附图文)》本文详细指导如何在VMware环境下配置NAT网络模式,包括设置主机和虚拟机的IP地址、网关,以及针对Linux和Windows系统的具体步骤,... 目录一、配置NAT网络模式二、设置虚拟机交换机网关2.1 打开虚拟机2.2 管理员授权2.3 设置子

springboot循环依赖问题案例代码及解决办法

《springboot循环依赖问题案例代码及解决办法》在SpringBoot中,如果两个或多个Bean之间存在循环依赖(即BeanA依赖BeanB,而BeanB又依赖BeanA),会导致Spring的... 目录1. 什么是循环依赖?2. 循环依赖的场景案例3. 解决循环依赖的常见方法方法 1:使用 @La

Java枚举类实现Key-Value映射的多种实现方式

《Java枚举类实现Key-Value映射的多种实现方式》在Java开发中,枚举(Enum)是一种特殊的类,本文将详细介绍Java枚举类实现key-value映射的多种方式,有需要的小伙伴可以根据需要... 目录前言一、基础实现方式1.1 为枚举添加属性和构造方法二、http://www.cppcns.co

Linux系统中卸载与安装JDK的详细教程

《Linux系统中卸载与安装JDK的详细教程》本文详细介绍了如何在Linux系统中通过Xshell和Xftp工具连接与传输文件,然后进行JDK的安装与卸载,安装步骤包括连接Linux、传输JDK安装包... 目录1、卸载1.1 linux删除自带的JDK1.2 Linux上卸载自己安装的JDK2、安装2.1

Linux卸载自带jdk并安装新jdk版本的图文教程

《Linux卸载自带jdk并安装新jdk版本的图文教程》在Linux系统中,有时需要卸载预装的OpenJDK并安装特定版本的JDK,例如JDK1.8,所以本文给大家详细介绍了Linux卸载自带jdk并... 目录Ⅰ、卸载自带jdkⅡ、安装新版jdkⅠ、卸载自带jdk1、输入命令查看旧jdkrpm -qa

Linux samba共享慢的原因及解决方案

《Linuxsamba共享慢的原因及解决方案》:本文主要介绍Linuxsamba共享慢的原因及解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux samba共享慢原因及解决问题表现原因解决办法总结Linandroidux samba共享慢原因及解决

在java中如何将inputStream对象转换为File对象(不生成本地文件)

《在java中如何将inputStream对象转换为File对象(不生成本地文件)》:本文主要介绍在java中如何将inputStream对象转换为File对象(不生成本地文件),具有很好的参考价... 目录需求说明问题解决总结需求说明在后端中通过POI生成Excel文件流,将输出流(outputStre

新特性抢先看! Ubuntu 25.04 Beta 发布:Linux 6.14 内核

《新特性抢先看!Ubuntu25.04Beta发布:Linux6.14内核》Canonical公司近日发布了Ubuntu25.04Beta版,这一版本被赋予了一个活泼的代号——“Plu... Canonical 昨日(3 月 27 日)放出了 Beta 版 Ubuntu 25.04 系统镜像,代号“Pluc

SpringBoot启动报错的11个高频问题排查与解决终极指南

《SpringBoot启动报错的11个高频问题排查与解决终极指南》这篇文章主要为大家详细介绍了SpringBoot启动报错的11个高频问题的排查与解决,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一... 目录1. 依赖冲突:NoSuchMethodError 的终极解法2. Bean注入失败:No qu