一篇博客学懂文件操作——C语言

2023-10-15 12:36

本文主要是介绍一篇博客学懂文件操作——C语言,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、为什么使用文件

为什么要使用文件呢?在刚开始学文件操作时,我发出这种疑问。我只需要写好程序就行,保不保存到文件中都无所谓吧。所以从一开始我也就抱着走马观花的心态,“象征性听一听就好啦”“以后能用到时候再学吧”......

但是,我昨天突然换了思路,之前写过的通讯录管理系统,我如何做到真正保存几个重要联系人呢?如果在未来某天我与他们失去联系,我是否真的能用自己写的程序找到他们呢!当我真正实践的时候,我发现这确实挺有意义的。

当我们用二进制写进文件,正常打开文件是我们肉眼读不懂的,只有我们再写专门读取二进制的程序时才能读懂,这样我想:
肉眼无法读懂是独属于二进制的浪漫。

言归正传,当我们想真正保存信息到电脑,只有我们自己选择删除数据的时候,数据才不复存在。
这就涉及到了数据持久化的问题,我们一般数据持久化的方法有,把数据存放在磁盘文件、存放到数据库等方式,而现在学习的使用文件我们可以将数据直接存放在电脑的硬盘上,做到了数据的持久化

二、什么是文件

磁盘上的文件是文件。
但是在程序设计中,我们一般谈的文件有两种:程序文件、数据文件(从文件功能的角度来分的)。

2.1程序文件

包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。

2.2数据文件

文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。

这里我们学习的主要是数据文件。

2.3文本文件和二进制文件

根据数据的组织形式,数据文件被称为文本文件或者二进制文件


数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是二进制文件。
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。


一个数据在内存中是怎么存储的呢?
字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。


如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符一个字节),而二进制形式输出,则在磁盘上只占4个字节(VS2013测试)。

2.4文件名

一个文件要有一个唯一的文件标识,以便用户识别和引用。

文件名包含3部分:文件路径+文件名主干+文件后缀

如如: c:\code\test.txt

为了方便起见,文件标识常被称为文件名

三、文件的打开和关闭

3.1 文件指针

缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。

这些信息是保存在一个结构体变量中的。该结构体类型是有系统声明的,取名FILE(每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,我们不必关心细节)

一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。

FILE* pf; //文件指针变量

为了和常规指针 p 区分开,我们定义 pf 是一个指向FILE类型数据的指针变量。可以使 pf 指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联的文件。

3.2 文件的打开和关闭

文件在读写之前应该先打开文件,在使用结束之后应该关闭文件(这与我们在电脑中使用文件的操作也相同,不对吗)。
在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系,在接下来的文档中,我们就可以用 pf 去控制我们的文件。

//打开文件
FILE * fopen ( const char * filename, const char * mode );
//关闭文件
int fclose ( FILE * stream );

/*用例*/
int main()
{//打开文件FILE* pf = fopen("test.txt", "r");//判断是否为空if (pf == NULL){perror("fopen");return;}//文件相关操作//......//关闭文件fclose(pf);pf = NULL;return 0;
}

3.3文件的顺序读写函数

3.3.1流的概念

首先,我们先来了解一下“流”的概念,“流”是一个非常抽象的概念,里面存放的数据通过各种“流”流淌到其对应的领域中,比如屏幕、硬盘、网络......

3.3.2输入输出的概念 

其次,为了避免我们在学习函数时,对输入输出的概念产生歧义,我们先对程序和文件的输入输出关系进行了解: 

因为我们在标准流中都是键盘和程序在互动,而在文件流中,我们操作键盘使程序和文件互动,难免会引起一些歧义,比如我们以为键盘向C程序输入是输入流,但是其实是程序在对文件输出,是输出流......

3.3.3函数操作

现在,我们来正式学习一下能操作文件的函数: 

功能函数名适用于
字符输入函数fgetc所有输入流
字符输出函数fputc所有输出流
文本行输入函数fgets所有输入流
文本行输出函数fputs所有输出流
格式化输入函数fscanf所有输入流
格式化输出函数fprintf所有输出流
二进制输入fread文件
二进制输出fwrite文件

 其中,流分为了文件流和标准输入(输出)流,前六个函数都是既可以向文件传输,也可以向屏幕传输,而后两个函数只能向文件传输。

 当我们想用这六个函数运行标准流时,我们就可以把 FILE *stream 改为对应的 stdout 或 stdin就好啦。

下面我们就来学习属于二进制的浪漫:fwrite 和 fread 函数啦!

 这里 ptr 指向的数组是我们自己创建的,当输出时我们就可以把需要写入文件的内容放在数组里。当输出时我们就把文件中的内容存入数组然后输出数组,这里以我写的通讯录为例:

我们用来接收的文件的数组 (ptr指向的数组) 的格式一定要与文件中的数据格式相同,才能正确读取到二进制文件中的数据,也就是说如果你压根不知道二进制文件中存放的是什么,那你也很难通过 fread 读出来。 

3.4文件的随机读写函数

如果对文件进行操作,单单有上面几个函数肯定是不够的,下面我们来介绍另外几个函数,能让我们随机读取文件中的数据。

3.4.1fseek

根据文件指针的位置和偏移量来定位文件指针

origin: 

名称参考位置
SEEK_SET文件起始位置
SEEK_CUR文件当前位置(光标定位)
SEEK_END

文件结束位置

我们用 fseek 可以指定我们光标的位置,以下我们再进行写文件操作时,光标的位置不会改变。

当我们使用前面的 fgetc 时,我们一个字符一个字符的取出,光标的位置就定位在某个字符前面,这就是 SEEK_CUR 的位置。

下面我们来看一个例子: 

3.4.2 ftell

返回文件指针相对于起始位置的偏移量

和 SEEK_CUR 的位置相同。

3.4.3 rewind

让文件指针的位置回到文件的起始位置

四、文件读取结束的判定

4.1 feof

当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束

feof 函数的返回值不能直接用来判断文件的是否结束!

4.2文本文件

判断返回值是否为 EOF ( fgetc ),或者 NULL ( fgets )

这时候如果我们想读取文件时,就可以使用 while 循环,类似之前的多组输入。

4.3二进制文件

二进制文件的读取结束判断,判断返回值是否小于实际要读的个数

这就是前面为什么我要使用 for 循环来遍历整个文件,我需要一个准确的值才能完整的遍历二进制文件。

五、文件缓冲区 

ANSIC 标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”

从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。

如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。

代码测试:

#include <stdio.h>
#include <windows.h>
int main()
{FILE* pf = fopen("test.txt", "w");fputs("夜夜亮晶晶", pf);//先将代码放在输出缓冲区printf("睡眠10秒-已经写数据了,打开test.txt文件,发现文件没有内容\n");Sleep(10000);printf("刷新缓冲区\n");fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到文件(磁盘)printf("再睡眠10秒-此时,再次打开test.txt文件,文件有内容了\n");Sleep(10000);fclose(pf);//注:fclose在关闭文件的时候,也会刷新缓冲区pf = NULL;return 0;
}

 

这篇关于一篇博客学懂文件操作——C语言的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/217741

相关文章

Python调用Orator ORM进行数据库操作

《Python调用OratorORM进行数据库操作》OratorORM是一个功能丰富且灵活的PythonORM库,旨在简化数据库操作,它支持多种数据库并提供了简洁且直观的API,下面我们就... 目录Orator ORM 主要特点安装使用示例总结Orator ORM 是一个功能丰富且灵活的 python O

python使用fastapi实现多语言国际化的操作指南

《python使用fastapi实现多语言国际化的操作指南》本文介绍了使用Python和FastAPI实现多语言国际化的操作指南,包括多语言架构技术栈、翻译管理、前端本地化、语言切换机制以及常见陷阱和... 目录多语言国际化实现指南项目多语言架构技术栈目录结构翻译工作流1. 翻译数据存储2. 翻译生成脚本

0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型的操作流程

《0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeekR1模型的操作流程》DeepSeekR1模型凭借其强大的自然语言处理能力,在未来具有广阔的应用前景,有望在多个领域发... 目录0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型,3步搞定一个应

Go语言中三种容器类型的数据结构详解

《Go语言中三种容器类型的数据结构详解》在Go语言中,有三种主要的容器类型用于存储和操作集合数据:本文主要介绍三者的使用与区别,感兴趣的小伙伴可以跟随小编一起学习一下... 目录基本概念1. 数组(Array)2. 切片(Slice)3. 映射(Map)对比总结注意事项基本概念在 Go 语言中,有三种主要

轻松上手MYSQL之JSON函数实现高效数据查询与操作

《轻松上手MYSQL之JSON函数实现高效数据查询与操作》:本文主要介绍轻松上手MYSQL之JSON函数实现高效数据查询与操作的相关资料,MySQL提供了多个JSON函数,用于处理和查询JSON数... 目录一、jsON_EXTRACT 提取指定数据二、JSON_UNQUOTE 取消双引号三、JSON_KE

C语言中自动与强制转换全解析

《C语言中自动与强制转换全解析》在编写C程序时,类型转换是确保数据正确性和一致性的关键环节,无论是隐式转换还是显式转换,都各有特点和应用场景,本文将详细探讨C语言中的类型转换机制,帮助您更好地理解并在... 目录类型转换的重要性自动类型转换(隐式转换)强制类型转换(显式转换)常见错误与注意事项总结与建议类型

C++实现封装的顺序表的操作与实践

《C++实现封装的顺序表的操作与实践》在程序设计中,顺序表是一种常见的线性数据结构,通常用于存储具有固定顺序的元素,与链表不同,顺序表中的元素是连续存储的,因此访问速度较快,但插入和删除操作的效率可能... 目录一、顺序表的基本概念二、顺序表类的设计1. 顺序表类的成员变量2. 构造函数和析构函数三、顺序表

使用C++实现单链表的操作与实践

《使用C++实现单链表的操作与实践》在程序设计中,链表是一种常见的数据结构,特别是在动态数据管理、频繁插入和删除元素的场景中,链表相比于数组,具有更高的灵活性和高效性,尤其是在需要频繁修改数据结构的应... 目录一、单链表的基本概念二、单链表类的设计1. 节点的定义2. 链表的类定义三、单链表的操作实现四、

Python利用自带模块实现屏幕像素高效操作

《Python利用自带模块实现屏幕像素高效操作》这篇文章主要为大家详细介绍了Python如何利用自带模块实现屏幕像素高效操作,文中的示例代码讲解详,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1、获取屏幕放缩比例2、获取屏幕指定坐标处像素颜色3、一个简单的使用案例4、总结1、获取屏幕放缩比例from

通过prometheus监控Tomcat运行状态的操作流程

《通过prometheus监控Tomcat运行状态的操作流程》文章介绍了如何安装和配置Tomcat,并使用Prometheus和TomcatExporter来监控Tomcat的运行状态,文章详细讲解了... 目录Tomcat安装配置以及prometheus监控Tomcat一. 安装并配置tomcat1、安装