【C语言】程序员自我修养之文件操作

2024-05-24 22:36

本文主要是介绍【C语言】程序员自我修养之文件操作,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

【C语言】程序员自我修养之文件操作

🔥个人主页大白的编程日记

🔥专栏C语言学习之路


文章目录

  • 【C语言】程序员自我修养之文件操作
    • 前言
    • 一.文件介绍
      • 1.1为什么使用文件
      • 1.2文件分类
      • 1.3二进制文件和文本文件
    • 二.文件的打开和关闭
      • 2.1流和标准流
      • 2.2文件指针
      • 2.3文件的打开和关闭
    • 三.文件的顺序读写
      • 3.1fgetc和fputc
      • 3.2fgets和fputs
      • 3.3fprintf和fscanf
      • 3.4对比函数
      • 3.5fwrite和fread
    • 四.文件的随机读写
    • 五. 文件读取结束的判定
    • 六.文件缓冲区
    • 后言

前言

哈喽,各位小伙伴大家好!今天给大家分享的是,作为程序员的自我修养的文件操作。话不多说,咱们直接进入正题!向大厂冲锋!

一.文件介绍

1.1为什么使用文件

以这段代码为例:

#define _CRT_SECURE_NO_WARNINGS 1
#include<stdio.h>
int main()
{int n = 0;scanf("%d", &n);printf("%d", n);return 0;
}

当我们输入10时,发现n这时确实时10。

但当我们退出程序,重新运行时n的值已经不见了。

可以发现我们刚才再程序输入的10,在内存中并没有持久化的保存。
但是我们硬盘中的文件的数据就可以永久的保存起来。

  • 文件

如果没有文件,我们写的程序的数据是存储在电脑的内存中,如果程序退出,内存回收,数据就丢失了,等再次运行程序,是看不到上次程序的数据的,如果要将数据进行持久化的保存,我们可以使用文件。


1.2文件分类

磁盘(硬盘)上的文件是文件。
但是在程序设计中,我们⼀般谈的文件有两种:程序文件、数据文件(从文件功能的角度来分类的)。

  • 程序文件
    程序文件包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序windows环境后缀为.exe)。
  • 数据文件
    文件的内容不⼀定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。

今天主要我们讨论的是数据文件。
在以前各章所处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。
其实有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘上文件。

  • 文件名
    ⼀个文件要有一个唯一的文件标识,以便用户识别和引用。
    文件名包含3部分:文件路径+文件名主干+文件后缀
    例如: c:\code\test.txt
    为了方便起见,文件标识常被称为文件名。

1.3二进制文件和文本文件

根据数据的组织形式,数据⽂件被称为文本文件或者二进制文件。

  • 二进制文件
    数据在内存中以⼆进制的形式存储,如果不加转换的输出到外存的文件中,就是⼆进制文件。例如obj文件:因为是二进制的文件,我们用文本编辑器看到的就是乱码。
  • 文本文件
    如果要求在外存上以ASCII码的形式存储,则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。
    txt后缀的就是文本文件

⼀个数据在文件中是怎么存储的呢?

  • 存储方式
    字符一律以ASCII形式存储,数值型数据既可以用ASCII形式存储,也可以使用二进制形式存储。

如有整数10000,如果以ASCII码的形式输出到磁盘,则磁盘中占用5个字节(每个字符⼀个字节),而⼆进制形式输出,则在磁盘上只占4个字节

#include <stdio.h>
int main()
{int a = 10000;FILE* pf = fopen("test.txt", "wb");fwrite(&a, 4, 1, pf);//⼆进制的形式写到⽂件中fclose(pf);pf = NULL;return 0;
}
  • 我们以文本编辑器打开是看不看不懂的。

  • 所以我们以二进制编辑器打开


二.文件的打开和关闭

2.1流和标准流


  • 我们程序的数据需要输出到各种外部设备,也需要从外部设备获取数据,不同的外部设备的输入输出操作各不相同,为了方便程序员对各种设备进行方便的操作,我们抽象出了流的概念,我们可以把流想象成流淌着字符的河。

C程序针对文件、画面、键盘等的数据输入输出操作都是通过流操作的。
一般情况下,我们要想向流里写数据,或者从流中读取数据,都是要打开流,然后操作。

  • 标准流

那为什么我们从键盘输入数据,向屏幕上输出数据,并没有打开流呢?

int main()
{int a = 0;scanf("%d", &a);printf("%d", a);return 0;
}

那是因为C语言程序在启动的时候,默认打开了3个流:

  • stdin
    标准输入流,在⼤多数的环境中从键盘输入,scanf函数就是从标准输入流中读取数据

  • stdout
    标准输出流,大多数的环境中输出至显示器界面,printf函数就是将信息输出到标准输出流中。

  • stderr
    标准错误流,大多数环境中输出到显示器界面。

这是默认打开了这三个流,我们使用scanf、printf等函数就可以直接进行输入输出操作的。
stdin、stdout、stderr 三个流的类型是: FILE* ,通常称为文件指针。
C语言中,就是通过 FILE* 的文件指针来维护流的各种操作的。

2.2文件指针

缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。

每个被使⽤的⽂件都在内存中开辟了⼀个相应的文件信息区,⽤来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在⼀个结构体变量中的。该结构体类型是由系统声明的,取名 FILE.

例如,VS2013 编译环境提供的 stdio.h 头文件中有以下的文件类型申明:

struct _iobuf {char *_ptr;int _cnt;char *_base;int _flag;int _file;int _charbuf;int _bufsiz;char *_tmpfname;};
typedef struct _iobuf FILE;

不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。

每当打开一个文件的时候,系统会根据文件的情况自动创建⼀个FILE结构的变量,并填充其中的信息,使用者不必关心细节。
一般都是通过⼀个FILE的指针来维护这个FILE结构的变量,从而维护整个文件流的读写操作,这样使用起来更加方便。

下⾯我们可以创建⼀个FILE*的指针变量:

FILE* pf;//⽂件指针变量

定义pf是⼀个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是⼀个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够间接找到与它关联的文件。

2.3文件的打开和关闭

文件操作就像喝水一样:

  • 喝水
    打开瓶盖——喝水——关闭瓶盖

  • 文件操作
    打开文件——读写文件——关闭文件

那文件是如何打开关闭的呢?

在编写程序的时候,在打开文件的同时,都会返回⼀个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。
ANSIC 规定使用 fopen 函数来打开文件, fclose 来关闭文件。

//打开⽂件
FILE * fopen ( const char * filename, const char * mode );
//关闭⽂件
int fclose ( FILE * stream );
  • 参数
    filename是要操作的文件名,mode表示文件的打开模式,
    stream是要关闭文件的的文件指针

mode表示文件的打开模式,下面都是文件的打开模式:

  • "w"和"a"的区别
    ”w“会清空文件中原有的数据再写。"a"则再原来的数据后追加数据

注意是双引号不是单引号!因为char*指针指向的是字符串首元素的地址,所以要用双引号表示字符串

实例代码:

#include <stdio.h>
int main ()
{FILE * pFile;//打开⽂件pFile = fopen ("myfile.txt","w");//⽂件操作if (pFile!=NULL)//检查指针返回值{fputs ("fopen example",pFile);//关闭⽂件fclose (pFile);pFile=NULL;//置空return 0;
}

注意fopen 如果打开成功返回文件指针,否则返回空指针,所以我们需要对fopen的返回值做判断。
fclose关闭文件后不会把文件指针置为空,所以我们需要手动置空

三.文件的顺序读写

顺序读写函数介绍

3.1fgetc和fputc

fputc是字符输入函数,可以把一个字符写进文件。

  • 参数
    character是要写进去的字符,ASCLL码值表示,所以用int类型。
    stream是指向文件的文件指针

  • 光标
    文件中有光标进行读写操作的维护,写数据后光标就会向后移动。

  • 返回值
    如果写操作成功的话,就返回写的字符。失败就返回EOF,就是-1。同时会把错误标记起来。

int main()
{FILE* pf = fopen("test.txt", "w");if (pf == NULL){perror("fopen");return 1;}for (int i = 'a'; i < 'z'; i++){fputc(i, pf);}fclose(pf);pf = NULL;return 0;
}

那如何读取文件的数据呢?那就要使用fgetc

  • 参数
    stream是要读取文件的文件指针

  • 返回值
    如果读取成功返回值读取成功的字符,ascll码值表示是int
    如果读取失败或遇到文件末尾返回EOF就是-1,所以用int返回,兼容两种返回值的类型

  • 光标
    文件中有光标进行读写操作的维护,读数据后光标就会向后移动。

int main()
{FILE* pf = fopen("test.txt", "r");if (pf == NULL){perror("fopen");return 1;}int ch=0;while ((ch=fgetc(pf))!= EOF){printf("%c", ch);}fclose(pf);pf = NULL;return 0;
}

在这里插入图片描述

这些函数都是一个一个字符读写的,如果我们要读写字符串呢?

3.2fgets和fputs

fputs是把字符串写到文件里的函数。

  • 参数
    str指向要写入字符串的指针,
    stream是要写入文件的文件指针

  • 换行
    如果想换行写入字符串,需要再字符串末尾添加\0

那如何都出来呢?这就得使用fgets。

  • 参数

    str是读取内存存放的地址
    num是读取的长度,但实际他只会读取num-1个字符,最后一个字符会补上\0。如果文件中的字符串长度不够,就会把字符串读完(包括\n),然后补上\0

    在这里插入图片描述
    stream是读取文件的文件指针
  • 返回值
    成功读取就返回str的地址
    读取失败就返回空指针。
    所以多次读取时就可以这样写
int main()
{FILE* pf = fopen("test.txt", "r");if (pf == NULL){perror("fopen");return 1;}char s[20] = "xxxxxxxxxxxxxxxxxx";while (fgets(s, 10, pf) != NULL){printf("%s", s);}fclose(pf);pf = NULL;return 0;
}

3.3fprintf和fscanf

当我们要以指定格式写数据到文件时,我们就可以用fprintf函数

我们可以发现printf和fprintf函数参数非常相似,fprintf多了一个文件指针。
其实fprintf使用跟printf基本一样,只是多了一个文件指针而已

int main()
{FILE* pf = fopen("test.txt", "w");if (pf == NULL){perror("fopen");return 1;}struct S s = { "张三", 18, 80.5f};fprintf(pf, "%s %d %f", s.name, s.age, s.score);fclose(pf);return 0;
}


那我们读取就用fscanf读取

我们发现scanf和fscanf也非常相似,就差了一个文件指针的参数
所以fscanf的使用也只需多加一个读取文件的文件指针即可。

int main()
{FILE* pf = fopen("test.txt", "w");if (pf == NULL){perror("fopen");return 1;}struct S s = { "张三", 18, 80.5f};fscanf(pf, "%s %d %f", s.name, &s.age, &s.score);printf("%s %d %f", s.name, s.age, s.score);fclose(pf);return 0;
}

我们发现这些函数都适用于所有流
所有流分为文件流和标准流


那是不是我们用标准流也可以呢?
这里我们来验证一下:

  • 验证

大家发现我们把文件流替换成标准输出流结果也是一样的。

3.4对比函数

sprintf是把格式化的数据转化为字符串的函数

sprintf多了一个str参数,其实就是格式化数据转化字符串后存放的地址

int main()
{FILE* pf = fopen("test.txt", "w");if (pf == NULL){perror("fopen");return 1;}char a[30];struct S s = { "张三", 18, 80.5f};sprintf(a, "%s %d %f", s.name, &s.age, &s.score);printf("%s", a);fclose(pf);return 0;
}


sscanf就是在字符串中读取格式化数据的函数

int main()
{FILE* pf = fopen("test.txt", "w");if (pf == NULL){perror("fopen");return 1;}char a[30];struct S s = { "张三", 18, 80.5f};printf("字符串打印:");sprintf(a, "%s %d %f\n", s.name, s.age, s.score);printf("%s", a);struct S t = {0};sscanf(a, "%s%d%f", t.name, &t.age, &t.score);printf("格式打印: %s %d %f", t.name, t.age, t.score);fclose(pf);return 0;
}

现在我们来对比一下这些相似的函数

3.5fwrite和fread

前面我们用的函数写进去都能看懂,这是因为我们是以文本或字符的形式写进去的。 那以二进制写进去又是怎样的呢?

fwrite把数据以二进制写入文件

  • 参数
    ptr指向一个数组,数组存放要写入的数据
    size是每个数据的大小
    count数据的个数
    stream写入文件的文件指针

  • 打开方式
    "wb"打开

int main()
{FILE* pf = fopen("test.txt", "wb");if (pf == NULL){perror("fopen");return 1;}int arr[] = { 1,2,3,4 };fwrite(arr, 4, 4, pf);fclose(pf);return 0;
}

当然以二进制形式写进去我们看不懂,我们再以二进制形式都出来就好了

fread就是把数据以二进制形式读出来。

  • 参数
    ptr指向数组,读取后的数据存放到数据中
    size读取数据的大小
    count读取数据的个数
    strenm读取文件的文件指针

  • 打开方式
    "rb"打开

  • 返回值
    size_t返回值,表示成功读取的个数。如果读取小于count参数说明是最后一次读取
    当我们不知道文件中的数据个数是就可以这样写

int main()
{FILE* pf = fopen("test.txt", "rb");if (pf == NULL){perror("fopen");return 1;}int arr[20] = { };int i = 0;while (fread(arr+i, 4, 1, pf)){printf("%d ", arr[i]);i++;}fclose(pf);return 0;
}

四.文件的随机读写

大家发现我们讲的这些函数都是一个一个读写,所以叫顺序读写
那我们可不可以想从任意位置开始读写呢?这就是我们接下来要讲的随机读写

fseek函数

  • 参数
    stream:操作文件的文件指针
    offset 想让光标偏移的偏移量
    origin 偏移的起始位置
  • 起始位置
    起始位置有三种
int main()
{FILE* pf = fopen("test.txt", "r");if (pf == NULL){perror("fopen");return 1;}fseek(pf, 2, SEEK_SET);printf("%c", fgetc(pf));fclose(pf);return 0;
}



  • ftell
    返回文件指针相对于起始位置的偏移量
int main ()
{FILE * pFile;long size;pFile = fopen ("myfile.txt","rb");if (pFile==NULL) perror ("Error opening file");else{fseek (pFile, 0, SEEK_END); // non-portablesize=ftell (pFile);fclose (pFile);printf ("Size of myfile.txt: %ld bytes.\n",size);}return 0;
}
  • rewind
    让文件指针的位置回到文件的起始位置
int main ()
{int n;FILE * pFile;char buffer [27];pFile = fopen ("myfile.txt","w+");for ( n='A' ; n<='Z' ; n++)fputc ( n, pFile);rewind (pFile);fread (buffer,1,26,pFile);fclose (pFile);buffer[26]='\0';printf(buffer);return 0;
}

五. 文件读取结束的判定

牢记:在文件读取过程中,不能⽤feof函数的返回值直接来判断文件的是否结束。
feof 的作用是:当文件读取结束的时候,判断是读取结束的原因是否是:遇到文件末尾结束。

  • 文本文件
    判断返回值是否为 EOF ( fgetc结束),或者 NULL ( fgets结束 )

int main(void)
{int c; // 注意:int,⾮char,要求处理EOFFILE* fp = fopen("test.txt", "r");if(!fp) {perror("File opening failed");return EXIT_FAILURE;}//fgetc 当读取失败的时候或者遇到⽂件结束的时候,都会返回EOFwhile ((c = fgetc(fp)) != EOF) // 标准C I/O读取⽂件循环{ putchar(c);}//判断是什么原因结束的if (ferror(fp))puts("I/O error when reading");else if (feof(fp))puts("End of file reached successfully");fclose(fp);
}
  • 二进制文件
    ⼆进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
#include <stdio.h>
enum { SIZE = 5 };
int main(void)
{double a[SIZE] = {1.,2.,3.,4.,5.};FILE *fp = fopen("test.bin", "wb"); // 必须⽤⼆进制模式fwrite(a, sizeof *a, SIZE, fp); // 写 double 的数组fclose(fp);double b[SIZE];fp = fopen("test.bin","rb");size_t ret_code = fread(b, sizeof *b, SIZE, fp); // 读 double 的数组if(ret_code == SIZE) {puts("Array read successfully, contents: ");for(int n = 0; n < SIZE; ++n) printf("%f ", b[n]);putchar('\n');} else { // error handlingif (feof(fp))printf("Error reading test.bin: unexpected end of file\n");else if (ferror(fp)) {perror("Error reading test.bin");}}fclose(fp);
}

六.文件缓冲区

ANSIC 标准采⽤“缓冲文件系统” 处理的数据⽂件的,所谓缓冲文件系统是指系统自动地在内存中为 程序中每⼀个正在使用的⽂件开辟⼀块“⽂件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才⼀起送到磁盘上。如果从磁盘向计算机读⼊数据,则从磁盘⽂件中读取数据输⼊到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓 冲区的大小根据C编译系统决定的。

#include <stdio.h>
#include <windows.h>
//VS2019 WIN11环境测试
int main()
{FILE*pf = fopen("test.txt", "w");fputs("abcdef", pf);//先将代码放在输出缓冲区printf("睡眠10秒-已经写数据了,打开test.txt⽂件,发现⽂件没有内容\n");Sleep(10000);printf("刷新缓冲区\n");fflush(pf);//刷新缓冲区时,才将输出缓冲区的数据写到⽂件(磁盘)//注:fflush 在⾼版本的VS上不能使⽤了printf("再睡眠10秒-此时,再次打开test.txt⽂件,⽂件有内容了\n");Sleep(10000);fclose(pf);//注:fclose在关闭⽂件的时候,也会刷新缓冲区pf = NULL;return 0;
}

这⾥可以得出⼀个结论:
因为有缓冲区的存在,C语⾔在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。
如果不做,可能导致读写文件的问题。

后言

这就是文件操作的全部内容,这些内容可能没那么重要,但是作为一个程序员,这些就像内功一样,是一个程序员的自我修养。所以我们还是要多加了解学习。好啦,今天就分享到这里!咱们下期见!拜拜~

这篇关于【C语言】程序员自我修养之文件操作的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/999720

相关文章

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

C语言 | Leetcode C语言题解之第393题UTF-8编码验证

题目: 题解: static const int MASK1 = 1 << 7;static const int MASK2 = (1 << 7) + (1 << 6);bool isValid(int num) {return (num & MASK2) == MASK1;}int getBytes(int num) {if ((num & MASK1) == 0) {return

MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页:https://tangyuan96.github.io/minigpt_3d_project_page/ 代码:https://github.com/TangYuan96/MiniGPT-3D 论文:https://arxiv.org/pdf/2405.01413 MiniGPT-3D在多个任务上取得了SoTA,被ACM MM2024接收,只拥有47.8M的可训练参数,在一张RTX

如何确定 Go 语言中 HTTP 连接池的最佳参数?

确定 Go 语言中 HTTP 连接池的最佳参数可以通过以下几种方式: 一、分析应用场景和需求 并发请求量: 确定应用程序在特定时间段内可能同时发起的 HTTP 请求数量。如果并发请求量很高,需要设置较大的连接池参数以满足需求。例如,对于一个高并发的 Web 服务,可能同时有数百个请求在处理,此时需要较大的连接池大小。可以通过压力测试工具模拟高并发场景,观察系统在不同并发请求下的性能表现,从而

C语言:柔性数组

数组定义 柔性数组 err int arr[0] = {0}; // ERROR 柔性数组 // 常见struct Test{int len;char arr[1024];} // 柔性数组struct Test{int len;char arr[0];}struct Test *t;t = malloc(sizeof(Test) + 11);strcpy(t->arr,

C语言指针入门 《C语言非常道》

C语言指针入门 《C语言非常道》 作为一个程序员,我接触 C 语言有十年了。有的朋友让我推荐 C 语言的参考书,我不敢乱推荐,尤其是国内作者写的书,往往七拼八凑,漏洞百出。 但是,李忠老师的《C语言非常道》值得一读。对了,李老师有个官网,网址是: 李忠老师官网 最棒的是,有配套的教学视频,可以试看。 试看点这里 接下来言归正传,讲解指针。以下内容很多都参考了李忠老师的《C语言非

C 语言基础之数组

文章目录 什么是数组数组变量的声明多维数组 什么是数组 数组,顾名思义,就是一组数。 假如班上有 30 个同学,让你编程统计每个人的分数,求最高分、最低分、平均分等。如果不知道数组,你只能这样写代码: int ZhangSan_score = 95;int LiSi_score = 90;......int LiuDong_score = 100;int Zhou

C 语言的基本数据类型

C 语言的基本数据类型 注:本文面向 C 语言初学者,如果你是熟手,那就不用看了。 有人问我,char、short、int、long、float、double 等这些关键字到底是什么意思,如果说他们是数据类型的话,那么为啥有这么多数据类型呢? 如果写了一句: int a; 那么执行的时候在内存中会有什么变化呢? 橡皮泥大家都玩过吧,一般你买橡皮泥的时候,店家会赠送一些模板。 上

动手学深度学习【数据操作+数据预处理】

import osos.makedirs(os.path.join('.', 'data'), exist_ok=True)data_file = os.path.join('.', 'data', 'house_tiny.csv')with open(data_file, 'w') as f:f.write('NumRooms,Alley,Price\n') # 列名f.write('NA