前言
文件操作可能看起来很简单,但实际上它涉及到许多细节和技巧。在这篇博客中,我们将从基础开始,逐步深入,为您解析C语言中的文件操作
什么是文件
磁盘上的文件都是文件。
在程序设计中,我们一般谈的文件有两种:程序文件、数据文件
程序文件
包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。
数据文件
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。
本期我们主要探讨数据文件
在以前处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。
其实有时候我们会把信息输出到磁盘上,当需要的时候再从磁盘上把数据读取到内存中使用,这里处理的就是磁盘上文件(从文件中读数据,将数据输出读入文件)。
文件名
在对文件进行操作时,我们必须要知道文件名,接下来我们先对文件名进行介绍。
一个文件要有一个唯一的文件标识,以便用户识别和引用。
文件名包含3部分:文件路径+文件名主干+文件后缀
例如: c:\code\test.txt
为了方便起见,文件标识常被称为文件名。
文件的打开与关闭
缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统声明的,取名FILE.
怎么理解呢?例如:
struct _iobuf { char *_ptr; int _cnt; char *_base; int _flag; int _file; int _charbuf; int _bufsiz; char *_tmpfname; }; typedef struct _iobuf FILE;
不同的C编译器的FILE类型包含的内容不完全相同,但是大同小异。
每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,使用者不必关心细节
一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。
我们先来创建一个FILE* 的指针变量。
FILE* pf;//文件指针变量
定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联的文件。
或许大家有点决定抽象,那么接下来我们切身感受一下。
文件的打开与关闭
文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。
在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。
ANSIC 规定使用fopen函数来打开文件,fclose来关闭文件。
例如:
FILE * pf=fopen ( const char * filename, const char * mode ); int fclose ( FILE * stream );
filename是要打开的文件名, mode就是我们打开文件的方式。stream是指向文件的指针。
打开方式如下:
文件使用方式 | 含义 | 如果指定文件不存在 |
“r”(只读) | 为了输入数据,打开一个已经存在的文本文件 | 出错 |
“w”(只写) | 为了输出数据,打开一个文本文件 | 建立一个新的文件 |
“a”(追加) | 向文本文件尾添加数据 | 出错 |
“rb”(只读) | 为了输入数据,打开一个二进制文件 | 出错 |
“wb”(只写) | 为了输出数据,打开一个二进制文件 | 建立一个新的文件 |
“ab”(追加) | 向一个二进制文件尾添加数据 | 出错 |
“r+”(读写) | 为了读和写,打开一个文本文件 | 出错 |
“w+”(读写) | 为了读和写,建议一个新的文件 | 建立一个新的文件 |
“a+”(读写) | 打开一个文件,在文件尾进行读写 | 建立一个新的文件 |
“rb+”(读写) | 为了读和写打开一个二进制文件 | 出错 |
“wb+”(读写) | 为了读和写,新建一个新的二进制文件 | 建立一个新的文件 |
“ab+”(读写) | 打开一个二进制文件,在文件尾进行读和写 | 建立一个新的文件 |
怎么用呢?
我们先来一个简单的,打开文件和关闭文件。
int main() { FILE* pf = fopen("data.txt", "r"); if (pf == NULL) { perror("fopen");//输出错误原因,双引号里为要检查的函数 return 1; } return 0; }
注意这里打开的方式是“r”,只读已经存在的文件,在程序当前文件中没有一个叫data类型为txt的文件,程序就会报错例如:
如果存在程序就不会有任何输出。
把“r”改成“w”,以写的形式打开,这时我们再次运行就会看到一个data.txt的文件。
我们可以右击代码标签页,转到所在文件夹:
就可以看到。如果看多到txt后缀可以选择打开文件扩展名:
点击查看,选择显示,勾选文件扩展名选项。
除此之外,我们还可以将文件放在其他路径下。
FILE* pf = fopen("data.txt", "w");
这样写叫相对路径。如果你想要创建在其他路径,这就要给出绝对路径,例如我们想把文件放在桌面上,这样也是可以的,只需知道路径就可以创建到桌面上,在需要创建的文件名前加上位置信息。
例如:
FILE* pf = fopen("C:\\Users\\86150\\Desktop\\data.txt", "w");
为了防止出现转义字符,可以将每个\后加一个\,只要知道想要存放的具体位置信息,就可以将文件创建到指定位置。
在相对路径的方法中,我们还可以将文件调整到上级目录的其他文件路径下,例如:
点(.)是当前目录,(..)是上级目录,假设我们需要将文件放在程序上级目录的Debug文件下,我们就可以这样写:
FILE* pf = fopen("..\\Debug\\data.txt", "w");
关闭文件就简单了,例如:
上述的方法我们打开文件,关闭文件就只需这样写:
int main() { FILE* pf = fopen("data.txt", "w"); if (pf == NULL) { perror("fopen"); return 1; } fclose(pf); pf = NULL; return 0; }
关闭文件之后,及时将pf置为NULL。
文件的顺序读写
功能 | 函数名 | 适用于 |
字符输入函数 | fgetc | 所有输入流 |
字符输出函数 | fputc | 所有输出流 |
文本行输入函数 | fgets | 所有输入流 |
文本行输出函数 | fputs | 所有输出流 |
格式化输入函数 | fscanf | 所有输入流 |
格式化输出函数 | fprintf | 所有输出流 |
二进制输入 | fread | 文件 |
二进制输出 | fwrite | 文件 |
说到流,这里我们进行简单科普:
读写文件时我们需要:
- 打开文件
- 读写文件
- 关闭文件
例如:我们在使用scanf,和printf时,并没有什么打开键盘,打开屏幕等一系列操作,默认就直接进行操作。
这是因为C程序只要运行起来,就默认打开三个流:
- 标准输入流 stdin
- 标准输出流 stdout
- 标准错误流 stderr
所以在使用scanf,printf时就可以默认使用。 它们的类型都是FILE*类型。
什么是流?
流是指数据在计算机中的传输方式,它是数据的有序序列,可以是字节、字符、图像、音频或视频等形式输入流用于从外部读取数据到计算机内存中,而输出流则用于将计算机内存中的数据写入到外部设备或文件中。流的操作可以是顺序的,也可以是随机的。
我们继续回到文件读写函数。
fgetc是字符输入函数,一次读入一个字符到程序当中,fputc是字符输出函数,一次输出一个字符,它们都是适用于所有流的,可以是从键盘输入,也可以是从文件里读取输入。至于输出,可以输出到屏幕上,也可以输出到文件里。
字符读写
我们可以来尝试一下写文件:
int main() { FILE* pf = fopen("data.txt", "w"); if (pf == NULL) { perror("fopen"); return 1; } int i = 0; for (i = 0; i < 26; i++) { fputc('a' + i, pf); } fclose(pf); pf = NULL; return 0; }
写26个字母写到这个data.txt文件中。
我们运行一下程序,在当前程序路径下找到data.txt文件。打开来看,它确实会按照顺序写入26个字母。
如果我们想要输出到屏幕上,就只需把pf换成stdout就行了。fputc('a' + i, stdout);
接下来我们尝试一下读文件:
我们将刚刚写入的文件数据保存,然后对文件进行读取数据:
int main() { FILE* pf = fopen("data.txt", "r"); if (pf == NULL) { perror("fopen"); return 1; } int ch; ch=fgetc(pf); printf("%c\n", ch); ch=fgetc(pf);int printf("%c", ch); fclose(pf); pf = NULL; return 0; }
这里fgetc的返回值是int类型,如果遇到文件末尾或者读取失败会返回EOF。
此外fgetc函数还可以从键盘上读取,只需改错stdin即可,ch=fgetc(stdin);
读取两次,读取两个字符输出到屏幕上,正常情况下运行应该是输出ab两个字符。文件在打开时,文件指针默认指向起始位置,当读完一个字符后,文件指针就会默认指向下一个位置。
或许大家会想一次读写一个字符太麻烦了。接下来就是文本行的读写。