目录
1.什么是文件
磁盘上的文件是文件。 但是在程序设计中,我们一般谈的文件有两种:程序文件、数据文件(从文件功能的角度来分类的)。
1.1程序文件
包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境
后缀为.exe)。
1.2数据文件
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,
或者输出内容的文件。
1.3 文件名
一个文件要有一个唯一的文件标识,以便用户识别和引用。 文件名包含3部分:文件路径+文件名主干+文件后缀。
例如: c:\code\test.txt
为了方便起见,文件标识常被称为 文件名 。
2.文件的打开和关闭
2.1文件指针
缓冲文件系统中,关键的概念是 “ 文件类型指针 ” ,简称 “ 文件指针 ” 。
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是有系统 声明的,取名FILE。
例如, VS2013 编译环境提供的 stdio.h 头文件中有以下的文件类型申明:
struct _iobuf { char *_ptr; int _cnt; char *_base; int _flag; int _file; int _charbuf; int _bufsiz; char *_tmpfname; }; typedef struct _iobuf FILE;
不同的 C 编译器的 FILE 类型包含的内容不完全相同,但是大同小异。
每当打开一个文件的时候,系统会根据文件的情况自动创建一个 FILE 结构的变量,并填充其中的信息, 使用者不必关心细节。
一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。 下面我们可以创建一个FILE*的指针变量:
FILE* pf;//文件指针变量
定义 pf 是一个指向 FILE 类型数据的指针变量。可以使 pf 指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联 的文件 。
比如:
2.2文件的打开和关闭
文件在读写之前应该先打开文件,在使用结束之后应该关闭文件。在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。
ANSIC 规定使用fopen函数来打开文件,fclose来关闭文件。
//打开文件 FILE * fopen ( const char * filename, const char * mode ); //关闭文件 int fclose ( FILE * stream );
打开方式如下:文件打开方式 含义 如果指定文件不存在
“r” (只读)
为了输入数据,打开一个已经存在的文本文件
出错
“w” (只写)
为了输出数据,打开一个文本文件
建立一个新的文件
“a” (追加)
向文本文件尾添加数据
建立一个新的文件
“rb” (只读)
为了输入数据,打开一个二进制文件
出错
“wb” (只写)
为了输出数据,打开一个二进制文件
建立一个新的文件
“ab” (追加)
向一个二进制文件尾添加数据
出错
“r+” (读写)
为了读和写,打开一个文本文件
出错
“w+” (读写)
为了读和写,建立一个新的文件
建立一个新的文件
“a+” (读写)
打开一个文件,在文件尾进行读写
建立一个新的文件
“rb+” (读写)
为了读和写打开一个二进制文件
出错
“wb+” (读写)
为了读和写,新建一个新的二进制文件
建立一个新的文件
“ab+” (读写)
打开一个二进制文件,在文件尾进行读和写
建立一个新的文件
下面是一个事例代码:
#include <stdio.h> int main () { FILE * pFile; //打开文件 pFile = fopen ("myfile.txt","w"); //文件操作 if (pFile!=NULL) { fputs ("fopen example",pFile); //关闭文件 fclose (pFile); } return 0; }
3.文件的顺序读写
功能 函数 适用于
字符输入函数
fgetc
所有输入流
字符输出函数
fputc
所有输出流
文本行输入函数
fgets
所有输入流
文本行输出函数
fputs
所有输出流
格式化输入函数
fscanf
所有输入流
格式化输出函数
fprintf
所有输出流
二进制输入
fread
文件
二进制输出
fwrite
文件
下面我们看一下这些函数的示例代码:
首先看一个fputc函数:
#define _CRT_SECURE_NO_WARNINGS 1 #include<stdio.h> int main() { FILE* pf = fopen("data.txt", "w"); if (pf == NULL) { perror("fopen"); return 1; } int i = 0; for (i = 0; i < 26; i++) { fputc('a' + i, pf); } fclose(pf); pf = NULL; return 0; }
程序运行结束后,可以在当前目录下看到,26个字符成功写入文件:
我们再看fgetc函数:
(读取成功返回字符的ascii码值,读取失败或者读取结束会返回EOF)
#define _CRT_SECURE_NO_WARNINGS 1 #include<stdio.h> int main() { FILE* pf = fopen("data.txt", "r"); if (pf == NULL) { perror("fopen"); return 1; } int ch = fgetc(pf); printf("%c ", ch); ch = fgetc(pf); printf("%c ", ch); ch = fgetc(pf); printf("%c ", ch); ch = fgetc(pf); printf("%c ", ch); ch = fgetc(pf); printf("%c ", ch); ch = fgetc(pf); printf("%c ", ch); fclose(pf); pf = NULL; return 0; }
如果我们要写入一行的话,那就可以用fputs函数:
#define _CRT_SECURE_NO_WARNINGS 1 #include<stdio.h> int main() { FILE* pf = fopen("data.txt", "w"); if (pf == NULL) { perror("fopen"); return 1; } fputs("hello\n", pf); fputs("world", pf); fclose(pf); pf = NULL; return 0; }
那我们要一行一行读入的话,就要用到fgets函数:
这里需要注意:fgets函数最多只能读num-1个字符。如果还没有读到num-1个字符就遇到换行符,也会提前结束。
#define _CRT_SECURE_NO_WARNINGS 1 #include<stdio.h> int main() { FILE* pf = fopen("data.txt", "r"); if (pf == NULL) { perror("fopen"); return 1; } char arr[10] = { 0 }; fgets(arr, 10, pf); printf("%s\n", arr); fclose(pf); pf = NULL; return 0; }
通过测试,我们看到,确实只读了num-1个。
除了上面的函数外,还有格式化的输入输出函数。
下面来看:
通过对比发现,两个函数只是差一个文件指针的参数,那么我们只需要在printf的基础上稍加改进即可:
#define _CRT_SECURE_NO_WARNINGS 1 #include<stdio.h> struct s { int a; float s; }; int main() { FILE* pf = fopen("data.txt", "w"); if (pf == NULL) { perror("fopen"); return 1; } struct s s1 = { 100,3.14f }; fprintf(pf,"%d %f", s1.a, s1.s); fclose(pf); pf = NULL; return 0; }
既然可以写进去,那么是否可以读出来呢?我们来看fscanf函数:
同样的道理,我们只需在scanf的形式上稍加改进即可:
#define _CRT_SECURE_NO_WARNINGS 1 #include<stdio.h> struct s { int a; float s; }; int main() { FILE* pf = fopen("data.txt", "w"); if (pf == NULL) { perror("fopen"); return 1; } struct s s1 = { 100,3.14f }; fscanf(pf,"%d %f", &(s1.a), &(s1.s)); printf("%d %f", s1.a, s1.s); fclose(pf); pf = NULL; return 0; }
了解了上面的几个函数后,我们来看一下下面的这几组函数:
printf:向标准输出流写格式化的数据(屏幕)
scanf:从标准输入流读取格式化的数据(键盘)
fprintf:适用于所有输出流的格式化输出函数
fscanf:适用于所有输入流的格式化输入函数,可以干scanf的事
sprintf:简单来说,就是把一个格式化的数据转化成字符串
sscanf :从字符串中读取格式化的数据
下面是使用sprintf的一个实例代码:
struct S { int a; float s; char str[10]; }; int main() { char arr[30] = { 0 }; struct S s = { 100,3.14f,"hello" }; sprintf(arr,"%d %f %s\n", s.a, s.s, s.str);//把格式化的数据转换成字符串存入arr数组 printf("%s\n", arr);//打印arr数组的内容 return 0; }
在调试窗口我们可以看到,确实把一个结构体的变量转换成了字符串:
那如果我们要把刚才转换成的字符串再转换成原来的数据,就需要sscanf函数:
struct S { int a; float s; char str[10]; }; int main() { char arr[30] = { 0 }; struct S s = { 100,3.14f,"hello" }; struct S tmp = { 0 }; sprintf(arr,"%d %f %s\n", s.a, s.s, s.str); /*printf("%s\n", arr);*/ sscanf(arr, "%d %f %s\n", &(tmp.a), &(tmp.s),tmp.str); printf("%d %f %s\n", tmp.a, tmp.s, tmp.str); return 0; }
在调试窗口我们可以看到,确实把字符串转换成了格式化的数据:
我们继续来看对于二进制的读写函数:
fwrite:从ptr指向的内存块里面写count个大小为size的数据,到stream流(二进制形式)。
struct S { int a; float s; char str[10]; }; int main() { struct S s = { 99,3.14f,"hello" }; FILE* pf = fopen("data.txt", "wb"); if (pf == NULL) { perror("fopen"); return 1; } fwrite(&s,sizeof(struct S),1,pf); fclose(pf); pf = NULL; return 0; }
成功写入,因为是二进制的文件,所以有的看不懂也没有关系。
接下来,我们再把它读出来:
fread函数:从stream流里面读count个大小为size的数据,放到ptr指向的内存块。返回值是实际读取到的数据的个数。
struct S { int a; float s; char str[10]; }; int main() { struct S s = { 99,3.14f,"hello" }; FILE* pf = fopen("data.txt", "rb"); if (pf == NULL) { perror("fopen"); return 1; } fread(&s,sizeof(struct S),1,pf); printf("%d %f %s\n", s.a, s.s, s.str); fclose(pf); pf = NULL; return 0; }
虽然之前写入的是二进制文件,我们看不明白,但是通过fread函数就可以读出来 。
4.文件的随机读写
4.1fseek函数
根据文件指针的位置和偏移量来定位文件指针。
下面是第三个参数的选择:(决定从哪里开始偏移)
下面是事例代码,我们先创建一个文本文件,里面的内容是:abcdefghi(同下所有事例代码)
int main() { FILE* pf = fopen("data.txt", "r"); if (pf == NULL) { perror(fopen); return 1; } //定位文件指针 fseek(pf,5, SEEK_SET);//从文件起始位置偏移 int ch = fgetc(pf); printf("%c\n", ch); fclose(pf); pf = NULL; }
从文件起始位置开始,偏移量为5,读出一个字符。
4.2 ftell函数
返回文件指针相对于起始位置的偏移量 。
如果我们现在不知道文件指针指向哪里,那么就可以用ftell函数来返回相对起始地址的偏移量。
int main() { FILE* pf = fopen("data.txt", "r"); if (pf == NULL) { perror(fopen); return 1; } //定位文件指针 int ch = fgetc(pf); printf("%c\n", ch); ch = fgetc(pf); printf("%c\n", ch); ch = fgetc(pf); printf("%c\n", ch); int pos=ftell(pf); printf("pos=%d\n", pos); fclose(pf); pf = NULL; }
4.3 rewind函数
如果我们在读的过程中想让文件指针回到起始位置,就可以用rewind函数:
int main() { FILE* pf = fopen("data.txt", "r"); if (pf == NULL) { perror(fopen); return 1; } //定位文件指针 int ch = fgetc(pf);//a printf("%c\n", ch); ch = fgetc(pf);//b printf("%c\n", ch); ch = fgetc(pf);//c printf("%c\n", ch); rewind(pf); ch = fgetc(pf);//a printf("%c\n", ch); ch = fgetc(pf);//b printf("%c\n", ch); ch = fgetc(pf);//c printf("%c\n", ch); fclose(pf); pf = NULL; }
5. 文本文件和二进制文件
根据数据的组织形式,数据文件被称为 文本文件 或者 二进制文件 。
数据在内存中以二进制的形式存储,如果不加转换的输出到外存,就是 二进制文件 。
如果要求在外存上以 ASCII 码的形式存储,则需要在存储前转换。以 ASCII 字符的形式存储的文件就是 文 本文件 。
一个数据在内存中是怎么存储的呢?
字符一律以 ASCII 形式存储,数值型数据既可以用 ASCII 形式存储,也可以使用二进制形式存储。如有整数10000 ,如果以 ASCII 码的形式输出到磁盘,则磁盘中占用 5 个字节(每个字符一个字节),而 二进制形式输出,则在磁盘上只占4 个字节( VS2019 测试)。
事例代码:
#include <stdio.h> int main() { int a = 10000; FILE* pf = fopen("test.txt", "wb"); fwrite(&a, 4, 1, pf);//二进制的形式写到文件中 fclose(pf); pf = NULL; return 0; }
6.文件读取结束的判定
6.1 feof函数
牢记:在文件读取过程中,不能用feof函数的返回值直接用来判断文件的是否结束。
而是应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束。
1. 文本文件读取是否结束,判断返回值是否为 EOF ( fgetc ),或者 NULL ( fgets )
例如:
fgetc 判断是否为 EOF .
fgets 判断返回值是否为 NULL .
2. 二进制文件的读取结束判断,判断返回值是否小于实际要读的个数。
例如:
fread 判断返回值是否小于实际要读的个数。