什么是文件
磁盘的文件是文件
但在程序设计中,我们一般读的文件分为两种:程序文件、数据文件。程序文件是可以操作数据文件的。
程序文件是操作我们的数据文件的。我们可以读那个文件、可以写那个文件、可以去编译那个文件,即可以对那个文件进行相关的操作、编辑等等,这些文件呢就被称为数据文件,为程序文件是可以操作我们的数据文件的。
程序文件
包括源程序文件(后缀为.c)、目标文件(windows环境后缀为.obj)、可执行程序(windows环境后缀为.exe)。
数据文件
文件的内容不一定要程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件。
注意:本文讨论的不是程序文件,而是我们可以被操作的数据文件。(如何把信息放到数据文件中去,如何再从数据文件中把信息拿出来。)
在之前我们所处理数据的输入输出都是以终端为对象的,即从终端的键盘输入数据,运行结果显示到显示器上。其实我们有时候会把信息输出到磁盘上,当需要的时候再从磁盘上把信息读取到内存中使用,这里处理的就是磁盘上文件。
文件名
一个文件要有一个唯一的文件标识。
文件名包括3部分:文件路径+文件名主干+文件后缀
例如:c:\code\test.txt即test为文件名主干、.txt为文件后缀、前面那部分就是文件路径。
为了方便起见,文件标识常被称为文件名。
文件类型
根据数据的组织形式,数据文件被称为文本文件(文本文件里面放到就是ASICC码代表的字符,我们在看的时候就是一堆乱码)或者二进制文件(放的是二进制形式的文件,即数据在内存中是怎么存的,放到文件中就怎么存,不加任何的转换)。
数据在内存中以二进制的形式存储,如果不加转换,把内存中的数据直接输出到外存中去(即把内存中的数据直接输出到文件中去,不加任何转换放到硬盘,放到外存上去),就是二进制文件。
如果要求在外存上以ASCII码的形式存储,则需要在存储前转换,(也就是说把内存中的数据以ASCII码值的形式存放到外存中去,即放到文件中去)以ASICC字符的形式存储的文件就是文本文件。
一个数据在内存中是怎么存储的呢?
字符一律以ASCII形式存储,数值型数据可以用ASCII形式存储,也可以使用二进制的形式存储。
如有整数10000,如果以ASCII码的形式输出到磁盘,则硬盘中占用5个字节(每个字符一个字节),而二进制形式输出,则磁盘中占用5个字节(每个字符都是一个字节),而二进制形式输出,则在磁盘上只占4个字节。
下面请看测试代码:
#include<stdio.h> int main() { int a = 10000; FILE* pf = fopen("test.txt", 'wb');//w是write的意思,而b是以二进制的形式去写这个文件 fwrite(&a, 4, 1, pf);//以二进制的形式写到文件中 //&a即数据来自于a的地址处 //4即4个字节 //1即写一个这样的数据 //pf即放到pf维护的这个文件中去 fclose(pf);//关闭文件 pf = NULL; return 0; }
注意打开时要以二进制的形式打开,即:
在test.txt文件中我们可以看到是10000是以16进制的形式来展示的,同时为小端存储,所以在文件中是倒着存放的,其实真正在内存中是以二进制的形式来展示的。(注意是以二进制来进行存放的,但是要通过屏幕给我们展示出来就是以十六进制来进行展示的,即展示出来就转换成了十六进制。)
而十六进制00 00 27 10转换为十进制之后就是10000。
10000存到文件中去,即文本文件,存成文本的形式就是这样的:
文件缓冲区
ANSIC标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地为内存中为程序中的每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据搜索你感到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。
文件指针
缓冲文件系统中,关键的概念是“文件类型指针”,简称“文件指针”。
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置,文件创建时间,文件大小等等)。这些信息是保存在一个结构体变量中。该结构体类型是由系统声明的,取名FILE。
当我们打开一个文件,写文件或者读文件的时候,其实任何一个文件,都会有这样一个文件信息区和一个文件对应起来。
不同的C编译器的FILE类型包含的内容不完全明白,但是大同小异。
每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,使用者不必关心细节。
一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。
下面我们可以创建一个FILE*的指针变量:
FILE* pf;//文件指针变量
定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量能够找到与它关联的文件。
比如:
当文件在被读取写入的时候,文件的大小等等都会发生变化,甚至我们对这个文件进行重命名,而一旦发生变化,文件信息区里面的信息都会跟着发生变化,因为这个文件信息区是来标识、维护该文件的,这些东西会随着操作文件而会发生变化。
文件指针就是FILE这样一个结构的指针。什么意思呢?就是我们每次打开或者维护文件时都会根据这个文件的相关信息创建一个和它对应的文件信息区,这个文件信息区对应的类型就是FILE类型,当我们区维护的时候还需要去维护这个文件信息区。怎么维护呢?我们把这个文件信息区的地址拿出来并存起来,即存了一个FILE类型的这样一个地址,这个时候就需要FILE的一个结构指针,这个指针就被称为文件指针。
**通过对以上内容的学习之后我们就可以正式的学习文件,学习文件的相关操作了。感谢各位!!!**😊