详解文件操作
一、什么是文件?
其实很简单:硬盘上的文件是文件。哈哈哈是不是觉得很奇怪,为啥这么说。在程序设计中,我们一般谈的文件有两种:一种是程序文件,另一种是数据文件(从文件功能的角度来分类)
1、程序文件
程序文件包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)
2、数据文件
文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者是输出内容的文件。
3、文件名
一个文件要有一个唯一的文件标识,以便用户识别和引用。文件名包含三个部分:
文件路径+文件名主干+文件后缀
二、二进制文件和文本文件
根据数据的组织形式,数据文件被称为文本文件和二进制文件。
数据在内存中是以二进制的形式储存,如果不加转换的输出到外存的文件中就叫二进制文件。如果要求在外存上以ASCLL码的形式储存,则需要在储存前转换。所以说以ASCLL字符形式储存的文件就是文本文件。字符在文件中储存一律是以ASCLL形式储存,数据型数据既可以用ASCLL形式储存也可以用二进制形式储存。
三、文件的打开和关闭
1、流
我们程序的数据需要输出到各种外部设备,也需要从外部设备获取数据,不同的外部设备的输出输入操作各不相同,为了方便程序员对各种设备进行方便操作,我们抽象出了流的概念。
C语言针对文件、画面、键盘等的数据输入输出操作都是通过流操作的。一般情况下,我们要想向流里面写数据,又或者从流中读取数据,都要打开流然后再操作。
2、标准流
C语言程序在启动的时候默认打开了三个流:
stdin – 标准输入流,在大多数的环境中从键盘输入,scanf函数就是从标准输入流中读取数据。stdout–标准输出流,大多数的环境中输出至显示器界面,printf函数就是将信息输出至标准输出流中。stderr–标准错误流,大多数环境中输出到显示器界面。
这是默认打开了三个流,我们在使用scanf、printf这一些函数就可以直接进行输入输出的操作了。这三个流的类型是:FILE*,通常称为文件指针。
3、文件指针
每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是由系统声明,取名为FILE。不同的编译器的FILE类型包含的内容不完全相同,但是大同小异。每当打开一个文件的时候,系统会根据文件的情况自动创建以一个FILE结构变量,并且填充其中的信息。
下面我们可以创建一个FILE*的指针变量:
FILE* pf;//文件指针变量
定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某一个文件的文件信息区(是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说,通过文件指针变量就能够间接找到于它关联的文件。
4、文件的打开和关闭
文件在读取前应该先打开文件,在使用结束之后应该关闭文件。
在编写程序的时候,在打开文件的同时,都会返回一个FILE*的指针变量指向该文件,也相当于建立了指针和文件的关系。ANSI C规定使用fopen函数来打开文件,fclose关闭文件
//打开文件
FILE * fopen(const char * filename,const char * mode);
//关闭文件
int fcolse(FILE * stream);
mode表示文件的打开模式,下面都是文件的打开模式:
文件使用方法含义如果指定文件不存在”r“(只读)为了输入数据,打开一个已经存在的文本文件出错”w“(只写)为了输出数据,打开一个文本文件建立一个新的文件”a“(追加)向文本文件尾部添加数据建立一个新的文件”rb“(只读)为了输入数据,打开一个二进制文件出错”wb”(只写)为了输出数据,打开一个二进制文件建立一个新的文件“ab”(追加)向一个二进制文件尾部添加数据建立一个新的文件“r+”(读写)为了读和写,打开一个文本文件出错“w+”(读写)为了读和写,建立一个新的文件建立一个新的文件“a+”(读写)打开一个文件,在文件尾部进行读写建立一个新的文件“rb+”(读写)为了读和写打开一个二进制文件出错“wb+”(读写)为了读和写,建立一个新的二进制文件建立一个新的文件“ab+”(读写)打开一个二进制文件,在文件尾部进行读和写建立一个新的文件下面文明可以举一个代码实例:
#include
{
FILE* PFile;
//打开文件
pFile = fopen("myfile.txt","w");
//文件操作
if(pFILE != NULL )
{
fputs("fopen example",pFile);
//关闭文件
fclose (pFile);
}
return 0;
}
四、文件的顺序读写
1、顺序读写函数介绍
函数名功能适用于fgetc字符输入函数所有输入流fputc字符输出函数所有输出流fgets文本行输入函数所有输入流fputs文本行输出函数所有输出流fscanf格式化输入函数所有输入流fprintf格式话输出函数所有输出流fread二进制输入文件输入流fwrite二进制输出文件输出流上述表格适用于所有输入流一般指适用于标准输入流和其他输入流;所有输出流一般适用于标准输出流和其他输出流。
五、文件的随机读写
1、fseek
根据文件指针的位置和偏移量来定位文件指针。
int fseek(FILE* stream,long int offset,int origin);
我们可以举一个例子:
#include
int main()
{
FILE* pFile;
pFile = fopen("example.txt","wb");
fputs("what can i say?",pFile);
fseek(pFile,9,SEEK_SET);
fputs("sam",pFile);
fclose(pFile)
return 0;
}
2、ftell
返回文件指针相对于起始位置的偏移量
long int ftell(FILE *stream);
我们来举一个例子:
#include
int main()
{
FILE* pFile;
long size;
pFile = fopen("myfile.txt","rb");
if(pFile == NULL)
perror("Error opening file");
else
{
fseek(pFile,0,SEEK_END);
size = ftell(pFile);
fclose(pFile);
printf("Size of my file.txt:%ld bytes.\n",size);
}
return 0;
}
3、rewind
让文件指针的位置回到文件的起始位置
void rewind(FILE* stream);
举个例子:
#include
int mian()
{
int n;
FILE* pFile;
char buffer[30];
pFile = fopen("myfile.txt","w+");
for(n = 'A';n <= 'Z'; n++)
fputc(n,pFile);
rewind(pFile);
fread(buffer,1,26,pFile);
fclose(pFile);
buffer[26] = '\0';
printf(buffer);
return 0;
}
六、文件读取结束的判定
被错误使用的feof
在文件读取过程中,不能用feof函数的返回值直接来判断文件是否结束。
feof的作用是:当文件读取结束的时候,判断是读取结束的原因是否是:遇到文件尾结束。
(1)文本文件读取是否结束,判断返回值是否为EOF或者NULL
fgetc判断是否为EOFfgets判断返回值是否为NULL
(2)二进制文件的读取结束判断,判断返回值是否小于实际要读的个数
frad判断返回值是否小于实际要读的个数
七、文件缓冲区
ANSIC标准采用“缓冲文件系统”处理的数据文件,所谓缓冲文件系统是指系统自动的在内存中为程序中每个正在使用的文件开辟一块“文件缓冲区”。从内存想磁盘输入数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读取数据,则从磁盘文件中读取数据输入到内存缓冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区。缓冲区的大小根据C编译系统决定。因为有缓冲区的存在C语言在操作文件的时候,需要做刷新缓冲区或者在文件操作结束的时候关闭文件。如果不这样做,肯能导致读写文件的went。