您现在的位置是：首页 > 后端

当前栏目

“超级全的”C语言文件操作详解

C语言文件详解操作超级

2023-09-11 14:16:58 时间

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档

文章目录

前言
一、pandas是什么？
二、使用步骤
- 1.引入库
- 2.读入数据
总结

前言

提示：这里可以添加本文要记录的大概内容：

为什么要使用文件呢？答案很简单，文件可以在程序结束也能将相应的内容进行查看，比如我们在写通讯录的时候发现每次程序结束后那些联系人就没有了，下一次打开程序还是需要重新录入信息，如果有了文件，我们直接将信息保存到文件中，下一次打开文件里面还有之前录入的信息，我们在想既然是通讯录就应该把信息都记录下来，只有我们自己选择删除数据的时候，数据才不复存在。这就涉及到了数据持久化的问题，我们一般数据持久化的方法有：把数据存放在磁盘文件，存放到数据库等方式。使用文件我们可以将数据直接存放在电脑的硬盘上，这样就做到了数据的持久化。

提示：以下是本篇文章正文内容，下面案例可供参考

一、什么是文件？

磁盘上的文件就是文件。

在程序设计中，我们所谈的文件有两种：第一种是程序文件，第二种是数据文件。这是从文件的功能的角度去分类的。

二、文件介绍

1.程序文件

包括源程序文件（后缀为.c），目标文件（windows环境后缀为.obj），可执行程序（windows环境下后缀为.exe）

2.数据文件

文件的内容不一定是程序，而是在程序运行时读写的数据，比如程序运行需要从中读取数据的文件，或者输出内容的文件。

1.文件名

一个文件要有一个唯一的文件标识，以便用户识别和引用。文件名包含三部分：文件路径+文件名主干+文件后缀

如： c:\code\test.txt

为了方便起见，文件标识常被称为文件名。

2.文件的打开和关闭

2.1 文件指针

缓冲文件系统中，关键的概念是文件类型指针，简称文件指针。每个被使用的文件都在内存中开辟了一个相应的文件信息区，用来存放文件的相关信息（如文件的名字，文件状态以及文件当前的位置等）。这些信息是保存在一个结构体变量中的，该结构体类型是有系统声明的，取名为FILE。

例如，VS2013编译环境提供的 stdio.h 头文件中有以下的文件类型申明：

struct _iobuf {
char *_ptr;
int _cnt;
char *_base;
int _flag;
int _file;
int _charbuf;
int _bufsiz;
char *_tmpfname;
};
typedef struct _iobuf FILE;
FILE* pf;//文件指针变量

不同的C编译器的FILE类型包含的内容不完全相同，但是大同小异。
每当打开一个文件的时候，系统会根据文件的情况自动创建一个FILE结构的变量，并填充其中的信息，
使用者不必关心细节。一般都是通过一个FILE的指针来维护这个FILE结构的变量，这样使用起来更加方便。下面我们可以创建一个FILE*的指针变量

FILE*pf； //文件指针变量

定义pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区（是一个结构体变量）。通过该文件信息区中的信息就能够访问该文件。也就是说，通过文件指针变量能够找到与它关联的文件。

2.2 文件的打开和关闭

文件在读写之前应该先打开文件，在使用结束之后应该关闭文件。在编写程序的时候，在打开文件的同时，都会返回一个FILE*的指针变量指向该文件，也相当于建立了指针和文件的关系。ANSIC 规定使用fopen函数来打开文件，fclose来关闭文件。

//打开文件
FILE*pf = fopen("c:\cod\test.txt","w");

//关闭文件
fclose(pf);
pf = NULL;

文件使用方式含义如果指定文件不存在

"r"(只读）为了输入数据，打开一个已经存在的文本文件出错

"w"(只写）为了输出数据，打开一个文本文件建立一个新的文件夹

"a"(追加) 向文本文件尾添加数据建立一个新的文件夹

"rb"(只读) 为了输入数据打开一个二进制文件出错

"wb"(只写) 为了输出数据，打开一个二进制文件建立一个新的文件

"ab"(追加）向一个二进制文件尾添加数据出错

"r+"(读写) 为了读和写，打开一个文本文件出错

“w+”(读写) 为了读和写，建立一个新的文件建立一个新的文件

“a+” （读写）打开一个文件，在文件尾进行读写建立一个新的文件

“rb+”（读写）为了读和写打开一个二进制文件出错

“wb+” （读写）为了读和写，新建一个新的二进制文件建立一个新的文件

“ab+” （读写）打开一个二进制文件，在文件尾进行读和写建立一个新的文件

2.3 文件的顺序读写

功能	函数名	适用于
字符输入函数	fgetc	所有输入流
字符输出函数	fputc	所有输出流
文本行输入函数	fgets	所有输入流
文本行输出函数	fputs	所有输出流
格式化输入函数	fscanf	所有输入流
格式化输出函数	fprintf	所有输出流
二进制输入	fread	文件
二进制输出	fwrite	文件

以下是各函数的使用样例：

第一个fputc fgetc函数

先看函数的使用原理：

我们可以看到fputc的意思是在FILE*stream中写入一个int c，那么为什么会是int呢我们写入的明明是字符才对，看到int c的解释后我们发现这里其实是字符的ascll值。而fgetc则不一样，只需要从FILE*stream读取一个字符即可，至于是哪个字符则需要看文件指针指向哪个字符。

#include <stdio.h>

int main()
{
	FILE* pf = fopen("test.txt", "w");
	if (pf == NULL)
	{
		perror("fopen:");
		return 1;
	}
	int i = 0;
	for (i = 0; i < 26; i++)
	{
		fputc('a'+i, pf);
	}

	//关闭文件
	fclose(pf);
	pf = NULL;
	return 0;
}

以下是运行结果：

我们可以发现fputc函数是将一个一个字符写入到文件中，当你想将多个字符写入的时候可以用循环的方式，在这里说一下，有些人打开文件的时候写的test.txt,然后去相应的目录下寻找文件的时候发现并没有这个文件，而只有test文件，其实这个test文件就是test.txt文件，想要看到每个文件的后缀只需要打开在查看中勾选文件后缀名这个选项，如下图所示：

接下来我们演示fgetc函数：

int main()
{
	FILE* pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		perror("fopen:");
		return 1;
	}
	/*int ch = fgetc(pf);
	printf("%c ", ch);
	ch = fgetc(pf);
	printf("%c ", ch);
	ch = fgetc(pf);
	printf("%c ", ch);*/
	int i = 0;
	for (i = 0; i < 26; i++)
	{
		int ch = fgetc(pf);
		printf("%c", ch);
	}
	//关闭文件
	fclose(pf);
	pf = NULL;
	return 0;
}

我们用fgetc获取文件夹里的字符的时候一定要将打开文件的方式改为只读"r"，在循环访问文件夹里的每一个字符的时候我们只需要重复获取字符和打印的操作就行，原因是文件指针在访问一个字符后就会自动跳到跳到下一个字符，所以每次打印的字符都不一样。

第二个fgets和fputs

先看函数的使用原理：

我们可以看到fputs和fputc的区别在于fputs是在FILE*stream中写入一个const char*string的字符串。

int main()
{
	FILE* pf = fopen("test.txt", "w");
	char str[100] = { 0 };
	if (pf == NULL)
	{
		perror("fopen:");
		return 1;
	}
	fputs("hello world", pf);
	
	//关闭文件
	fclose(pf);
	pf = NULL;
	return 0;
}

而fgets函数中有三个参数，我们先来看一下值的详细介绍：

string是存储读到的字符串数据，n是你要读字符串中多少个字符，stream就是那个文件。

int main()
{
	FILE* pf = fopen("test.txt", "r");
	char str[100] = "#####";
	if (pf == NULL)
	{
		perror("fopen:");
		return 1;
	}
	fgets(str,10,pf);
	printf("%s", str);
	fgets(str, 20, pf);
	printf("%s", str);
	//关闭文件
	fclose(pf);
	pf = NULL;
	return 0;
}

我们可以发现fgets在读取的时候连换行符\n都可以读取，也就是说在打印的时候我们不需要加换行符，文件里的字符串是什么样打印出来就是什么样。当然如果我们想要打印hello写为fgets(str,5,pf)的时候发现打印出来的是hell，这是因为fgets会自动在最后要打印的字符上加上\0，如图所示：

所以当我们得知字符串hello只有5个字符要打印hello的时候应该将fgets中的n调整为6这样就可以打印出hello了。

第三个fprintf和fscanf

前面说过fscanf和fprintf是格式化输入输出函数，那么该怎么使用呢？

首先先用fprintf写文件，与printf不同的是fprintf前面需要加文件流：

struct s
{
	char name[20];
	int age;
	float score;
};
int main()
{
	FILE* pf = fopen("test.txt", "w");
	struct s a = { "张三",18,90.5f };
	char str[100] = "#####";
	if (pf == NULL)
	{
		perror("fopen:");
		return 1;
	}
	fprintf(pf, "%s %d %f", a.name, a.age, a.score);
	//关闭文件
	fclose(pf);
	pf = NULL;
	return 0;
}

如图所示，我们的目的是将一个结构体变量写入文件夹，所以我们创建了一个名为s的结构体，然后我们创建了结构体变量a，里面放着张三的信息，现在要将张三的信息写入文件夹，我们只需要按格式将结构体变量a中的name，age，score分别传给pf。

接下来我们用fscanf来读刚才的文件

struct s
{
	char name[20];
	int age;
	float score;
};
int main()
{
	FILE* pf = fopen("test.txt", "r");
	struct s a = { 0 };
	if (pf == NULL)
	{
		perror("fopen:");
		return 1;
	}
	fscanf(pf, "%s %d %f", a.name, &(a.age), &(a.score));
	printf("%s %d %f", a.name, a.age, a.score);
	//关闭文件
	fclose(pf);
	pf = NULL;
	return 0;
}

如图所示，我们要将文件中的结构体信息读到a中去，我们只需要在pf中，以相同的格式将数组name写到a中，而age是个变量所以需要取地址，同理score也一样，此处与scanf用法相同。

第四个fread和fwrite

我们先来看fwrite的参数，第一个const void*buff是你要写入的数据的地址，void表示可以是任意类型，size_t size表示一个这个数据的大小，通常我们用sizeof来求，size_t count表示你一共要写几个这样的数据，最后就是要写入的文件了。

struct s
{
	char name[20];
	int age;
	float score;
};
int main()
{
	FILE* pf = fopen("test.txt", "wb");
	struct s a = { "张三",18,90.5f};
	if (pf == NULL)
	{
		perror("fopen:");
		return 1;
	}
	fwrite(&a, sizeof(a), 1, pf);
	//关闭文件
	fclose(pf);
	pf = NULL;
	return 0;
}

当然在这里我们需要注意的是二进制写的时候需要用wb，二进制读的时候为rb。在下面我们可以看到确实写入二进制文件了：

那么该如何读一个二进制文件呢？我们先看fread的参数介绍：

我们发现除了buffer不同其他意思都和fwrite一样，区别在于fread是将pf中的数据放到buffer中。

struct s
{
	char name[20];
	int age;
	float score;
};
int main()
{
	FILE* pf = fopen("test.txt", "rb");
	struct s a = { 0 };
	if (pf == NULL)
	{
		perror("fopen:");
		return 1;
	}
	fread(&a, sizeof(a), 1, pf);
	printf("%s %d %f", a.name, a.age, a.score);
	//关闭文件
	fclose(pf);
	pf = NULL;
	return 0;
}

这样我们就将一个二进制文件读出来了。

最后一组：sscanf 和 sprintf函数

sprintf函数是将格式化的数据写入字符串中，buffer是存放这个数据的地址，format是什么格式

struct s
{
	char name[20];
	int age;
	float score;
};
int main()
{
	struct s a = { "张三",19,90.5f };
	char str[100] = { 0 };
	sprintf(str, "%s %d %f", a.name, a.age, a.score);
	printf("%s\n", str);
	return 0;
}

如图我们要将结构体数据改为字符串并且打印出来，str作为存储数据的地址。

接下来再看sscanf函数

我们发现sscanf和sprintf参数的区别在于，sscanf是将buffer字符串中的数据按照格式输出到相应的类型中，我们还是拿刚才那个结构体类型举例，当我用sprintf函数将结构体数据写入字符串中后，我又想将我写入字符串的结构体数据拿出来在结构体中使用，这样就需要用sscanf将buffer中的数据按格式写入结构体中；

struct s
{
	char name[20];
	int age;
	float score;
};
int main()
{
	struct s a = { "张三",19,90.5f };
	struct s tmp = { 0 };
	struct s d = { 0 };
	char str[100] = { 0 };
	sprintf(str, "%s %d %f", a.name, a.age, a.score);
	printf("%s\n", str);
	sscanf(str, "%s %d %f", tmp.name, &(tmp.age), &(tmp.score));
	printf("%s %d %f\n",tmp.name ,tmp.age,tmp.score);
	return 0;
}

如图所示我们成功将字符串中的数据重新写入结构体tmp中，在这里说明一下scanf函数中除了数组不需要取地址，其他变量使用都需要取地址，当然要是数组需要一个一个录入的时候也需要取地址。

在这里我们总结一下：

scanf:按照一定的格式从键盘输入数据

printf:按照一定的格式把数据打印到屏幕上

//适用于标准输入/输出流的格式化的输入/输出语句

fscanf:按照一定的格式从输入流（文件/stdin）输入数据

fprintf:按照一定的格式向输出流 (文件/stdout)输出数据

//适用于所有的输入/输出流的格式化输入/输出语句

sscanf:从字符串中按照一定的格式读取出格式化的数据

sprintf:把格式化的数据按照一定的格式转化成字符串

//适用于所有的输入/输出流的格式化输入/输出语句

2.4 文件的随机读写

根据文件指针的位置和偏移量来定位文件指针
fseek函数可以让修改文件指针位置使之随机读写

我们可以看到fseek函数一共有三个参数，FILE*stream是文件流，long offset是偏移量，int origin是指针位置从哪开始，这里分三个位置，第一个位置：SEEK_SET文件的起始位置第二个位置：SEEK_END文件的最后一个元素的后面（比如abcd中是第一个，最后一个是d，d后面是空格）第三个位置：SEEK_CUR当前文件的指针位置，下面我们来演示一下。

int main()
{
	FILE* pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		perror("fopen:");
		return 1;
	}
	//int ch = fgetc(pf);
	fseek(pf, 3, SEEK_SET);
	int ch = fgetc(pf);
	printf("%c\n", ch);
	return 0;
}

从a开始向后偏移三个为d

int main()
{
	FILE* pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		perror("fopen:");
		return 1;
	}
	fseek(pf, -3, SEEK_END);
	int ch = fgetc(pf);
	printf("%c\n", ch);

	fclose(pf);
	pf = NULL;
	return 0;
}

从前往后偏移量为正，从后往前偏移量为负。此时从空格开始往前偏移三个指向e

int main()
{
	FILE* pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		perror("fopen:");
		return 1;
	}
	int ch = fgetc(pf);
	printf("%c\n", ch);
	fseek(pf, 3, SEEK_CUR);
	ch = fgetc(pf);
	printf("%c\n", ch);
	fclose(pf);
	pf = NULL;
	return 0;
}

先读完一个字符指针指向b然后往后偏移三个指向e

ftell函数是记录当前指针偏移量是几

int main()
{
	FILE* pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		perror("fopen:");
		return 1;
	}
	int ch = fgetc(pf);
	printf("%c\n", ch);
	fseek(pf, 3, SEEK_CUR);
	ch = fgetc(pf);
	printf("%c\n", ch);
	int ret = ftell(pf);
	printf("%d\n", ret);
	fclose(pf);
	pf = NULL;
	return 0;
}

当前指针指向f因为上一次指针指向e打印后自动往后跳一个字符从0到f一共是5所一偏移量为5

rewind函数是让指针回到起始位置

int main()
{
	FILE* pf = fopen("test.txt", "r");
	if (pf == NULL)
	{
		perror("fopen:");
		return 1;
	}
	int ch = fgetc(pf);
	printf("%c\n", ch);
	fseek(pf, 3, SEEK_CUR);
	ch = fgetc(pf);
	printf("%c\n", ch);
	int ret = ftell(pf);
	printf("%d\n", ret);
	rewind(pf);
	ch = fgetc(pf);
	printf("%c\n", ch);
	fclose(pf);
	pf = NULL;
	return 0;
}

从图上可以看出当我使用rewind后指针又指向了a回到了起始位置

2.5 文本文件和二进制文件

根据数据的组织形式，数据文件被称为文本文件或者二进制文件。
数据在内存中以二进制的形式存储，如果不加转换的输出到外存，就是二进制文件。
如果要求在外存上以ASCII码的形式存储，则需要在存储前转换。以ASCII字符的形式存储的文件就是文本文件。一个数据在内存中是怎么存储的呢？
字符一律以ASCII形式存储，数值型数据既可以用ASCII形式存储，也可以使用二进制形式存储。
如有整数10000，如果以ASCII码的形式输出到磁盘，则磁盘中占用5个字节（每个字符一个字节），而二进制形式输出，则在磁盘上只占4个字节（VS2013测试）。

#include <stdio.h>
int main()
{
int a = 10000;
FILE* pf = fopen("test.txt", "wb");
fwrite(&a, 4, 1, pf);//二进制的形式写到文件中
fclose(pf);
pf = NULL;
return 0;
}

我们可以发现打开是我们看不懂的字符，我们将test文件添加到vs中去以二进制的形式打开

打开后存储的正好是10000的16进制补码，10在前是因为vs用的是小端存储。

2.6 文件读取结束的判定

在文件读取过程中，不可以用feof的函数返回值直接判断文件是否结束，而是应用于当文件读取结束的时候，判断是读取失败结束还是遇到文件尾而结束。

fgetc:如果读取正常，会返回读取到的字符的ascll值。如果读取失败，返回EOF

fgets：如果读取正常，返回的是存放读取到的数据的地址。如果读取失败，返回NULL

fscanf:如果读取正常，返回的是格式串中指定的数据个数。如果读取失败，返回的是小于格式串中指定的数据个数。

正确的判断方法如下:

#include <stdio.h>
#include <stdlib.h>
int main(void)
{
int c; // 注意：int，非char，要求处理EOF
FILE* fp = fopen("test.txt", "r");
if(!fp) {
perror("File opening failed");
return EXIT_FAILURE;
}
//fgetc 当读取失败的时候或者遇到文件结束的时候，都会返回EOF
while ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环
{
putchar(c);
}
//判断是什么原因结束的
if (ferror(fp))
puts("I/O error when reading");
else if (feof(fp))
puts("End of file reached successfully");
fclose(fp);
}

二进制文件的判断：

#include <stdio.h>
enum { SIZE = 5 };
int main(void)
{
double a[SIZE] = {1.,2.,3.,4.,5.};
FILE *fp = fopen("test.bin", "wb"); // 必须用二进制模式
fwrite(a, sizeof *a, SIZE, fp); // 写 double 的数组
fclose(fp);
double b[SIZE];
fp = fopen("test.bin","rb");
size_t ret_code = fread(b, sizeof *b, SIZE, fp); // 读 double 的数组
if(ret_code == SIZE) {
puts("Array read successfully, contents: ");
for(int n = 0; n < SIZE; ++n) printf("%f ", b[n]);
putchar('\n');
} else { // error handling
if (feof(fp))
printf("Error reading test.bin: unexpected end of file\n");
else if (ferror(fp)) {
perror("Error reading test.bin");
}
}
fclose(fp);
}

2.7 文件缓冲区

ANSIC 标准采用“缓冲文件系统”处理的数据文件的，所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区，装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据，则从磁盘文件中读取数据输入到内存缓冲区（充满缓冲区），然后再从缓冲区逐个地将数据送到程序数据区（程序变量等）。缓冲区的大小根据C编译系统决定的。

测试是否有文件缓冲区：

#include <stdio.h>
#include <windows.h>
int main()
{
FILE*pf = fopen("test.txt", "w");
fputs("abcdef", pf);//先将代码放在输出缓冲区
printf("睡眠10秒-已经写数据了，打开test.txt文件，发现文件没有内容\n");
Sleep(10000);
printf("刷新缓冲区\n");
fflush(pf);//刷新缓冲区时，才将输出缓冲区的数据写到文件（磁盘）
//注：fflush 在高版本的VS上不能使用了
printf("再睡眠10秒-此时，再次打开test.txt文件，文件有内容了\n");
Sleep(10000);
fclose(pf);
//注：fclose在关闭文件的时候，也会刷新缓冲区
pf = NULL;
return 0;
}

以下是文件版本通讯录

与之前讲解动态版本通讯录一样，我只介绍文件版本与之前不同的地方，相同的就不在展示。首先我们想的是将通讯录关闭后通讯录里的所有数据都可以写入文件，所以这一步的改造应该是在玩家要退出程序的时候进行的，既然保存了通讯录那么我们在打开通讯录的时候也应该能显示之前存入的通讯录信息，所以这一步骤应该是在通讯录初始化的时候进行改造的。

如图所示，我们先将通讯录里的数据在退出程序的时候写入通讯录：

在写入信息的时候我们用的二进制写入，i是第一个到最后一个人的数，ps->data是被写入的数据，通过+i可以让每次写入的信息都是其录入的信息，如果不加i则每次都保存的是第一个人的信息。接着我们在初始化通讯录的时候加载之前的信息，如图所示:

load函数就是加载通讯录的函数，我们以二进制读的方式打开文件，上面讲过在使用fread函数的时候是将读到的数据用相应的类型接收，我们在文件读的是结构体，那么我们就用一个结构体变量去接收读到的数据，但是这样才能读一个，我们怎么才能将文件夹里的结构体数据都读到呢？要知道我们重新打开程序的时候各指针已经清0了，所以这时候我们想到了用fread返回值的方式来控制每次读的数据，我们说过当fread读数据没读到的时候会返回一个小于要读几个这样数据的数，现在我们每次读的是一个数据，那么如果没读到就返回0，返回0也就退出循环不再继续读入，读一个数据成功后就会读下一个数据，那么进入循环后我们要将读到的数据放入通讯录中来显示，而data是放数据的地方，我们将tmp放入data中，而想要每次放入的数据都不重复就需要用一个值来记录当前放入数据的位置，所以我们在data[ps->sz]中用sz控制其位置，每次放完一个数据让sz++保证下一次放入的时候不会覆盖到已经放入的数据。

这样我们文件版本的通讯录就介绍完了，各位小伙伴快去试试吧

猜你喜欢

ZooKeeper场景实践：（2）集中式配置管理
DL之self-attention：self-attention自注意力机制的简介(背景、特点、改进对比、传统对比、关系、应用，适合长距离捕获分析)、计算过程(八大步骤)、案例应用之详细攻略
yii获取当前url和域名
CRM_OPPORT_TEXT_DETER_STANDARD
Atitit 标记语言ML(Markup Language) 目录 1. 标记语言ML Markup Language1 1.1. 简介1 2. 置标语言置标语言通常可以分为三类：标识性的、过程
Ay.Framework.WPF 2.0建立项目到底有多快
BUUCTF刷题笔记——[极客大挑战 2019]EasySQL 1
详解智能优化算法：遗传算法和蚁群算法
2.3 非齐次方程组解集
度娘弱爆了：看看 Google 日本女优程序员
【STM32H7教程】第94章 STM32H7的SPI总线应用之双机通信（DMA方式）
linux驱动开发重点关注内容－－摘自《嵌入式Linux驱动模板精讲与项目实践》
Ansible PlayBook语法
SSH整合
python3 eval代码示例
torch.max()函数==》返回该维度的最大值以及该维度最大值对应的索引
linux 下的用户的管理

相关主题

C语言if语句
SQLSERVER文件和文件组
C语言——文件
C语言 - 数组
C语言数组

zl程序教程