【C/进阶】如何对文件进行读写(含二进制)操作?
关于C语言的知识放在专栏:C 小菜坤日常上传gitee代码:https://gitee.com/qi-dunyan ❤❤❤ 个人简介:双一流非科班的一名小白,期待与各位大佬一起努力!
目录
前言
在前面的文章中写了静态与动态版本的通讯录,动态版本通讯录与静态版本相比,有着更大的优势,因为可以实现按需开辟空间,但是也存在一个致命缺陷,就是我们发现,不管是动态还是静态版本的通讯录,他们都是“一次性”的,也就是说,当我们下次再打开通讯录时,以前写过的信息数据都不在了。 那么有什么方法可以把我们写过的数据记录下来以便下一次可以直接使用呢? 举个例子来说,我们大学生都在电脑上写过一些大大小小的论文吧,假如当你写完保存下来时,下一次再打开,内容是不是还依然存放在文本里面,这就是数据的持久化,而我们实现数据持久化的方式一般就是把数据存放在磁盘文件、存放到数据库等方式。
通过本次章节的学习,我们就可以将数据直接存放在电脑的硬盘上,做到数据的持久化。实现真正意义上的“通讯录”
文件的介绍
基本概念 了解文件的操作,首先我们要知道最基本的概念,什么是文件?很简单,我们磁盘上的这些文件是就是文件。就像这种都是属于文件:
而我们一般所谈的文件一共有两种:程序文件、数据文件(从文件功能的角度来分类的)。 程序文件 包括源程序文件(后缀为.c),目标文件(windows环境后缀为.obj),可执行程序(windows环境后缀为.exe)。
数据文件 文件的内容不一定是程序,而是程序运行时读写的数据,比如程序运行需要从中读取数据的文件,或者输出内容的文件。 也就是说,用来存储各种数据,以用来读写的文件就是数据文件。所以,我们这里主要学习的是数据文件。 文件名 一个文件要有一个唯一的文件标识,以便用户识别和引用。 文件名包含3部分:文件路径+文件名主干+文件后缀
文件的打开和关闭
1、文件指针 每个被使用的文件都在内存中开辟了一个相应的文件信息区,用来存放文件的相关信息(如文件的名字,文件状态及文件当前的位置等)。这些信息是保存在一个结构体变量中的。该结构体类型是由系统声明的,取名FILE VS2013编译环境提供的 stdio.h 头文件中有以下文件类型声明
struct _iobuf {
char *_ptr;
int _cnt;
char *_base;
int _flag;
int _file;
int _charbuf;
int _bufsiz;
char *_tmpfname;
};
typedef struct _iobuf FILE;
也就是说每当打开一个文件的时候,系统会根据文件的情况自动创建一个FILE结构的变量,并填充其中的信息,我们可以直接拿来用这个FILE结构体变量的。一般都是通过一个FILE的指针来维护这个FILE结构的变量,这样使用起来更加方便。如下:
FILE* pf;//文件指针变量
pf是一个指向FILE类型数据的指针变量。可以使pf指向某个文件的文件信息区(本质是一个结构体变量)。通过该文件信息区中的信息就能够访问该文件。也就是说**,通过文件指针变量能够找到与它关联的文件。**
2、文件的打开与关闭 在对一个文件进行读写之前,一套完整的流程应该是这样的:先打开文件,然后进行读写,结束后再关闭文件。 ANSIC规定用fopen与fclose分别对应文件的打开与关闭,并且在打开文件的同时会返回一个FILE的指针,用来建立与文件之间的联系。
而一个文件的打开方式又分为很多种:以下已整理出来
使用方式 | 含义 | 假如文件不存在 |
---|---|---|
“r”(只读) | 为了输入数据,打开一个已经存在的文本文件 | 出错 |
“w”(只写) | 为了输出数据,打开一个文本文件 | 建立一个新的文件 |
“a”(追加) | 向文本文件尾添加数据 | 建立一个新的文件 |
“rb”(只读) | 为了输入数据,打开一个二进制文件 | 出错 |
“wb”(只写) | 为了输出数据,打开一个二进制文件 | 建立一个新的文件 |
“ab”(追加) | 向一个二进制文件尾添加数据 | 出错 |
“r+”(读写) | 为了读和写,打开一个文本文件 | 出错 |
“w+”(读写) | 为了读和写,建议一个新的文件 | 建立一个新的文件 |
“a+”(读写) | 打开一个文件,在文件尾进行读写 | 建立一个新的文件 |
“rb+”(读写) | 为了读和写打开一个二进制文件 | 出错 |
“wb+”(读写) | 为了读和写,新建一个新的二进制文件 | 建立一个新的文件 |
“ab+”(读写) | 打开一个二进制文件,在文件尾进行读和写 | 建立一个新的文件 |
示例
#include <stdio.h>
int main()
{
//打开文件 注意这里是双引号"w",表示以写的方式打开这个文件,假如文件不存在,则创建该文件
FILE* pFile= pFile = fopen("myfile.txt", "w");
//文件操作
if (pFile != NULL)
{
//使用文件
// ...
// ...
// ...
//关闭文件
fclose(pFile);
}
return 0;
}
这里要注意一点,就是文件会创建在该源文件的路径下,大家可以看到,我打开的myfile文件就创建在了我的lzn.c的源文件路径下。 假如我把文件删除,然后以读的方式打开,这里就会出现这种情况,返回空指针,但是以写的方式打开的话,假如不存在该文件,就会自动创建一个文件,然后再返回该文件信息区的起始地址:
读写文件
顺序读写
了解打开关闭文件后,接下来是文件的读写,首先介绍文件的顺序读写。我给大家整理了一下用到的函数,如下:
功能 | 函数名 | 适用于 |
---|---|---|
字符输入函数 | fgetc | 所有输入流 |
字符输出函数 | fputc | 所有输出流 |
文本行输入函数 | fgets | 所有输入流 |
文本行输出函数 | fputs | 所有输出流 |
格式化输入函数 | fscanf | 所有输入流 |
格式化输出函数 | fprintf | 所有输出流 |
二进制输入 | fread | 文件 |
二进制输出 | fwrite | 文件 |
fputc与fgetc
fputc按顺序写
演示
#include<stdio.h>
int main()
{
//注意,这里要进行写文件,所以是"w"
FILE* pf = fopen("test.txt", "w");//注意:假如不存在text.txt文件,就会自动创建,并且当打开写文件时,原文件内容会清空
//好习惯
if (NULL == fopen)
{
perror("fopen");
return 1;
}
//写
fputc('a', pf);
fputc('b', pf);
fputc('c', pf);
//关闭
fclose(pf);
pf = NULL;
return 0;
}
fgetc按顺序读
演示
int main()
{
//注意,这里要进行读文件,所以是"r"
FILE* pf = fopen("test.txt", "r");//注意:假如不存在text.txt文件,就会返回NULL
//好习惯
if (NULL == fopen)
{
perror("fopen");
return 1;
}
//读
int ch=fgetc(pf);//每读完一个字符,指针就会指向下一个字符,读到末尾,返回EOF
printf("%c", ch);
ch=fgetc(pf);
printf("%c", ch);
ch=fgetc(pf);
printf("%c", ch);
//关闭
fclose(pf);
pf = NULL;
return 0;
}
fputs与fgets
fputs按顺序写一行
演示
int main()
{
//注意,这里要进行写文件,所以是"w"
FILE* pf = fopen("test.txt", "w");//注意:假如不存在text.txt文件,就会自动创建,并且当打开写文件时,原文件内容会清空
//好习惯
if (NULL == fopen)
{
perror("fopen");
return 1;
}
//按顺序写一行
fputs("abc\n", pf);
fputs("defg", pf);
//关闭
fclose(pf);
pf = NULL;
return 0;
}
fgets按顺序读一行
演示
int main()
{
//注意,这里要进行读文件,所以是"r"
FILE* pf = fopen("test.txt", "r");
//好习惯
if (NULL == fopen)
{
perror("fopen");
return 1;
}
//按顺序读一行
char arr[10] = { "xxxxxxxxxx"};
fgets(arr, 3, pf);
//关闭
fclose(pf);
pf = NULL;
return 0;
}
这里有一点需要注意,就是读的时候会在最后加上一个字符‘\0’,这个\0也会占用num中的一个字符,所以这里实际上是只读到了ab两个字符,并且一次只能读一行的内容。(就算num给个100,这里也只能读到abc还有\n,因为这一行只有abc\n)
fprintf与fscanf
我们上面都只是小菜一碟,仅仅只是一行字符,假如要对一个结构体进行读写呢?这就用到了这两个函数来帮我们实现 fprintf fpintf与我们的printf长得很像,但其实用法也基本上一模一样,我们在用printf进行输出操作时,对于一个结构体是这样输出的:
只不过这个printf是输出到了屏幕上面,而我们的fprintf要输出到文件里,接下来请看:就是在前面加了个文件指针而已。
演示
struct stu
{
char name[20];
int age;
double grade;
};
int main()
{
struct stu s = { "lisi",20,90.5 };
//注意,这里要进行写文件,所以是"w"
FILE* pf = fopen("test.txt", "w");
//好习惯
if (NULL == fopen)
{
perror("fopen");
return 1;
}
//写
fprintf(pf, "%s %d %.1lf\n", s.name, s.age, s.grade);
//关闭
fclose(pf);
pf = NULL;
return 0;
}
看,就是这么简单粗暴。 fscanf 不用说了,大家也能猜到fscanf与scanf也是用法很像的。接下来看操作即可。
演示
struct stu
{
char name[20];
int age;
double grade;
};
int main()
{
struct stu s = {0};
//注意,这里要进行写文件,所以是"r"
FILE* pf = fopen("test.txt", "r");
//好习惯
if (NULL == fopen)
{
perror("fopen");
return 1;
}
//在文件流里读数据
fscanf(pf, "%s %d %lf", s.name, &(s.age), &(s.grade));
//把读到的数据打印
printf("%s %d %.1lf", s.name, s.age, s.grade);
//关闭
fclose(pf);
pf = NULL;
return 0;
}
这里的;lisi、20,90.5是从哪里来的呢?答案是fscanf从文件里读来的。
fwrite与fread
fwrite是以二进制的形式写入数据
接下来我们把上面的结构体以二进制形式进行读写,看操作:
struct stu
{
char name[20];
int age;
double grade;
};
int main()
{
struct stu s = { "lisi",20,90.5 };
//注意,这里要以二进制形式进行写文件,所以是"wb"
FILE* pf = fopen("test.txt", "wb");//wb表示以二进制的形式写的方式打开文件
//好习惯
if (NULL == fopen)
{
perror("fopen");
return 1;
}
//二进制形式写
//&s表示被写入的数据地址,大小为一个结构体大小,个数为1个,写到pf指向的文件信息区
fwrite(&s, sizeof(s), 1, pf);
//关闭
fclose(pf);
pf = NULL;
return 0;
}
大家看,有些地方是不是看不懂了,确实,我也看不懂这二进制乱七八糟的,而fread就是专门读二进制的数据的。
如下:
struct stu
{
char name[20];
int age;
double grade;
};
int main()
{
struct stu s = { 0 };
//注意,这里要以二进制形式进行读文件,所以是"rb"
FILE* pf = fopen("test.txt", "rb");
//好习惯
if (NULL == fopen)
{
perror("fopen");
return 1;
}
//二进制形式读
fread(&s, sizeof(s), 1, pf);
//把读到的数据打印
printf("%s %d %.1lf",s.name,s.age,s.grade);
//关闭
fclose(pf);
pf = NULL;
return 0;
}
还挺有趣的是吧。
随机读写
以上都是按顺序进行文件的读写操作,接下来的几个函数帮助我们实现文件的随机读写
fseek、ftell、rewind
根据文件指针的位置和偏移量来定位文件指针
ftell:返回文件相较于起始位置的偏移量。 rewind:文件指针回到起始位置
具体是什么意思呢?一个例子了解全部:
int main()
{
//这里我在外面已经创建了文件,并且写了abcde
FILE* pf = fopen("learn.txt", "r");
if (pf == NULL)
{
perror("fopen");
return 1;
}
int ch = fgetc(pf);//读取a,文件指针指向b
fseek(pf, 2, SEEK_CUR);//从b偏移2,指向d
ch = fgetc(pf);//读取d,指向e,e相较于a的偏移量为4
int ph = ftell(pf);//ftell用来计算偏移量
printf("%c %d\n", ch, ph);
//d 4
rewind(pf);//文件指针回到起始位置,指向a
ch = fgetc(pf);
printf("%c", ch);//a
return 0;
}
这里的SEEK_END与SEEK_SET大家有兴趣,自己可以偏移着玩玩。
文件读取结束的判定
feof feof的返回值被很多人用来判断文件是否读取结束,它真正的用途是应用于当文件读取结束的时候,判断是读取失败结束,还是遇到文件尾结束。
如果是遇到文件尾结束,返回非0,如果是因为一些原因导致读取失败,则返回0; 应用:
#include <stdio.h>
#include <stdlib.h>
int main(void)
{
int c; // 注意:int,非char,要求处理EOF
FILE* fp = fopen("test.txt", "r");
if (!fp)
{
perror("File opening failed");
return EXIT_FAILURE;
}
//fgetc 当读取失败的时候或者遇到文件结束的时候,都会返回EOF
while ((c = fgetc(fp)) != EOF) // 标准C I/O读取文件循环
{
putchar(c);
}
//判断是什么原因结束的
if (ferror(fp))
puts("I/O error when reading");
else if (feof(fp))//假如读到文件尾,返回非0,执行以下命令
puts("End of file reached successfully");
fclose(fp);
}
我们这里没有什么问题,所以最终打印End of file reached successfully,表示是读取到文件尾才读取结束。
文件缓冲区
ANSIC 标准采用“缓冲文件系统”处理的数据文件的,所谓缓冲文件系统是指系统自动地在内存中为程序中每一个正在使用的文件开辟一块“文件缓冲区”。从内存向磁盘输出数据会先送到内存中的缓冲区,装满缓冲区后才一起送到磁盘上。如果从磁盘向计算机读入数据,则从磁盘文件中读取数据输入到内存缓 冲区(充满缓冲区),然后再从缓冲区逐个地将数据送到程序数据区(程序变量等)。缓冲区的大小根据C编译系统决定的。
简单来说,就是内存中存储的数据与硬盘进行输入输出时,并不是直接进行的,而是通过一个缓冲区的存在,等装满缓冲区,再进行输入输出。当然也会存在例外,就是缓冲区没满的时候,也会进行输入输出。
就比如你去拿快递,假如你的快递每十分钟来一个,你肯定不可能拿了一个放回宿舍,再去拿下一个,你肯定会等快递到齐了,再一次性去拿,少跑好几趟,但有个快递对你特别重要,你肯定先去拿回来,然后再去拿后面的。
end 生活原本沉闷,但跑起来就会有风!
相关文章
- 数据孤岛是业务效率的无声杀手
- 2023展望:新的一年将给大数据分析领域带来什么?
- 阿里云ADB基于Hudi构建Lakehouse的实践
- 大数据在医疗保健领域的使用案例
- 微软增加说明:KB5021751 更新扫描已经 / 即将过时 Office 过程中不会触碰用户隐私
- 2022 Gartner全球云数据库管理系统魔力象限发布 腾讯云数据库入选
- 场景化、重实操,分享一个实时数仓实践案例
- Arctic的湖仓一体践行之路
- 分布式计算MapReduce究竟是怎么一回事?
- 淘系数据模型治理优秀实践
- 大数据分析对医疗保健的影响
- 当我们说大数据Hadoop,究竟在说什么?
- 2022年及以后大数据的五个发展趋势
- 网易严选离线数仓治理实践
- 2023 年数据治理趋势
- 一份“靠谱”的年度经营计划,你学会了吗?
- 漫谈对大数据的思考
- 测试一下,读懂数据的能力,你有吗?
- 用艺术的眼光探索数据之美
- 聊聊数据分析成果如何落地