zl程序教程

您现在的位置是:首页 >  其他

当前栏目

文本文件与二进制文件理解

文件二进制 理解 文本文件
2023-09-14 09:11:20 时间

转自:https://www.cnblogs.com/zhangjiankun/archive/2011/11/27/2265184.html

1.介绍 

计算机的存储在物理上是二进制的,所以文本文件与二进制文件的区别并不是物理上的,而是逻辑上的。这两者只是在编码层次上有差异。

文本文件是基于字符编码的文件,常见的编码有ASCII编码,UNICODE编码等等。二进制文件是基于值编码的文件,你可以根据具体应用,指定某个值是什么意思。

文本文件基本上是定长编码的(也有非定长的编码如UTF-8)。而二进制文件可看成是变长编码的,因为是值编码嘛,多少个比特代表一个值,完全由你决定。 

一般认为,文本文件编码基于字符定长,译码容易些;二进制文件编码是变长的,所以它活,存储利用率要高些,译码难一些(不同的二进制文件格式,有不同的译码方式)。 

解释方式不同。

2. base64编码

https://www.liaoxuefeng.com/wiki/1016959663602400/1017684507717184

Base 家族常见的有 Base64, Base32, Base16 三种编码,他们的编码规则大致相同,最常用的是 Base64 编码。base 系列编码并不属于字符编码,他们主要用于把一串“无意义的”八位二进制字节编码为可见 ASCII 字符

用记事本打开exejpgpdf这些文件时,我们都会看到一大堆乱码,因为二进制文件包含很多无法显示和打印的字符,所以,如果要让记事本这样的文本处理软件能处理二进制数据,就需要一个二进制到字符串的转换方法。Base64是一种最常见的二进制编码方法。

具体原理和例子可见,https://juejin.cn/post/6854573213331128333