计算机中位(bit), 字节(byte), 字(word)的关系
1、位(bit) 来自英文bit,音译为“比特”,表示二进制位。位是计算机内部数据储存的最小单位,11010100是一个8位二进制数。一个二进制位只可以表示0和1两种状态(21);两个二进制位可以表示00、01、10、11四种(22)状态;三位二进制数可表示八种状态(23)……。
2、字节(byte) 字节来自英文Byte,音译为“拜特”,习惯上用大写的“B”表示。 字节是计算机中数据处理的基本单位。计算机中以字节为单位存储和解释信息,规定一个字节由八个二进制位构成,即1个字节等于8个比特(1Byte=8bit)。八位二进制数最小为00000000,最大为11111111;通常1个字节可以存入一个ASCII码,2个字节可以存放一个汉字国标码。
3、字 计算机进行数据处理时,一次存取、加工和传送的数据长度称为字(word)。一个字通常由一个或多个(一般是字节的整数位)字节构成。例如286微机的字由2个字节组成,它的字长为16;486微机的字由4个字节组成,它的字长为32位机。 计算机的字长决定了其CPU一次操作处理实际位数的多少,由此可见计算机的字长越大,其性能越优越。
一个ascll码就是一个字节, 因为ascll码的二进制范围是00000000到11111111, 十进制范围是0到255,
unicode指的是UCS-2的编码方式, 是以两个字节的长度
utf-8是一种变长的编码方式,它可以使用1~4个字节表示一个符号,根据不同的符号而变化字节长度
utf-16是,好处在于大部分字符都以固定长度的字节 (2字节) 储存,但UTF-16却无法兼容于ASCLL编码
UTF-32(或 UCS-4)是以4个字节的长度固定存储的;
每一个字节文件都是以约定的编码进行存储的:
比如utf-8是使用作为:EF BB BF 开头的, utf-8格式的文件16进制如下:
ANSI是window下的默认格式,英文会以ASCLL码存储,而中文会以GBK码就行存储;
如果是unicode的话, 会以FE FF和 FF FE这两种大头小头的方式约定存储, unicode格式的16进制文件如下:
字符编码笔记:ASCII,Unicode和UTF-8 http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html
Unicode与JavaScript详解 http://www.ruanyifeng.com/blog/2014/12/unicode.html
相关文章
- C语言中的字节对齐
- JavaScript进行WebSocket字节流通讯示例
- Java 第十一届 蓝桥杯 省模拟赛 计算机存储中有多少字节
- 字节,字符及占用内存大小情况
- C# 返回图片的字节流byte[]
- Qt QByteArray字节数组
- Mock服务设计与实现:MySQL驱动字节码修改增强
- 【Android 逆向】启动 DEX 字节码中的 Activity 组件 ( 替换 LoadedApk 中的类加载器 | 加载 DEX 文件中的 Activity 类并启动成功 )
- 一个int类型究竟占多少个字节
- 字节跳动面试官这样问有关字符串的问题!!
- 字节跳动已上岸测试工程师的
- 7年字节老司机关于UI自动化测试心得 —— 深似海
- Java核心类库之(字符集/编码集、File类、递归、IO流:字节流、字符流、特殊操作流)