JDK9的新特性:String压缩和字符编码
2023-09-11 14:19:26 时间
简介
String的底层存储是什么?相信大部分人都会说是数组。如果要是再问一句,那么是以什么数组来存储呢?相信不同的人有不同的答案。
在JDK9之前,String的底层存储结构是char[],一个char需要占用两个字节的存储单位。
据说是JDK的开发人员经过调研了成千上万的应用程序的heap dump信息,然后得出了一个结论:大部分的String都是以Latin-1字符编码来表示的,只需要一个字节存储就够了,两个字节完全是浪费。
据说他们用了大数据+人工智能,得出的结论由不得我们不信。
于是在JDK9之后,字符串的底层存储变成了byte[]。
更多内容请访问www.flydean.com
底层实现
先看下java9之前的String是怎么实现的:
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
//The value is used for character storage.
private final char value[];
}
再看下java9中String的实现和一些关键的变量:
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
/** The value is used for character storage. */
@Stable
private final byte[] value;
private final byte coder;
@Native static final byte LATIN1 = 0;
@Native static final byte UTF16 = 1;
static final boolean COMPACT_STRINGS;
static {
COMPACT_STRINGS = true;
}
从代码我们可以看到底层的存储已经变成了byte[]。
再看一下coder变量,coder代表编码的格式,目前String支持两种编码格式LATIN1和UTF16。
LATIN1需要用一个字节来存储。而UTF16需要使用2个字节或者4个字节来存储。
而COMPACT_STRINGS则是用来控制是否开启String的compact功能。默认情况下COMPACT_STRINGS功能是开启的。
如果我们想关闭COMPACT_STRINGS功能则可以使用-XX:-CompactStrings参数。
总结
本文讲解了新的String实现和COMPACT_STRINGS模式的关闭方法。
本文作者:flydean程序那些事
本文链接:http://www.flydean.com/jdk9-string-compact/
本文来源:flydean的博客
欢迎关注我的公众号:程序那些事,更多精彩等着您!
相关文章
- linux驱动开发--字符设备:信号量
- linux驱动开发--字符设备:原子操作
- Java实现 蓝桥杯VIP 算法提高 最长字符序列
- php分享二十三:字符编码
- DedeCMS中用到的字符编码转换1
- 字符编码笔记:ASCII,Unicode 和 UTF-8
- Python爬虫开发:中文字符编码问题quote解决
- System.Xml.XmlException: 给定编码中的字符无效。 第 XX 行,位置 YY。
- System.Xml.XmlException: 给定编码中的字符无效。 第 XX 行,位置 YY。
- C# 移除字符串末尾指定字符
- iOS swift UITextField 限制输入指定的字符 限制输入字符的长度
- Computer:字符编码(ASCII编码/GBK编码/BASE64编码/UTF-8编码)的简介、案例应用(python中的编码格式及常见编码问题详解)之详细攻略
- Java //PP1.9 编写一个程序,显示如下的菱形形状,不能有任何多余的字符出现。
- 错误: 编码GBK的不可映射字符
- 【Groovy】字符串 ( 字符串类型变量定义 | 字符类型变量定义 )
- Android EditText限制输入一些固定字符的属性
- python字符编码
- 字符串的字符格式会让程序报错
- 第四章 linux字符设备的编写二
- 【剑指offer】删除字符也出现在一个字符串
- VC++中ANSI、UNICODE与UTF-8字符编码之间的转换(附源码)
- 数据链路层 功能 封装成帧 透明传输 字符计数法 字符填充法 零比特填充法 违规编码法 传输中的差错 差错控制 冗余编码 奇偶校验码 CRC循环冗余码 检错过程 细解 图解 通俗易懂