您现在的位置是：首页 > 后端

当前栏目

【java】HashMap底层的实现原理（JDK8）

JAVA 原理实现底层 HashMap JDK8

2023-09-14 09:14:20 时间

文章目录

知识点回顾
HashMap 的 put() 和 get() 的实现
- map.put(k, v) 实现原理
- map.get(k) 实现原理
HashMap 的常见面试题

HashMap的底层是通过数组 + 单向链表/红黑树实现的。

知识点回顾

数组特点

存储区间是连续的，且占用内存严重，空间复杂度也很大，时间复杂度为 O(1)。
优点：随机读取效率很高，原因是数组是连续的（随机访问性强，查找速度快）。
缺点：插入和删除数据效率低，因插入数据，这个位置后面的数据在内存中要后移，且大小固定不易动态扩展。

链表特点

区间离散，占用内存宽松，空间复杂度小，时间复杂度 O(n)。
优点：插入删除速度快，内存利用率高，没有大小固定，扩展灵活。
缺点：不能随机查找，每次都是从第一个开始遍历（查询效率低）。

以上数组和链表，大家都知道各自优缺点。那么我们能不能把以上两种结合在一起使用，从而实现查询效率高和删除插入效率也高的数据结构呢？答案是可以的，那就是哈希表可以满足，接下来我们一起复习下 HashMap

哈希表特点

实现查询效率高和删除插入效率也高的数据结构

接下来我们一起复习下 HashMap 中的 put() 和 get() 方法实现原理。
在这里插入图片描述

HashMap 的 put() 和 get() 的实现

map.put(k, v) 实现原理

第1步，首先将 k, v 封装到 Node 对象当中（节点）。
第2步，它的底层会调用 K 的 hashCode() 方法得出 hash 值。
第3步，通过哈希表函数/哈希算法，将 hash 值转换成数组的下标：
- 下标位置上如果没有任何元素，就把 Node 添加到这个位置上；
- 如果说下标对应的位置上有链表，就会拿着 k 和链表上每个节点的 k 进行 equals：
  - 如果所有的 equals 方法返回都是 false，那么这个新的节点将被添加到链表的末尾；
  - 如其中有一个 equals 返回了 true，那么这个节点的 value 将会被覆盖。

map.get(k) 实现原理

第1步，先调用 k 的 hashCode() 方法得出哈希值，并通过哈希算法转换成数组的下标。
第2步，通过上一步哈希算法转换成数组的下标之后，再通过数组下标快速定位到链表所在位置上。
- 如果这个位置上什么都没有，则返回 null；
- 如果这个位置上有单向链表，那么它就会拿着参数 k 和单向链表上的每一个节点的 k 进行 equals：
  - 如果所有 equals 方法都返回 false，则 get 方法返回 null；
  - 如果其中一个节点的 k 和参数 k 进行 equals 返回 true，那么此时该节点的 value 就是我们要找的 value 了，get 方法最终返回这个要找的 value。

在这里插入图片描述

HashMap 的常见面试题

为何随机增删、查询效率都很高？

增删是在链表上完成的，而查询主要是通过数组定位，然后扫描部分链表，所以效率高。

HashMap 集合的 key，会先后调用两个方法：hashCode() 和 equals() 方法，所以当对象充当 key 时，这两个方法都需要重写。

为什么放在 HashMap 集合 key 部分的元素需要重写 equals 方法?

因为 equals 默认比较的是两个对象的内存地址，如果想根据对象的属性来判断，则需要重写。

HashMap 的 key 为什么是无序的？

因为不一定挂到哪一个单向链表上，因此加入顺序和取出也不一样。

HashMap 怎么保持不可重复？

使用 equals 方法来保证 HashMap 的 key 不可重复。如果 key 重复的话，value 就会覆盖。存放在 HashMap 集合中的 key，其实就是存放在 HashSet 集合中，所以 HashSet 集合也需要重写 equals() 和 hashCode() 方法。

HashMap 是如何扩容的？

HashMap 集合的默认初始化容量为16，默认加载因子为 0.75，也就是说当 HashMap 集合底层数组的容量达到 75% 时，数组就开始扩容。HashMap 集合初始化容量是 2 的倍数，是为了达到散列均匀，提高 HashMap 集合的存取效率。

HashMap 在 JDK7 和 JDK8 有什么不同？

new HashMap<>()，底层不会再创建一个长度为 16 的数组，改为首次调用 put() 方法时创建；
jdk8 底层的数组是 Node[]，而非 Entry[]；
jdk7 底层结构只有：数组+链表，jdk8 中底层结构：数组+链表+红黑树。

形成链表时，七上八下
- jdk7：头插法，新元素指向旧元素（多线程修改会有死锁问题）；
- jdk8：尾插法，旧元素指向新元素；
为什么要用红黑树：
- 首先，正常场景下不会一下子产生特别多的 Hash 冲突，只有非常规的场景下才会出现 Hash 冲突，需要转化为红黑树结构。
- 红黑树解决了超长链表查询效率低下的问题，但是小数据量的链表并不比红黑树的查询效率要低。
- Hash 值如果足够随机，则在 Hash 表内按泊松分布，在负载因子 0.75 的情况下，长度超过 8 的链表出现概率时 0.00000006，选择 8 就是为了尽量降低树化的几率。
树化的两个条件：（必须都满足）
- 哈希单向链表中的元素数 > 8
- 当前数组的长度 > 64
退化链表的条件：（任何一个满足）
- 红黑树上的节点数 < 6
- remove 节点时，若 root、root.left、root.right、root.left.left 有任意一个为 null，也会退化为链表。

HashMap 的哈希碰撞

如果 key1 和 key2 的哈希值相同，就会存放到同一个单向链表上。

如果 key1 和 key2 的哈希值不同，但由于哈希算法执行结束之后转换的数组下标可能相同，此时会发生哈希碰撞。

HashMap 的 key 允许为 null 吗？

允许

JDK8 中 HashMap 的 put() 方法：

public V put(K key, V value) {
    // 采用 hash(key) 来计算 key 的 hashCode 值
    return putVal(hash(key), key, value, false, true);
}

static final int hash(Object key) {
    int h;
    // 当 key 为 null 的时候，不走 hashCode() 方法
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

HashMap 中使用 hash() 方法来计算 key 的哈希值，当 key 为 null 时，直接令 key 的哈希值为0，不走 key.hashCode() 方法，所以即使为 null 也不会抛出空指针异常。

猜你喜欢

Linux DNS服务详解——DNS基础知识
NeHe OpenGL教程第一课：OpenGL窗口
【异常】com.mysql.jdbc.exceptions.jdbc4.MySQLNonTransientConnectionException: Could not create connection to database server.
抓包整理外篇——————https 抓包 [ 五]
【codeforces 239B】Easy Tape Programming
评估篇 | 单元测试评估也能复用到集成测试？脚本帮你高效评估
raster 像素化
向数据库中插入一个DateTime类型的数据到一个Date类型的字段中，需要转换类型。TO_DATE('{0}','YYYY-MM-DD'))
eclipse覆盖率插件——EclEmma的安装和使用
java.lang.IllegalArgumentException: View not attached to window manager
4年功能测试月薪9.5K，4个月时间进阶自动化，跳槽涨薪4k后我的路还很长...
DockerCon 2016 深度解读：容器定义存储一窥
JAVA编程思想读书笔记（五）--多线程
sql高级查询
kettle报错couldn't convert string [1970-01-01 00:00:00] to a date using format [yyyy/MM/dd HH:mm:ss.SS
Linux系统通过Shell脚本实现一个全方面的系统性能分析系统
Django 之缓存机制

相关主题

Java之Java简介
Java(6)-java线程
Java 工厂模式
Java - 初识Java
Java 8 Optional 类
Java Web-JSTL
java- Java IO
Java面试题-锁
【Java】Java NIO
Java注释

zl程序教程