一、前言

  最近在研究HashMap的源码,经过这几天的研究,我对HashMap的底层实现有了一个比较清晰的认识。今天就来写一篇博客,带大家阅读一下HashMap中,最最重要的两个方法——getput的代码实现。(注:以下代码基于JDK1.8

  若想要看懂这两个方法的源代码,首先得对HashMap的底层结构有一个清晰的认识,若不清楚的,可以看看我之前写的一篇博客,这篇博客对HashMap的底层结构和实现进行了一个比较清晰和全面的讲解,同时博客的最底下附上了两篇阿里架构师对HashMap的分析,写的非常好,很有参考价值:


二、解析

 2.1 get方法源码解读

  get方法的作用是传入我们需要获取的节点的key,然后将这个节点的value返回。首先先贴上get方法的代码:

1
2
3
4
public V get(Object key) {
Node<K,V> e;
return (e = getNode(hash(key), key)) == null ? null : e.value;
}

  可以看到,get方法的代码非常的简洁,因为具体的代码都封装在了getNode这个方法里面,get方法只是对它进行了调用。getNode方法接收两个参数,第一个参数是keyhash值,第二个参数就是key本身。下面我们就来看看getNode方法的源代码(通过注释,对源码进行了逐句解读):

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
/**
* Implements Map.get and related methods
*
* @param hash key到hash值
* @param key key值
* @return the node, or null if none
*/
final HashMap.Node<K,V> getNode(int hash, Object key) {
HashMap.Node<K,V>[] tab; HashMap.Node<K,V> first, e; int n; K k;

// 以下if语句中判断三个条件:
// 1、HashMap中存储数据的数组table不为null;
// 2、数组table不为null,且长度大于0;
// 3、table已经创建,且通过hash值计算出的节点存放位置有节点存在;
// 若上面三个条件都满足,才表示HashMap中可能有我们需要获取的元素
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {

// 定位到元素在数组中的位置后,我们开始沿着这个位置的链表或者树开始遍历寻找
// 注:JDK1.8之前,HashMap的实现是数组+链表,到1.8开始变成数组+链表+红黑树

// 首先判断这个位置的第一个节点的key值是否与参数的key值相等,
// 若相等,则这个节点就是我们要找的节点,将其返回
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
// 若上面的不满足,则判断第一个节点是否有下一个节点
// 若有,继续判断;若没有,那表示我们要找的节点不存在
if ((e = first.next) != null) {
// 若第一个节点是应该树节点,则通过红黑树的查找算法进行查找
if (first instanceof HashMap.TreeNode)
return ((HashMap.TreeNode<K,V>)first).getTreeNode(hash, key);
// 若不是一个树节点,表示当前位置是一个链表,则使用do...while循环遍历查找
do {
// 若查找到某个节点的key值与参数的key值相等,则表示它就是我们要找的节点,将其返回
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
// 若没有找到对应的节点,返回null
return null;
}

  在HashMap中,containsKey方法也是依赖getNode方法实现的:

1
2
3
public boolean containsKey(Object key) {
return getNode(hash(key), key) != null;
}

 2.2 put方法源码解读

  看完了get方法的源代码,我们再来看看put方法。put方法的作用是将一对key-value插入到HashMap中,若HashMap中已经存在这个key,则用新的value替换旧的value

1
2
3
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}

  可以看到,put方法比get方法还要简短,和get方法一样,他也是将实现放入了另一个方法中,这个方法叫做putVal。我们先来看看这个方法的签名:

1
2
3
4
5
6
7
8
9
10
11
/**
* Implements Map.put and related methods
*
* @param hash hash for key
* @param key the key
* @param value the value to put
* @param onlyIfAbsent if true, don't change existing value
* @param evict if false, the table is in creation mode.
* @return previous value, or null if none
*/
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict)

 这个方法有5个参数:

  1. hash:需要插入的元素,它的keyhash值;
  2. key:需要插入的元素的key值;
  3. value:需要插入的元素的value值;
  4. onlyIfAbsent:一个标识,当它的值为false时,若查询重复的key值,则将用新的value替换原来的value;反之则不替换,留下旧值;
  5. evict:在HashMap中无意义,将在子类LinkedHashMap中使用;

  除了上面五个参数,在putVal中还用来另外成员变量,我们要先明确它们的意义:

  1. TREEIFY_THRESHOLD:将链表转换成红黑树的阈值;在HashMap中,若某一条链表上的节点数大于等于TREEIFY_THRESHOLD,那就会将它从链表转换成红黑树,这个值默认为8
  2. modCount:记录HashMap被修改的次数,这里的修改仅仅是指插入和删除;这个变量的作用是为了安全的使用迭代器:迭代器在创建时,会记录下这个值,若迭代器在使用的过程中,modCount与迭代器中记录的值不一致,表示在迭代器被创建后,集合的元素数量发生了改变,这个时候迭代器就不再安全了,此时再使用这个迭代器时将会抛出异常;
  3. sizeHashMap中,节点的数量;
  4. thresholdHashMap中,当前允许放入的最大节点数,当到达这个数量时,HashMap将进行扩容;

  好了,下面我们就来看看putVal方法的源代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
HashMap.Node<K,V>[] tab; HashMap.Node<K,V> p; int n, i;

// 判断当前存储数据的数组是否为null,或者大小为0,若是,则调用resize方法初始化数组
// resize方法用来初始化HashMap中存储数据的table数组,或者给table扩容(即*2)
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;

// 判断新值将要插入的位置是否为null,若为null,则用传入的值创建一个新的节点,并放入到这个位置
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
// 若新值将要放入的位置已经存在节点了,则进一步判断
else {
// 若已经存在一个节点,它的key与新值的key相等,则用变量e记录这个节点
// e的作用就是干这个的,下面很长一段代码都是用来判断是否存在这样一个节点
HashMap.Node<K,V> e; K k;
// 若新值将要插入的位置已经存在的节点,它的key值与新值的key相等,
// 则用变量e记录下它
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
// 若已经存在的节点是一个Tree节点,则使用树的方法将节点加入
// 用e接收返回值,此处返回值e不为空,表示这棵树上存在与新值的key相同的节点
else if (p instanceof HashMap.TreeNode)
e = ((HashMap.TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
// 若以上条件均不满足,则表示这个位置不是一棵树,而是一个链表
else {
// 遍历这个链表
for (int binCount = 0; ; ++binCount) {
// 若已经到达这个链表的最后一个节点,则用新值创建一个新的节点,
// 并将其插入最后一个节点的末端
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
// 若插入这个节点后,这条链表的的节点数目已经到达了树化的阈值
// 则将这条链表转换为红黑树
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
// 若在遍历这条链表的过程中,发现了一个节点,它的key值与新值的key相等,则不插入新节点
// 且此时由于上面的操作,e已经指向了这个key重复的节点,不需要继续遍历了,跳出循环
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
// 这一步赋值没看懂意义何在
p = e;
}
}

// 判断e是否为null,若不为空,表示在原来的节点中,存在一个key值与新值的key重复的节点
if (e != null) { // existing mapping for key
// 记录下这个节点原来的value值
V oldValue = e.value;
// 若onlyIfAbsent的值为false,或者原来的value是null,则用新值替换原来的值
if (!onlyIfAbsent || oldValue == null)
e.value = value;
// 这是一个回调函数,但是在HashMap中是一个空函数,
// 看源码貌似是留给LinkedHashMap去扩充的,
// 感觉这个应该属于模板方法设计模式
afterNodeAccess(e);
// 返回旧value,如果在这里被返回,则不会执行剩下的代码
// 也就是说,若执行到剩下的代码,表示并不是执行修改原有值的操作,而是插入了新节点
return oldValue;
}
}
// 能运行到这里,表示这次进行的是插入操作,而不是修改
// modCount用来记录Map(仅指插入+删除)被修改的次数
// 此处modCount+1,因为HashMap被修改了(新插入了一个节点)
++modCount;
// Map中元素的数量+1,并判断元素数量是否到达允许的最大值,若到达,则对Map进行扩容
if (++size > threshold)
resize();
// 与上面的afterNodeAccess类似,同为留给LinkedHashMap编写的回调函数
afterNodeInsertion(evict);
// 若插入一个新节点,则返回null
return null;
}

三、总结

  为了能够更好的理解,上面的代码我都进行了非常详细的注释,希望对看到这篇博客的人能够有所帮助。因为我对红黑树不是很了解,所以在上面的两个方法中,关于树的操作那部分我都没有深入探讨,之后有时间,我会去专门研究一下红黑树,比较这是在集合中,使用的比较多的一个数据结构。


四、参考

https://blog.csdn.net/qq_35321596/article/details/81117669
https://blog.csdn.net/AJ1101/article/details/79413939