本文將針對jdk8中HashMap用到的幾個知識做一個總結姓赤,主要涉及到源碼及面試中相關的問題
jdk版本 | 實現(xiàn) |
---|---|
1.8之前 | 數(shù)組+鏈表 |
1.8 | 數(shù)組+鏈表+紅黑樹 |
成員變量及常量
/**
*初始化容量(必須是二的n次冪)
*/
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
/**
*集合最大容量(必須是二的冪)
*/
static final int MAXIMUM_CAPACITY = 1 << 30;
/**
*默認負載因子常量
*/
static final float DEFAULT_LOAD_FACTOR = 0.75f;
/**
*放棄鏈表而使用紅黑樹的閾值,即鏈表轉用紅黑樹的閾值(轉紅黑樹條件之一 1/2)
*/
static final int TREEIFY_THRESHOLD = 8;
/**
*放棄紅黑樹而使用鏈表共啃,即鏈表的值小于6會由紅黑樹轉回鏈表
*/
static final int UNTREEIFY_THRESHOLD = 6;
/**
*當整個hashMap中元素數(shù)量大于64時,且鏈表的值超過8會轉用紅黑樹(轉紅黑樹條件之一 2/2)
*/
static final int MIN_TREEIFY_CAPACITY = 64;
/**
*儲存元素的數(shù)組(必須是二的冪)
*/
transient Node<K,V>[] table;
/**
*存放緩存
*/
transient Set<Map.Entry<K,V>> entrySet;
/**
*map中元素的數(shù)量
*/
transient int size;
/**
*該map修改的次數(shù)
*/
transient int modCount;
/**
*擴容的臨界值
*/
int threshold;
/**
*hash表的負載因子
*/
final float loadFactor;
初始化
先來看看它的構造方法
- HashMap(int initialCapacity, float loadFactor);
自定義初始容量及負載因子
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
}
- HashMap(int initialCapacity);
自定義初始容量暂题,使用默認負載因子 0.75f
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
- HashMap();
最常用的構造方法移剪,默認負載因為0.75f,默認初始化容量 1<<<4
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
- HashMap(Map<? extends K, ? extends V> m); 接收一個Map類型的集合
public HashMap(Map<? extends K, ? extends V> m) {
this.loadFactor = DEFAULT_LOAD_FACTOR;
putMapEntries(m, false);
}
原來想著重看看使用最多的第三個構造方法薪者,貌似它給負載因子賦了個值然后啥都沒干纵苛,算了,跳過
重要內(nèi)部類
鏈表
這個只有next
言津,并沒有prev
攻人,它是個單向鏈表
static class Node<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Node<K,V> next;
Node(int hash, K key, V value, Node<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
}
紅黑樹
紅黑樹的實現(xiàn),內(nèi)容有點多悬槽,有興趣的同學可以去研究下怀吻,我們只要知道它查詢效率高于鏈表,以及紅黑樹與鏈表轉換條件就行
static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
TreeNode<K,V> parent; // red-black tree links
TreeNode<K,V> left;
TreeNode<K,V> right;
TreeNode<K,V> prev; // needed to unlink next upon deletion
boolean red;
TreeNode(int hash, K key, V val, Node<K,V> next) {
super(hash, key, val, next);
}
/**
* Returns root of tree containing this node.
*/
final TreeNode<K,V> root() {
for (TreeNode<K,V> r = this, p;;) {
if ((p = r.parent) == null)
return r;
r = p;
}
}
}
畫圖理解下:
HashMap ↓
我大致畫了個圖初婆,里面有個hash桶(非要說它是個橢圓也行)蓬坡,到目前為止猿棉,可以大致了解HashMap的結構了,即:
==數(shù)組(transient Node<K,V>[] table)+鏈表(Node<K,V> )+紅黑樹(TreeNode<K,V>)==
當然屑咳,在一個HashMap實例中萨赁,同一個桶(也可以說同一個數(shù)組下標中)不會既存在鏈表又存在紅黑樹結構,他們會在==鏈表長度變化時互相轉換==兆龙。
使用
存放 PUT
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
這里它用到了hash(key)這個方法杖爽,我們先來看看hash做了什么事
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
先給忘了java位運算的同學回憶下:
-
==^==:亦或運算,即==相同取0,不同則取1==
3^4: 0011 0100 --------- 0111 結果:7
-
==>>>==:無符號右移,即忽略符號右移
注意:無符號右移:高位補0; 有符號右移:正數(shù)高位補0详瑞,負數(shù)高位補1 3>>>2: 0011 0000 --------- 0000 結果:0 -3>>>2: 11111111 11111111 11111111 11111101 00111111 11111111 11111111 11111111 ----------------------------------- 1073741823
int是32位的掂林,上面正數(shù)只寫了4位是為了方便,不要糾結
可以看出坝橡,hash的結果就是==key的hashCode與key無符號右移16位的結果進行亦或運算==泻帮,為什么這么做呢?這樣可以提高hash的離散性,減少hash碰撞计寇,從而提高效率
擴容
final Node<K,V>[] resize() {
//舊表(舊數(shù)組)
Node<K,V>[] oldTab = table;
//舊數(shù)組長度
int oldCap = (oldTab == null) ? 0 : oldTab.length;
//舊的擴容臨界值 默認是負載因子 0.75*初始長度16
int oldThr = threshold;
//定義新的數(shù)組長度锣杂,新的擴容閾值
int newCap, newThr = 0;
//如果舊數(shù)組初始化過
if (oldCap > 0) {
//如果舊數(shù)組長度已經(jīng)不小于集合最大容量,則不能擴容
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
//如果新的數(shù)組擴容一倍后小于設定的最大容量番宁,且舊數(shù)組長度不小于16元莫,則擴容一倍,且新擴容閾值也增大一倍
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
//如果舊數(shù)組還未被初始化且有擴容閾值蝶押,則新的數(shù)組長度取舊的擴容閾值
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
//舊數(shù)組踱蠢、舊擴容閾值均為0,則取默認值(16,16*0.75)給新的數(shù)組
else { // zero initial threshold signifies using defaults
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
//如果新的擴容閾值為0棋电,則用數(shù)組長度*負載因子(默認0.75f)
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
//給擴容閾值重新賦值
threshold = newThr;
//定義新的數(shù)組
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
//給成員變量table賦值
table = newTab;
if (oldTab != null) {
//遍歷舊數(shù)組
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
//如果下標為j的桶節(jié)點不為null茎截,賦值給e
if ((e = oldTab[j]) != null) {
//設置舊的節(jié)點指向null
oldTab[j] = null;
//如果只存在一個節(jié)點直接計算該節(jié)點中的元素在新的table中的位置并賦值
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
//如果該桶中放的是一個紅黑樹,則進行拆分(涉及到紅黑樹轉鏈表)
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
//如果該桶中放的是鏈表
else {
//擴容后赶盔,一個鏈表均勻分布到高區(qū)與低區(qū)
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
/**
*e.hash & oldCap 保證了50%的幾率將所有元素放置到高企锌、低區(qū)
*e.hash xxxx xxxx xxxx xxxx
*oldCap 0000 0000 0100 0000 (由于它是2個冪,所以一定是0100這樣的格式于未,即只存在一個1)
*結果 取決于e.hash本身與oldCap對應位置的數(shù)據(jù)為0還是1
/
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
//設置低撕攒、高區(qū)節(jié)點頭部和尾部
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
注意:鏈表數(shù)據(jù)擴容時,用(e.hash & oldCap) == 0
來將舊的數(shù)組數(shù)據(jù)==平均地==分布在新的數(shù)組中烘浦,分==高區(qū)==與==低區(qū)==
添加(put)
我們先來看看它的方法
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
//如果容器尚未初始化抖坪,則初始化
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//計算該元素的位置,如果該位置沒數(shù)據(jù)谎倔,則直接放入一個新的鏈表對象并存入該元素
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
//hash碰撞后的處理
Node<K,V> e; K k;
//如果之前存在與該元素key相同的元素柳击,則替換之前的元素!F啊捌肴!暫時跳過,后面會替換(注意:這里要先判斷hash碼是否相等藕咏,所以兩個元素equals時状知,放入同一個map不一定會被替換)
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//如果桶的數(shù)據(jù)p是紅黑樹,則執(zhí)行放入紅黑樹的邏輯
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
//如果下一個節(jié)點為null孽查,則直接放入
p.next = newNode(hash, key, value, null);
//如果此時節(jié)點長度達到了轉紅黑樹的閾值(為什么是8-1=7饥悴?因為放入了當前這個元素,長度就達到了8)盲再,則進行紅黑樹的轉換判斷西设,是擴容?(MIN_TREEIFY_CAPACITY=64 記得這個參數(shù)嗎答朋?map長度如果小于64則擴容)還是轉紅黑樹贷揽?(TREEIFY_THRESHOLD達到了8與map長度達到MIN_TREEIFY_CAPACITY 64)
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
//遍歷到一樣的元素,也進行替換C瓮搿G菪鳌!暫時跳過洪规,后面會替換
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
//遍歷完后e還有值印屁,說明遇到了需要替換的元素
if (e != null) { // existing mapping for key
V oldValue = e.value;
//如果onlyIfAbsent為false或者舊值為null,則替換舊值斩例,所以參數(shù)onlyIfAbsent的意思就是雄人,當舊值存在時,遇到一樣的元素念赶,是否進行替換础钠,默認為false,就是要替換
if (!onlyIfAbsent || oldValue == null)
e.value = value;
//將新put的元素移動到最后一個節(jié)點晶乔,我感覺這里應該是用來更新元素的年齡珍坊,有點像jvm中老年代的感覺
afterNodeAccess(e);
return oldValue;
}
}
//修改次數(shù)+1
++modCount;
//擴容判斷
if (++size > threshold)
resize();
//根據(jù)傳入?yún)?shù)判斷是否移除該鏈表(紅黑樹)中最老的節(jié)點
afterNodeInsertion(evict);
return null;
}
大概就是這么回事兒,我覺得主要應該關注有一下幾點
1.當發(fā)生hash碰撞時它做了什么事正罢?
根據(jù)入?yún)nlyIfAbsent(默認false)判斷(如果舊值為null則直接替換)是否替換阵漏,如果為false則替換之前的元素
2.為什么要將新加入的元素放置在鏈表尾端?(紅黑樹也繼承于Node)
我猜想應該是將新舊元素進行排序翻具,最舊的在head履怯,而最新的在tail
獲取(Get)
public V get(Object key) {
Node<K,V> e;
return (e = getNode(hash(key), key)) == null ? null : e.value;
}
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
//判斷map是否為空
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
//檢查第一個節(jié)點是否命中
if (first.hash == hash && // always check first node
((k = first.key) == key || (key != null && key.equals(k))))
return first;
//循環(huán)檢查下一個節(jié)點
if ((e = first.next) != null) {
//紅黑樹遍歷
if (first instanceof TreeNode)
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
//鏈表遍歷
do {
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}
移除(remove)
public V remove(Object key) {
Node<K,V> e;
return (e = removeNode(hash(key), key, null, false, true)) == null ?
null : e.value;
}
final Node<K,V> removeNode(int hash, Object key, Object value,
boolean matchValue, boolean movable) {
Node<K,V>[] tab; Node<K,V> p; int n, index;
//判斷該key對應節(jié)點是否存在
if ((tab = table) != null && (n = tab.length) > 0 &&
(p = tab[index = (n - 1) & hash]) != null) {
Node<K,V> node = null, e; K k; V v;
//直接定位到下標 (n - 1) & hash 的桶,并判斷頭部節(jié)點是否命中
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
node = p;
else if ((e = p.next) != null) {
//紅黑樹遍歷查找
if (p instanceof TreeNode)
node = ((TreeNode<K,V>)p).getTreeNode(hash, key);
else {
//鏈表遍歷查找
do {
if (e.hash == hash &&
((k = e.key) == key ||
(key != null && key.equals(k)))) {
node = e;
break;
}
p = e;
} while ((e = e.next) != null);
}
}
//根據(jù)傳入?yún)?shù)判定值 value
if (node != null && (!matchValue || (v = node.value) == value ||
(value != null && value.equals(v)))) {
//移除紅黑樹中的節(jié)點
if (node instanceof TreeNode)
((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
//移除鏈表中的節(jié)點
else if (node == p)
tab[index] = node.next;
else
p.next = node.next;
++modCount;
--size;
afterNodeRemoval(node);
return node;
}
}
return null;
}
hash
在hashMap中大量使用了hash
- 計算key的hash值時裆泳,==(key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16)==;
- 計算數(shù)據(jù)存放位置時,==e.hash & (newCap - 1)==
相關問題
1.為什么HashMap容量需要2的冪叹洲?
在計算桶的位置時,會通過hash&(size-1)來確定該map在數(shù)組中的下標工禾,這里設計size(HashMap)的容量运提,就是為了在運算時蝗柔,保證size-1在做位運算時,永遠以...1111結尾民泵,即:
hash: xxxx xxxx 0101
size-1: 0000 0000 1111
結果: 0000 0000 0101 = 5
HashMap就是通過這種方式來保證元素的均勻分布
2.HashMap線程不安全主要是在哪個地方癣丧?
HashMap的不安全主要體現(xiàn)在兩個地方:
ps:jdk1.7之前在多線程環(huán)境下,擴容的時候栈妆,鏈表可能會行成一個閉環(huán)胁编,當我們在查詢一個不存在的key調(diào)用get()時,遍歷鏈表進入死循環(huán)鳞尔,但是1.8已經(jīng)不存在這個問題了嬉橙,原因就是jdk1.7對鏈表元素進行了一次倒序處理,而jdk1.8中使用了正序處理寥假。
1市框、數(shù)據(jù)丟失
2、size()不準確
原因的話昧旨,可以參考大佬寫的:https://blog.csdn.net/fumitzuki/article/details/82760236
3.為什么重寫equals時一定要重寫hashCode?
其實從我們了解了HashMap源碼后拾给,就能從這個角度來解釋這個問題,打個比方兔沃,如果一個對象O重寫equals但是并未重寫hashCode蒋得,在存放到HashMap時及操作HashMap時均會出現(xiàn)一系列問題;
put:由于未重寫hashCode乒疏,在我們存入對象時额衙,兩個equals的對象hashCode可能是不等的,那么在通過 e.hash & (newCap - 1) 計算元素位置時怕吴,極有可能放置到不同的地方窍侧,即map中會存放兩個我們認為是一樣的對象;就算過了第一關转绷,hash計算出來的位置相等伟件,也會在插入同一個鏈表時,判斷兩個元素相等议经,HashMap中的邏輯是先判斷hashCode是否相等斧账,所以還是存放了兩個我們認為一樣的對象。
get:取的時候煞肾,也會根據(jù)hashCode計算位置咧织,所以我們?nèi)〕鰜淼膶ο蠛芸赡懿皇俏覀冃枰哪且粋€,當然了remove也是一樣的道理
作者能力有限籍救,如果大家發(fā)現(xiàn)有不對的地方或者疑問习绢,歡迎指正,大家一起進步蝙昙!3q