本文準(zhǔn)備從以下幾個(gè)方面去講解HashMap:
1)HashMap源碼詳細(xì)分析
2)HashMap為什么是線程不安全的细燎?
3)HashMap和HashTable的區(qū)別
4)1.7和1.8的HashMap實(shí)現(xiàn)區(qū)別總結(jié)
HashMap源碼分析
一、構(gòu)造函數(shù)
讓我們先從構(gòu)造函數(shù)說起,HashMap有四個(gè)構(gòu)造方法,別慌
1.1 HashMap()
// 1.無參構(gòu)造方法辖佣、
// 構(gòu)造一個(gè)空的HashMap矛渴,初始容量為16,負(fù)載因子為0.75
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
無參構(gòu)造方法就沒什么好說的了净刮。
1.2 HashMap(int initialCapacity)
// 2.構(gòu)造一個(gè)初始容量為initialCapacity,負(fù)載因子為0.75的空的HashMap茧球,
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
HashMap(int initialCapacity)
這個(gè)構(gòu)造方法調(diào)用了1.3中的構(gòu)造方法庭瑰。
1.3 HashMap(int initialCapacity, float loadFactor)
// 3.構(gòu)造一個(gè)空的初始容量為initialCapacity,負(fù)載因子為loadFactor的HashMap
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
}
//最大容量
//static final int MAXIMUM_CAPACITY = 1 << 30;
當(dāng)指定的初始容量< 0時(shí)拋出IllegalArgumentException
異常抢埋,當(dāng)指定的初始容量> MAXIMUM_CAPACITY
時(shí)弹灭,就讓初始容量 = MAXIMUM_CAPACITY
督暂。當(dāng)負(fù)載因子小于0或者不是數(shù)字時(shí),拋出IllegalArgumentException異常
穷吮。
設(shè)定threshold
逻翁。 這個(gè)threshold = capacity * load factor 。當(dāng)HashMap的size到了threshold時(shí)捡鱼,就要進(jìn)行resize八回,也就是擴(kuò)容。
tableSizeFor()
的主要功能是返回一個(gè)比給定整數(shù)大且最接近的2的冪次方整數(shù)驾诈,如給定10缠诅,返回2的4次方16.
我們進(jìn)入tableSizeFor(int cap)
的源碼中看看:
//Returns a power of two size for the given target capacity.
static final int tableSizeFor(int cap) {
int n = cap - 1;
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}
note: HashMap要求容量必須是2的冪。
首先乍迄,int n = cap -1
是為了防止cap已經(jīng)是2的冪時(shí)管引,執(zhí)行完后面的幾條無符號(hào)右移操作之后,返回的capacity是這個(gè)cap的2倍闯两,因?yàn)閏ap已經(jīng)是2的冪了褥伴,就已經(jīng)滿足條件了。 如果不懂可以往下看完幾個(gè)無符號(hào)移位后再回來看漾狼。(建議自己在紙上畫一下)
- 如果n這時(shí)為0了(經(jīng)過了cap-1之后)重慢,則經(jīng)過后面的幾次無符號(hào)右移依然是0,最后返回的capacity是1(最后有個(gè)n+1的操作)逊躁。這里只討論n不等于0的情況似踱。
以16位為例,假設(shè)開始時(shí) n 為 0000 1xxx xxxx xxxx (x代表不關(guān)心0還是1)
-
第一次右移
n |= n >>> 1;
由于n不等于0志衣,則n的二進(jìn)制表示中總會(huì)有一bit為1屯援,這時(shí)考慮最高位的1。通過無符號(hào)右移1位念脯,則將最高位的1右移了1位,再做或操作弯淘,使得n的二進(jìn)制表示中與最高位的1緊鄰的右邊一位也為1,如0000 11xx xxxx xxxx 。
-
第二次右移
n |= n >>> 2;
注意授滓,這個(gè)n已經(jīng)經(jīng)過了
n |= n >>> 1;
操作怯伊。此時(shí)n為0000 11xx xxxx xxxx ,則n無符號(hào)右移兩位态鳖,會(huì)將最高位兩個(gè)連續(xù)的1右移兩位转培,然后再與原來的n做或操作,這樣n的二進(jìn)制表示的高位中會(huì)有4個(gè)連續(xù)的1浆竭。如0000 1111 xxxx xxxx 浸须。 -
第三次右移
n |= n >>> 4;
這次把已經(jīng)有的高位中的連續(xù)的4個(gè)1惨寿,右移4位,再做或操作删窒,這樣n的二進(jìn)制表示的高位中會(huì)有8個(gè)連續(xù)的1裂垦。如0000 1111 1111 xxxx 。
第肌索。蕉拢。。诚亚,你還忍心讓我繼續(xù)推么晕换?相信聰明的你已經(jīng)想出來了,容量最大也就是32位的正數(shù)站宗,所以最后一次 n |= n >>> 16;
可以保證最高位后面的全部置為1闸准。當(dāng)然如果是32個(gè)1的話,此時(shí)超出了MAXIMUM_CAPACITY
份乒,所以取值到 MAXIMUM_CAPACITY
恕汇。
從https://blog.csdn.net/huzhigenlaohu/article/details/51802457這篇博客中找了張示例圖:
注意,得到的這個(gè)capacity卻被賦值給了threshold或辖。 這里我和這篇博客的博主開始的想法一樣瘾英,認(rèn)為應(yīng)該這么寫:this.threshold = tableSizeFor(initialCapacity) * this.loadFactor;
因?yàn)檫@樣子才符合threshold的定義:threshold = capacity * load factor 。但是颂暇,請(qǐng)注意缺谴,在構(gòu)造方法中,并沒有對(duì)table這個(gè)成員變量進(jìn)行初始化耳鸯,table的初始化被推遲到了put方法中湿蛔,在put方法中會(huì)對(duì)threshold重新計(jì)算 。
我說一下我在理解這個(gè)tableSizeFor函數(shù)中間遇到的坑吧县爬,我在想如果n=-1時(shí)的情況阳啥,因?yàn)槌跏既萘靠梢詡鬟M(jìn)來0。我將n= -1 和下面幾條運(yùn)算一起新寫了個(gè)測(cè)試程序财喳,發(fā)現(xiàn)輸出都是 -1察迟。 這是因?yàn)橛?jì)算機(jī)中數(shù)字是由補(bǔ)碼存儲(chǔ)的,-1的補(bǔ)碼是 0xffffffff耳高。所以無符號(hào)右移之后再進(jìn)行或運(yùn)算之后還是 -1扎瓶。 那我想如果就無符號(hào)右移呢? 比如-1>>>10泌枪。聽我娓娓道來概荷,32個(gè)1無符號(hào)右移10位后,高10位為0碌燕,低22位為1误证,此時(shí)這個(gè)數(shù)變成了正數(shù)继薛,由于正數(shù)的補(bǔ)碼和原碼相同,所以就變成了0x3FFFFF即10進(jìn)制的4194303雷厂。真刺激惋增。
好開森,這個(gè)構(gòu)造方法我們算是拿下了改鲫。怎么樣诈皿,我猜你現(xiàn)在一定很激動(dòng),Hey像棘,old Fe稽亏,這才剛開始。接下來看最后一個(gè)構(gòu)造方法缕题。
1.4 HashMap(Map<? extends K, ? extends V> m)
// 4\. 構(gòu)造一個(gè)和指定Map有相同mappings的HashMap截歉,初始容量能充足的容下指定的Map,負(fù)載因子為0.75
public HashMap(Map<? extends K, ? extends V> m) {
this.loadFactor = DEFAULT_LOAD_FACTOR;
putMapEntries(m, false);
}
套路,直接看 putMapEntries(m,false)
烟零。源碼如下:
/**
* 將m的所有元素存入本HashMap實(shí)例中
*/
final void putMapEntries(Map<? extends K, ? extends V> m, boolean evict) {
//得到 m 中元素的個(gè)數(shù)
int s = m.size();
//當(dāng) m 中有元素時(shí)瘪松,則需將map中元素放入本HashMap實(shí)例。
if (s > 0) {
// 判斷table是否已經(jīng)初始化锨阿,如果未初始化宵睦,則先初始化一些變量。(table初始化是在put時(shí))
if (table == null) { // pre-size
// 根據(jù)待插入的map 的 size 計(jì)算要?jiǎng)?chuàng)建的 HashMap 的容量墅诡。
float ft = ((float)s / loadFactor) + 1.0F;
int t = ((ft < (float)MAXIMUM_CAPACITY) ?
(int)ft : MAXIMUM_CAPACITY);
// 把要?jiǎng)?chuàng)建的 HashMap 的容量存在 threshold 中
if (t > threshold)
threshold = tableSizeFor(t);
}
// 如果table初始化過壳嚎,因?yàn)閯e的函數(shù)也會(huì)調(diào)用它,所以有可能HashMap已經(jīng)被初始化過了末早。
// 判斷待插入的 map 的 size,若 size 大于 threshold烟馅,則先進(jìn)行 resize(),進(jìn)行擴(kuò)容
else if (s > threshold)
resize();
//然后就開始遍歷 帶插入的 map 然磷,將每一個(gè) <Key ,Value> 插入到本HashMap實(shí)例郑趁。
for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
K key = e.getKey();
V value = e.getValue();
// put(K,V)也是調(diào)用 putVal 函數(shù)進(jìn)行元素的插入
putVal(hash(key), key, value, false, evict);
}
}
}
介紹putVal方法前,說一下HashMap的幾個(gè)重要的成員變量:
/**
* The table, initialized on first use, and resized as
* necessary. When allocated, length is always a power of two.
* (We also tolerate length zero in some operations to allow
* bootstrapping mechanics that are currently not needed.)
*/
//實(shí)際存儲(chǔ)key姿搜,value的數(shù)組穿撮,只不過key,value被封裝成Node了
transient Node<K,V>[] table;
/**
* The number of key-value mappings contained in this map.
*/
transient int size;
/**
* The number of times this HashMap has been structurally modified
* Structural modifications are those that change the number of mappings in
* the HashMap or otherwise modify its internal structure (e.g.,
* rehash). This field is used to make iterators on Collection-views of
* the HashMap fail-fast. (See ConcurrentModificationException).
*/
transient int modCount;
/**
* The next size value at which to resize (capacity * load factor).
*
* @serial
*/
// (The javadoc description is true upon serialization.
// Additionally, if the table array has not been allocated, this
// field holds the initial array capacity, or zero signifying
// DEFAULT_INITIAL_CAPACITY.)
//因?yàn)?tableSizeFor(int) 返回值給了threshold
int threshold;
/**
* The load factor for the hash table.
*
* @serial
*/
final float loadFactor;
其實(shí)就是哈希表痪欲。HashMap使用鏈表法避免哈希沖突(相同hash值),當(dāng)鏈表長(zhǎng)度大于TREEIFY_THRESHOLD(默認(rèn)為8)時(shí)攻礼,將鏈表轉(zhuǎn)換為紅黑樹业踢,當(dāng)然小于UNTREEIFY_THRESHOLD(默認(rèn)為6)時(shí),又會(huì)轉(zhuǎn)回鏈表以達(dá)到性能均衡礁扮。 我們看一張HashMap的數(shù)據(jù)結(jié)構(gòu)(數(shù)組+鏈表+紅黑樹 )就更能理解table了:
再回到putMapEntries函數(shù)中知举,如果table為null瞬沦,那么這時(shí)就設(shè)置合適的threshold,如果不為空并且指定的map的size>threshold雇锡,那么就resize()逛钻。然后把指定的map的所有Key,Value锰提,通過putVal添加到我們創(chuàng)建的新的map中曙痘。
putVal中傳入了個(gè)hash(key),那我們就先來看看hash(key):
/**
* key 的 hash值的計(jì)算是通過hashCode()的高16位異或低16位實(shí)現(xiàn)的:(h = k.hashCode()) ^ (h >>> 16)
* 主要是從速度立肘、功效边坤、質(zhì)量來考慮的,這么做可以在數(shù)組table的length比較小的時(shí)候
* 也能保證考慮到高低Bit都參與到Hash的計(jì)算中谅年,同時(shí)不會(huì)有太大的開銷
*/
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
異或運(yùn)算:(h = key.hashCode()) ^ (h >>> 16)
原 來 的 hashCode : 1111 1111 1111 1111 0100 1100 0000 1010
移位后的hashCode: 0000 0000 0000 0000 1111 1111 1111 1111
進(jìn)行異或運(yùn)算 結(jié)果:1111 1111 1111 1111 1011 0011 1111 0101
這樣做的好處是茧痒,可以將hashcode高位和低位的值進(jìn)行混合做異或運(yùn)算,而且混合后融蹂,低位的信息中加入了高位的信息旺订,這樣高位的信息被變相的保留了下來。摻雜的元素多了超燃,那么生成的hash值的隨機(jī)性會(huì)增大区拳。
剛才我們漏掉了resize()和putVal() 兩個(gè)函數(shù),現(xiàn)在我們按順序分析一波:
首先resize()
,先看一下哪些函數(shù)調(diào)用了resize()
淋纲,從而在整體上有個(gè)概念:
接下來上源碼:
final Node<K,V>[] resize() {
// 保存當(dāng)前table
Node<K,V>[] oldTab = table;
// 保存當(dāng)前table的容量
int oldCap = (oldTab == null) ? 0 : oldTab.length;
// 保存當(dāng)前閾值
int oldThr = threshold;
// 初始化新的table容量和閾值
int newCap, newThr = 0;
/*
1\. resize()函數(shù)在size > threshold時(shí)被調(diào)用劳闹。oldCap大于 0 代表原來的 table 表非空,
oldCap 為原表的大小洽瞬,oldThr(threshold) 為 oldCap × load_factor
*/
if (oldCap > 0) {
// 若舊table容量已超過最大容量本涕,更新閾值為Integer.MAX_VALUE(最大整形值),這樣以后就不會(huì)自動(dòng)擴(kuò)容了伙窃。
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
// 容量翻倍菩颖,使用左移,效率更高
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
// 閾值翻倍
newThr = oldThr << 1; // double threshold
}
/*
2\. resize()函數(shù)在table為空被調(diào)用为障。oldCap 小于等于 0 且 oldThr 大于0晦闰,代表用戶創(chuàng)建了一個(gè) HashMap,但是使用的構(gòu)造函數(shù)為
HashMap(int initialCapacity, float loadFactor) 或 HashMap(int initialCapacity)
或 HashMap(Map<? extends K, ? extends V> m)鳍怨,導(dǎo)致 oldTab 為 null呻右,oldCap 為0, oldThr 為用戶指定的 HashMap的初始容量鞋喇。
*/
else if (oldThr > 0) // initial capacity was placed in threshold
//當(dāng)table沒初始化時(shí)声滥,threshold持有初始容量。還記得threshold = tableSizeFor(t)么;
newCap = oldThr;
/*
3\. resize()函數(shù)在table為空被調(diào)用侦香。oldCap 小于等于 0 且 oldThr 等于0落塑,用戶調(diào)用 HashMap()構(gòu)造函數(shù)創(chuàng)建的 HashMap纽疟,所有值均采用默認(rèn)值,oldTab(Table)表為空憾赁,oldCap為0污朽,oldThr等于0,
*/
else { // zero initial threshold signifies using defaults
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
// 新閾值為0
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
// 初始化table
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;
if (oldTab != null) {
// 把 oldTab 中的節(jié)點(diǎn) reHash 到 newTab 中去
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
// 若節(jié)點(diǎn)是單個(gè)節(jié)點(diǎn)龙考,直接在 newTab 中進(jìn)行重定位
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
// 若節(jié)點(diǎn)是 TreeNode 節(jié)點(diǎn)蟆肆,要進(jìn)行 紅黑樹的 rehash 操作
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
// 若是鏈表,進(jìn)行鏈表的 rehash 操作
else { // preserve order
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
// 將同一桶中的元素根據(jù)(e.hash & oldCap)是否為0進(jìn)行分割(代碼后有圖解洲愤,可以回過頭再來看)颓芭,分成兩個(gè)不同的鏈表,完成rehash
do {
next = e.next;
// 根據(jù)算法 e.hash & oldCap 判斷節(jié)點(diǎn)位置rehash 后是否發(fā)生改變
//最高位==0柬赐,這是索引不變的鏈表亡问。
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
//最高位==1 (這是索引發(fā)生改變的鏈表)
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) { // 原bucket位置的尾指針不為空(即還有node)
loTail.next = null; // 鏈表最后得有個(gè)null
newTab[j] = loHead; // 鏈表頭指針放在新桶的相同下標(biāo)(j)處
}
if (hiTail != null) {
hiTail.next = null;
// rehash 后節(jié)點(diǎn)新的位置一定為原來基礎(chǔ)上加上 oldCap,具體解釋看下圖
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
}
引自美團(tuán)點(diǎn)評(píng)技術(shù)博客肛宋。我們使用的是2次冪的擴(kuò)展(指長(zhǎng)度擴(kuò)為原來2倍)州藕,所以,元素的位置要么是在原位置酝陈,要么是在原位置再移動(dòng)2次冪的位置床玻。看下圖可以明白這句話的意思沉帮,n為table的長(zhǎng)度锈死,圖(a)表示擴(kuò)容前的key1和key2兩種key確定索引位置的示例,圖(b)表示擴(kuò)容后key1和key2兩種key確定索引位置的示例穆壕,其中hash1是key1對(duì)應(yīng)的哈希與高位運(yùn)算結(jié)果待牵。
元素在重新計(jì)算hash之后,因?yàn)閚變?yōu)?倍喇勋,那么n-1的mask范圍在高位多1bit(紅色)缨该,因此新的index就會(huì)發(fā)生這樣的變化:
因此,我們?cè)跀U(kuò)充HashMap的時(shí)候川背,只需要看看原來的hash值新增的那個(gè)bit是1還是0就好了贰拿,是0的話索引沒變,是1的話索引變成“原索引+oldCap”熄云,可以看看下圖為16擴(kuò)充為32的resize示意圖 :
什么時(shí)候擴(kuò)容:通過HashMap源碼可以看到是在put操作時(shí)膨更,即向容器中添加元素時(shí),判斷當(dāng)前容器中元素的個(gè)數(shù)是否達(dá)到閾值(當(dāng)前數(shù)組長(zhǎng)度乘以加載因子的值)的時(shí)候缴允,就要自動(dòng)擴(kuò)容了询一。
擴(kuò)容(resize):其實(shí)就是重新計(jì)算容量;而這個(gè)擴(kuò)容是計(jì)算出所需容器的大小之后重新定義一個(gè)新的容器,將原來容器中的元素放入其中健蕊。
resize()
告一段落,接下來看 putVal()
踢俄。
上源碼:
//實(shí)現(xiàn)put和相關(guān)方法缩功。
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
//如果table為空或者長(zhǎng)度為0,則resize()
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//確定插入table的位置都办,算法是(n - 1) & hash嫡锌,在n為2的冪時(shí),相當(dāng)于取摸操作琳钉。
////找到key值對(duì)應(yīng)的槽并且是第一個(gè)势木,直接加入
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
//在table的i位置發(fā)生碰撞,有兩種情況歌懒,1啦桌、key值是一樣的,替換value值及皂,
//2甫男、key值不一樣的有兩種處理方式:2.1、存儲(chǔ)在i位置的鏈表验烧;2.2板驳、存儲(chǔ)在紅黑樹中
else {
Node<K,V> e; K k;
//第一個(gè)node的hash值即為要加入元素的hash
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//2.2
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
//2.1
else {
//不是TreeNode,即為鏈表,遍歷鏈表
for (int binCount = 0; ; ++binCount) {
///鏈表的尾端也沒有找到key值相同的節(jié)點(diǎn),則生成一個(gè)新的Node,
//并且判斷鏈表的節(jié)點(diǎn)個(gè)數(shù)是不是到達(dá)轉(zhuǎn)換成紅黑樹的上界達(dá)到碍拆,則轉(zhuǎn)換成紅黑樹若治。
if ((e = p.next) == null) {
// 創(chuàng)建鏈表節(jié)點(diǎn)并插入尾部
p.next = newNode(hash, key, value, null);
////超過了鏈表的設(shè)置長(zhǎng)度8就轉(zhuǎn)換成紅黑樹
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
//如果e不為空就替換舊的oldValue值
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
注:hash 沖突發(fā)生的幾種情況:
1.兩節(jié)點(diǎn)key 值相同(hash值一定相同),導(dǎo)致沖突感混;
2.兩節(jié)點(diǎn)key 值不同端幼,由于 hash 函數(shù)的局限性導(dǎo)致hash 值相同,沖突浩习;
3.兩節(jié)點(diǎn)key 值不同静暂,hash 值不同,但 hash 值對(duì)數(shù)組長(zhǎng)度取模后相同谱秽,沖突洽蛀;
相比put方法,get方法就比較簡(jiǎn)單疟赊,這里就不說了郊供。
1.7和1.8的HashMap的不同點(diǎn)
(1)JDK1.7用的是頭插法,而JDK1.8及之后使用的都是尾插法近哟,那么為什么要這樣做呢驮审?因?yàn)镴DK1.7是用單鏈表進(jìn)行的縱向延伸,當(dāng)采用頭插法就是能夠提高插入的效率,但是也會(huì)容易出現(xiàn)逆序且環(huán)形鏈表死循環(huán)問題疯淫。但是在JDK1.8之后是因?yàn)榧尤肓思t黑樹使用尾插法地来,能夠避免出現(xiàn)逆序且鏈表死循環(huán)的問題。
(2)擴(kuò)容后數(shù)據(jù)存儲(chǔ)位置的計(jì)算方式也不一樣:
- 在JDK1.7的時(shí)候是直接用hash值和需要擴(kuò)容的二進(jìn)制數(shù)進(jìn)行&(這里就是為什么擴(kuò)容的時(shí)候?yàn)樯兑欢ū仨毷?的多少次冪的原因所在熙掺,因?yàn)槿绻挥?的n次冪的情況時(shí)最后一位二進(jìn)制數(shù)才一定是1未斑,這樣能最大程度減少hash碰撞)(hash值 & length-1) 。
- 而在JDK1.8的時(shí)候直接用了JDK1.7的時(shí)候計(jì)算的規(guī)律币绩,也就是擴(kuò)容前的原始位置+擴(kuò)容的大小值=JDK1.8的計(jì)算方式蜡秽,而不再是JDK1.7的那種異或的方法。但是這種方式就相當(dāng)于只需要判斷Hash值的新增參與運(yùn)算的位是0還是1就直接迅速計(jì)算出了擴(kuò)容后的儲(chǔ)存方式缆镣。
(3)JDK1.7的時(shí)候使用的是數(shù)組+ 單鏈表的數(shù)據(jù)結(jié)構(gòu)芽突。但是在JDK1.8及之后時(shí),使用的是數(shù)組+鏈表+紅黑樹的數(shù)據(jù)結(jié)構(gòu)(當(dāng)鏈表的深度達(dá)到8的時(shí)候董瞻,也就是默認(rèn)閾值寞蚌,就會(huì)自動(dòng)擴(kuò)容把鏈表轉(zhuǎn)成紅黑樹的數(shù)據(jù)結(jié)構(gòu)來把時(shí)間復(fù)雜度從O(N)變成O(logN)提高了效率)。
HashMap為什么是線程不安全的力细?
HashMap 在并發(fā)時(shí)可能出現(xiàn)的問題主要是兩方面:
- put的時(shí)候?qū)е碌亩嗑€程數(shù)據(jù)不一致
比如有兩個(gè)線程A和B睬澡,首先A希望插入一個(gè)key-value對(duì)到HashMap中,首先計(jì)算記錄所要落到的 hash桶的索引坐標(biāo)眠蚂,然后獲取到該桶里面的鏈表頭結(jié)點(diǎn)煞聪,此時(shí)線程A的時(shí)間片用完了,而此時(shí)線程B被調(diào)度得以執(zhí)行逝慧,和線程A一樣執(zhí)行昔脯,只不過線程B成功將記錄插到了桶里面,假設(shè)線程A插入的記錄計(jì)算出來的 hash桶索引和線程B要插入的記錄計(jì)算出來的 hash桶索引是一樣的笛臣,那么當(dāng)線程B成功插入之后云稚,線程A再次被調(diào)度運(yùn)行時(shí),它依然持有過期的鏈表頭但是它對(duì)此一無所知沈堡,以至于它認(rèn)為它應(yīng)該這樣做静陈,如此一來就覆蓋了線程B插入的記錄,這樣線程B插入的記錄就憑空消失了诞丽,造成了數(shù)據(jù)不一致的行為鲸拥。 - resize而引起死循環(huán)
這種情況發(fā)生在HashMap自動(dòng)擴(kuò)容時(shí),當(dāng)2個(gè)線程同時(shí)檢測(cè)到元素個(gè)數(shù)超過 數(shù)組大小 × 負(fù)載因子僧免。此時(shí)2個(gè)線程會(huì)在put()方法中調(diào)用了resize()刑赶,兩個(gè)線程同時(shí)修改一個(gè)鏈表結(jié)構(gòu)會(huì)產(chǎn)生一個(gè)循環(huán)鏈表(JDK1.7中,會(huì)出現(xiàn)resize前后元素順序倒置的情況)懂衩。接下來再想通過get()獲取某一個(gè)元素撞叨,就會(huì)出現(xiàn)死循環(huán)金踪。
HashMap和HashTable的區(qū)別
HashMap和Hashtable都實(shí)現(xiàn)了Map接口,但決定用哪一個(gè)之前先要弄清楚它們之間的分別牵敷。主要的區(qū)別有:線程安全性胡岔,同步(synchronization),以及速度劣领。
- HashMap幾乎可以等價(jià)于Hashtable姐军,除了HashMap是非synchronized的,并可以接受null(HashMap可以接受為null的鍵值(key)和值(value)尖淘,而Hashtable則不行)。
- HashMap是非synchronized著觉,而Hashtable是synchronized村生,這意味著Hashtable是線程安全的,多個(gè)線程可以共享一個(gè)Hashtable饼丘;而如果沒有正確的同步的話趁桃,多個(gè)線程是不能共享HashMap的。Java 5提供了ConcurrentHashMap肄鸽,它是HashTable的替代卫病,比HashTable的擴(kuò)展性更好。
- 另一個(gè)區(qū)別是HashMap的迭代器(Iterator)是fail-fast迭代器典徘,而Hashtable的enumerator迭代器不是fail-fast的蟀苛。所以當(dāng)有其它線程改變了HashMap的結(jié)構(gòu)(增加或者移除元素),將會(huì)拋出ConcurrentModificationException逮诲,但迭代器本身的remove()方法移除元素則不會(huì)拋出ConcurrentModificationException異常帜平。但這并不是一個(gè)一定發(fā)生的行為,要看JVM梅鹦。這條同樣也是Enumeration和Iterator的區(qū)別裆甩。
- 由于Hashtable是線程安全的也是synchronized,所以在單線程環(huán)境下它比HashMap要慢齐唆。如果你不需要同步嗤栓,只需要單一線程,那么使用HashMap性能要好過Hashtable箍邮。
- HashMap不能保證隨著時(shí)間的推移Map中的元素次序是不變的茉帅。
需要注意的重要術(shù)語:
sychronized意味著在一次僅有一個(gè)線程能夠更改Hashtable。就是說任何線程要更新Hashtable時(shí)要首先獲得同步鎖媒殉,其它線程要等到同步鎖被釋放之后才能再次獲得同步鎖更新Hashtable担敌。
Fail-safe和iterator迭代器相關(guān)。如果某個(gè)集合對(duì)象創(chuàng)建了Iterator或者ListIterator廷蓉,然后其它的線程試圖“結(jié)構(gòu)上”更改集合對(duì)象全封,將會(huì)拋出ConcurrentModificationException異常马昙。但其它線程可以通過set()方法更改集合對(duì)象是允許的,因?yàn)檫@并沒有從“結(jié)構(gòu)上”更改集合刹悴。但是假如已經(jīng)從結(jié)構(gòu)上進(jìn)行了更改行楞,再調(diào)用set()方法,將會(huì)拋出IllegalArgumentException異常土匀。
結(jié)構(gòu)上的更改指的是刪除或者插入一個(gè)元素子房,這樣會(huì)影響到map的結(jié)構(gòu)。
HashMap可以通過下面的語句進(jìn)行同步:
Map m = Collections.synchronizeMap(hashMap);
轉(zhuǎn)載自:
http://www.reibang.com/p/ee0de4c99f87