簡(jiǎn)單分析一下HashMap的原理刺覆,put和get方法的原理黔州。
HashMap介紹
HashMap繼承Map接口碘橘,可以存放key苫纤、value鍵值對(duì)碉钠,可以在O(1)時(shí)間內(nèi)讀取數(shù)據(jù)。
(1)HashMap內(nèi)部由數(shù)組卷拘、單鏈表喊废、紅黑樹實(shí)現(xiàn)。
(2)通過(guò)計(jì)算key的Hash值并且和數(shù)組長(zhǎng)度取余操作來(lái)確定元素在數(shù)組中的位置栗弟。
(3)如果出現(xiàn)多個(gè)不同key需要放在數(shù)組中的相同位置(Hash碰撞)污筷,就使用單鏈表的形式將他們存放起來(lái)。
如果
(4)如果某個(gè)鏈表的長(zhǎng)度大于閾值乍赫,就將該鏈表轉(zhuǎn)化為紅黑樹
(5)如果存放數(shù)組的數(shù)量大于某個(gè)閾值瓣蛀,就會(huì)對(duì)數(shù)組擴(kuò)容(為了減少Hash碰撞陆蟆,提高效率),每次擴(kuò)容后數(shù)組的長(zhǎng)度都為原來(lái)的兩倍
HashMap的成員變量
HashMap的構(gòu)造方法
/**
* 設(shè)置默認(rèn)的容量和默認(rèn)的負(fù)載因子
*/
public HashMap(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal initial capacity: " +
initialCapacity);
if (initialCapacity > MAXIMUM_CAPACITY)
initialCapacity = MAXIMUM_CAPACITY;
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal load factor: " +
loadFactor);
this.loadFactor = loadFactor;
this.threshold = tableSizeFor(initialCapacity);
}
/**
* 設(shè)置默認(rèn)的容量和默認(rèn)的負(fù)載因子
*/
public HashMap(int initialCapacity) {
this(initialCapacity, DEFAULT_LOAD_FACTOR);
}
/**
* 設(shè)置默認(rèn)的負(fù)載因子
*/
public HashMap() {
this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}
/**
* 默認(rèn)的負(fù)載因子惋增,并設(shè)置初始值
* 如果需要的空間大于門限值叠殷,就對(duì)數(shù)組擴(kuò)容,然后將所有輸入插入數(shù)組中
*/
public HashMap(Map<? extends K, ? extends V> m) {
this.loadFactor = DEFAULT_LOAD_FACTOR;
int s = m.size();
if (s > 0) {
if (table == null) { // pre-size
float ft = ((float)s / loadFactor) + 1.0F;
int t = ((ft < (float)MAXIMUM_CAPACITY) ?
(int)ft : MAXIMUM_CAPACITY);
if (t > threshold)
threshold = tableSizeFor(t);
}
else if (s > threshold)
resize();
for (Map.Entry<? extends K, ? extends V> e : m.entrySet()) {
K key = e.getKey();
V value = e.getValue();
putVal(hash(key), key, value, false, evict);
}
}
}
在構(gòu)造方法中分別調(diào)用了resize()方法進(jìn)行擴(kuò)容诈皿,調(diào)用putVal(hash(key), key, value, false, evict)方法放置數(shù)據(jù)林束,這個(gè)兩個(gè)方法十分重要,我們接著看稽亏。
put(K key, V value)
放置數(shù)據(jù)的流程如下圖所示壶冒,重要的部分我都用紅色標(biāo)注了出來(lái)。
下面看源碼
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true); //使用hash(int)算法計(jì)算key的hash值
}
在put方法中首先使用hash(key)計(jì)算了key的hash值措左,然后調(diào)用putVal方法依痊。我們先看以下怎么計(jì)算key的hash值避除。
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
計(jì)算hash值是一個(gè)靜態(tài)方法怎披。
1.如果key==null,hash值是0瓶摆。
2.如果key不是null凉逛,將key.hashCode右移16位后與自身相與。(這樣的好處是1.計(jì)算后得到的hash值與原來(lái)32位都有關(guān)群井,減少了hash沖突的幾率状飞。2.位移和與運(yùn)算的計(jì)算效率很高)书斜。
計(jì)算得到key的hash值后诬辈,調(diào)用putVal(hash(key), key, value, false, true)方法將數(shù)據(jù)插入到hash表中。
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0) //如果table數(shù)組是空數(shù)組荐吉,給數(shù)組擴(kuò)容
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null) //hash&(n-1)是該數(shù)據(jù)在table數(shù)組中的位置焙糟。如果該位置沒有數(shù)據(jù),直接插入样屠。
tab[i] = newNode(hash, key, value, null);
else { //
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k)))) //如果key值和數(shù)組中鏈表頭部元素的key值相同穿撮。直接覆蓋。
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value); //如果元素是樹痪欲,使用紅黑樹遍歷結(jié)點(diǎn)并插入數(shù)據(jù)悦穿。
else {
for (int binCount = 0; ; ++binCount) { //如果元素是鏈表,遍歷鏈表业踢,如果有重復(fù)的key栗柒,覆蓋,否則知举,將數(shù)據(jù)插入到鏈表最后瞬沦。
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize(); //如果保存的節(jié)點(diǎn)數(shù)大于門限值深员,對(duì)數(shù)組擴(kuò)容。
afterNodeInsertion(evict);
return null;
}
上面的代碼有幾個(gè)重要的地方蛙埂。
1.使用計(jì)算得到hash值與數(shù)組容量n-1相與(也就是求余數(shù))倦畅,得到該元素在table中的位置。
2.如果遇到了key值相同的結(jié)點(diǎn)绣的,直接用新數(shù)據(jù)覆蓋舊的數(shù)據(jù)叠赐。
3.如果沒有key值相同的結(jié)點(diǎn),將新數(shù)據(jù)插入到鏈表的末尾屡江。
4.如果鏈表長(zhǎng)度大于TREEIFY_THRESHOLD芭概,需要將鏈表變?yōu)榧t黑樹。
5.如果保存的數(shù)據(jù)個(gè)數(shù)大于門限值惩嘉,需要調(diào)用resize()方法對(duì)數(shù)組擴(kuò)容罢洲。
下面看resize()函數(shù)怎么對(duì)數(shù)組進(jìn)行擴(kuò)容。
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;
if (oldCap > 0) {
if (oldCap >= MAXIMUM_CAPACITY) { //如果現(xiàn)在的容量已經(jīng)超過(guò)最大容量文黎,不再對(duì)數(shù)組進(jìn)行擴(kuò)容惹苗。
threshold = Integer.MAX_VALUE;
return oldTab;
}
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && //如果數(shù)組容量增大一倍后小于最大容量,就將數(shù)組容量增加一倍
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
else if (oldThr > 0) // 否則耸峭,維持容量不變
newCap = oldThr;
else { // zero initial threshold signifies using defaults
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) { //遍歷每個(gè)結(jié)點(diǎn)桩蓉,根據(jù)hash值計(jì)算其在新數(shù)組中的位置,并且將結(jié)點(diǎn)插入到新數(shù)組中劳闹。
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}
上面的代碼有幾個(gè)終點(diǎn):
1.如果數(shù)組容量已經(jīng)是最大了院究,保持?jǐn)?shù)組容量不變。否則本涕,將數(shù)組容量擴(kuò)大為原來(lái)的兩倍业汰。
2.如果擴(kuò)展了數(shù)組容量,需要重新計(jì)算每個(gè)結(jié)點(diǎn)在新數(shù)組中的位置菩颖。計(jì)算方法也是先計(jì)算key的hash值样漆,計(jì)算在新數(shù)組中的位置,結(jié)算方法是index=(hash&(n-1))位他,n是新數(shù)組的長(zhǎng)度氛濒。
public V get(Object key)
get方法相對(duì)于put方法簡(jiǎn)單了很多。
根據(jù)插入的方法我們大概能推測(cè)出來(lái)獲取的方法鹅髓。首先計(jì)算key的hash值舞竿,然后計(jì)算在數(shù)組中的位置,然后遍歷所有結(jié)點(diǎn)找到key值相同的元素窿冯,返回骗奖。
public V get(Object key) {
Node<K,V> e;
return (e = getNode(hash(key), key)) == null ? null : e.value; //計(jì)算hash值,調(diào)用getNode查找數(shù)據(jù)。
}
final Node<K,V> getNode(int hash, Object key) {
Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
if ((tab = table) != null && (n = tab.length) > 0 &&
(first = tab[(n - 1) & hash]) != null) {
if (first.hash == hash && // always check first node //如果第一個(gè)結(jié)點(diǎn)就是目標(biāo)節(jié)點(diǎn)执桌,返回
((k = first.key) == key || (key != null && key.equals(k))))
return first;
if ((e = first.next) != null) {
if (first instanceof TreeNode) //如果是紅黑樹鄙皇,調(diào)用紅黑樹方法查找
return ((TreeNode<K,V>)first).getTreeNode(hash, key);
do {
if (e.hash == hash && //如果是鏈表,遍歷鏈表查找結(jié)點(diǎn)
((k = e.key) == key || (key != null && key.equals(k))))
return e;
} while ((e = e.next) != null);
}
}
return null;
}