【數(shù)據(jù)結(jié)構(gòu)】哈希表(Hash table)

為什么需要哈希表摸吠?

舉個例子(摘自漫畫算法):

在上學時需要學習英語嚎花,而在當時有很多的電子詞典紊选,同學們遇到不會的單詞兵罢,只要在這個電子詞典上輸入單詞的英文,就可以查出中文的含義巩那。

當時的英語老師強烈反對使用這樣的工具此蜈,因為電子詞典查出來的中文資料太有限即横,而傳統(tǒng)的紙質(zhì)詞典可以查到單詞的多種含義、詞性裆赵、例句等东囚。

但是,同學們還是傾向于使用電子詞典战授。因為電子詞典實在太方便了页藻,只要輸入要查找的單詞,一瞬間就可以得到結(jié)果植兰,而不需要像紙質(zhì)詞典那樣繁瑣地進行人工查找份帐。

在我們程序員的世界里,往往也需要在內(nèi)存中存放這樣一個“詞典”弥鹦,方便我們進行高效的查詢和統(tǒng)計。

例如開發(fā)一個學生管理系統(tǒng),需要有通過輸入學號快速查出對應學生的姓名的功能彬坏。這里不必每次都去查詢數(shù)據(jù)庫朦促,而可以在內(nèi)存建立一個緩存表,這樣做可以提高查詢效率栓始。

學號 姓名
10001 張三
10002 李四
10003 王五
10004 趙六

再如我們需要統(tǒng)計一本英文書里某些單詞出現(xiàn)的頻率务冕,就需要遍歷整本書的內(nèi)容,把這些單詞出現(xiàn)的次數(shù)記錄在內(nèi)存中幻赚。

單詞 出現(xiàn)次數(shù)
this 56
and 87
are 98
by 46

因為這些需求禀忆,一個重要的數(shù)據(jù)結(jié)構(gòu)誕生了,這個數(shù)據(jù)結(jié)構(gòu)就叫做散列表落恼。

散列表也叫做哈希表箩退,這種數(shù)據(jù)結(jié)構(gòu)提供了鍵和值的映射關(guān)系。只要給出key佳谦,就可以高效的查找所對應的值戴涝。

key value
key1 value1
key2 value2
key3 value3
key4 value4

那么,散列表是如何根據(jù)key來快速查找到所匹配的value呢钻蔑?

哈希函數(shù)

散列表在本質(zhì)上是一個數(shù)組啥刻,為什么底層使用數(shù)組呢?

數(shù)組的特點是它的隨機訪問能力咪笑,根據(jù)索引來進行訪問可帽,所以我們需要一個“中轉(zhuǎn)站”,通過某種方式窗怒,把鍵轉(zhuǎn)換為索引映跟,而這個中轉(zhuǎn)站就叫做哈希函數(shù)。

哈希函數(shù).png

那么這個所謂的哈希函數(shù)是如何實現(xiàn)的呢扬虚?

在不同的語言中申窘,哈希函數(shù)的實現(xiàn)方式是不一樣的。這里以Java的常用集合HashMap為例孔轴,來看一看哈希函數(shù)在Java中的實現(xiàn)剃法。

在Java及大多數(shù)面向?qū)ο蟮恼Z言中,每一個對象都有屬于自己的hashcode路鹰,這個hashcode是區(qū)分不同對象的標識贷洲。無論對象自身類型是什么,它們的hashcode都是一個整型變量晋柱。

既然都是整型變量优构,想要轉(zhuǎn)換成數(shù)組的索引也就不難實現(xiàn)了。最簡單的轉(zhuǎn)換方式就是按照數(shù)組的長度進行取模雁竞。

通過哈希函數(shù)钦椭,我們可以把字符串或其他類型的鍵轉(zhuǎn)換為數(shù)組的索引拧额。

例如:給出一個長度為10的數(shù)組,當key=24321時彪腔,index=HashCode("24321") % Array.length侥锦。

哈希表的實現(xiàn)

1、寫操作
寫操作就是在哈希表中插入新的元素德挣。分為兩個步驟:

第一步:通過哈希函數(shù)恭垦,把key轉(zhuǎn)化為數(shù)組的索引

第二步:如果當前key所對應的索引中沒有元素,就把新元素添加進去格嗅。

注意:由于數(shù)組的長度是有限的番挺,當插入的元素越來越多,我們很難保證每一個鍵通過哈希函數(shù)轉(zhuǎn)換

為對應不同的索引屯掖,在這種情況下玄柏,我們不得不處理一個在哈希表中關(guān)鍵的問題,兩個不同的鍵贴铜,通過哈希函數(shù)轉(zhuǎn)換為同一個索引粪摘,這種情況稱為哈希沖突,這也是哈希表中最復雜的阀湿。

解決方式:

  • 開放尋址法

    開放尋址法很簡單赶熟,當一個鍵通過哈希函數(shù)轉(zhuǎn)換為索引并且這個索引已被占用時瑰妄,我們可以“另謀高就”陷嘴,尋找下一個空檔的位置。

    例如间坐,newKey通過哈希函數(shù)轉(zhuǎn)換為索引2灾挨,該索引在數(shù)組中已經(jīng)被占用了,那么就向后移動一位竹宋,看看索引為3的位置是否被占用了劳澄,如果占用了,那么繼續(xù)向后移動一位蜈七,看看索引為4的位置是否被占用了秒拔,如果沒有占用,就把key3存放到數(shù)組索引為4的索引飒硅。

    如圖:

    開放尋址法1.png
    開放尋址法2.png
    開放尋址法3.png

    這就是開放尋址法的基本思路砂缩。當然,如果遇到哈希沖突時三娩,尋址方式有很多種庵芭,在這里只是簡單的舉個例子。

  • 鏈地址法

    鏈地址法說白就是一個鏈表的數(shù)組雀监,數(shù)組當中每一個元素都是一個鏈表双吆,當遇到哈希沖突時,只需要插入對應的鏈表即可。

2好乐、讀操作

讀操作就是通過給定的鍵匾竿,在哈希表中查找對應的值。分為兩個步驟:

第一步:通過哈希函數(shù)曹宴,把鍵轉(zhuǎn)換為索引搂橙。

第二步:通過索引找到對應的元素,再比較鍵笛坦,如果鍵相等区转,那么就找到了,如果不相等版扩,繼續(xù)找废离。

3、擴容

由于哈希表的底層實際上就是個數(shù)組礁芦,那么哈希表也就要涉及到擴容的問題了蜻韭。

首先,什么時候需要進行擴容呢柿扣?

當經(jīng)過多次寫操作時肖方,哈希表達到一定的飽和度時,鍵映射位置發(fā)生沖突的概率會逐漸提高未状。這樣一來俯画,大量的元素擁擠在相同的數(shù)組索引位置,會形成很長的鏈表司草,對后續(xù)的寫操作和讀操作的性能會造成很大的影響艰垂。這時,哈希表就需要擴展它的長度埋虹,也就是進行擴容猜憎。

擴容分為兩個步驟:

  • 擴容

    創(chuàng)建一個新的數(shù)組,并且新的數(shù)組的長度是原來的數(shù)組的2倍搔课。

  • 重新Hash

    遍歷原數(shù)組胰柑,把所有的元素重新Hash到新數(shù)組當中。

注意:在Java中爬泥,關(guān)于HashMap的實現(xiàn)柬讨,在Java8之前HashMap的實現(xiàn)每個位置對應著一個鏈表。不過急灭,從Java8開始有了一個改變姐浮,在初始的時候哈希表的每個位置依然是一個鏈表,但是葬馋,當哈希沖突達到一定的程度時卖鲤,會把哈希表中的每一個位置從鏈表轉(zhuǎn)成紅黑樹肾扰!

整體代碼如下(在這里哈希沖突的解決方式使用的是鏈地址法,只不過把鏈表替換為了紅黑樹):

/**
 * 描述:哈希表(通過紅黑樹解決哈希沖突問題)
 * <p>
 * Create By ZhangBiao
 * 2020/5/12
 */
public class HashTable<K, V> {

    private static final int UPPER_TOL = 10;

    private static final int LOWER_TOL = 2;

    private static final int INIT_CAPACITY = 7;

    private TreeMap<K, V>[] hashtable;

    private int size;

    private int M;

    public HashTable(int M) {
        this.M = M;
        this.size = 0;
        this.hashtable = new TreeMap[M];
        for (int i = 0; i < M; i++) {
            hashtable[i] = new TreeMap<>();
        }
    }

    public HashTable() {
        this(INIT_CAPACITY);
    }

    private int hash(K key) {
        return (key.hashCode() & 0x7fffffff) % M;
    }

    public int getSize() {
        return size;
    }

    public void add(K key, V value) {
        TreeMap<K, V> map = hashtable[hash(key)];
        if (map.containsKey(key)) {
            map.put(key, value);
        } else {
            map.put(key, value);
            size++;
            if (size >= UPPER_TOL * M) {
                resize(2 * M);
            }
        }
    }

    private void resize(int newM) {
        TreeMap<K, V>[] newHashTable = new TreeMap[newM];
        for (int i = 0; i < newM; i++) {
            newHashTable[i] = new TreeMap<>();
        }
        int oldM = this.M;
        this.M = newM;
        for (int i = 0; i < oldM; i++) {
            for (K key : hashtable[i].keySet()) {
                newHashTable[hash(key)].put(key, hashtable[i].get(key));
            }
        }
        this.hashtable = newHashTable;
    }

    public V remove(K key) {
        V ret = null;
        TreeMap<K, V> map = hashtable[hash(key)];
        if (map.containsKey(key)) {
            ret = map.remove(key);
            size--;
            if (size <= LOWER_TOL * M && M > INIT_CAPACITY) {
                resize(M / 2);
            }
        }
        return ret;
    }

    public void set(K key, V value) {
        TreeMap<K, V> map = hashtable[hash(key)];
        if (!map.containsKey(key)) {
            throw new IllegalArgumentException(key + "doesn't exist!");
        }
        map.put(key, value);
    }

    public boolean contains(K key) {
        return hashtable[hash(key)].containsKey(key);
    }

    public V get(K key) {
        return hashtable[hash(key)].get(key);
    }

}
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末蛋逾,一起剝皮案震驚了整個濱河市集晚,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌区匣,老刑警劉巖偷拔,帶你破解...
    沈念sama閱讀 218,755評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異亏钩,居然都是意外死亡莲绰,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,305評論 3 395
  • 文/潘曉璐 我一進店門姑丑,熙熙樓的掌柜王于貴愁眉苦臉地迎上來蛤签,“玉大人,你說我怎么就攤上這事栅哀≌鸢梗” “怎么了?”我有些...
    開封第一講書人閱讀 165,138評論 0 355
  • 文/不壞的土叔 我叫張陵留拾,是天一觀的道長戳晌。 經(jīng)常有香客問我,道長痴柔,這世上最難降的妖魔是什么沦偎? 我笑而不...
    開封第一講書人閱讀 58,791評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮竞帽,結(jié)果婚禮上扛施,老公的妹妹穿的比我還像新娘鸿捧。我一直安慰自己屹篓,他們只是感情好,可當我...
    茶點故事閱讀 67,794評論 6 392
  • 文/花漫 我一把揭開白布匙奴。 她就那樣靜靜地躺著堆巧,像睡著了一般。 火紅的嫁衣襯著肌膚如雪泼菌。 梳的紋絲不亂的頭發(fā)上谍肤,一...
    開封第一講書人閱讀 51,631評論 1 305
  • 那天,我揣著相機與錄音哗伯,去河邊找鬼荒揣。 笑死,一個胖子當著我的面吹牛焊刹,可吹牛的內(nèi)容都是我干的系任。 我是一名探鬼主播恳蹲,決...
    沈念sama閱讀 40,362評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼俩滥!你這毒婦竟也來了嘉蕾?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,264評論 0 276
  • 序言:老撾萬榮一對情侶失蹤霜旧,失蹤者是張志新(化名)和其女友劉穎错忱,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體挂据,經(jīng)...
    沈念sama閱讀 45,724評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡以清,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了崎逃。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片玖媚。...
    茶點故事閱讀 40,040評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖婚脱,靈堂內(nèi)的尸體忽然破棺而出今魔,到底是詐尸還是另有隱情,我是刑警寧澤障贸,帶...
    沈念sama閱讀 35,742評論 5 346
  • 正文 年R本政府宣布错森,位于F島的核電站,受9級特大地震影響篮洁,放射性物質(zhì)發(fā)生泄漏涩维。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,364評論 3 330
  • 文/蒙蒙 一袁波、第九天 我趴在偏房一處隱蔽的房頂上張望瓦阐。 院中可真熱鬧,春花似錦篷牌、人聲如沸睡蟋。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,944評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽戳杀。三九已至,卻和暖如春夭苗,著一層夾襖步出監(jiān)牢的瞬間信卡,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,060評論 1 270
  • 我被黑心中介騙來泰國打工题造, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留傍菇,地道東北人。 一個月前我還...
    沈念sama閱讀 48,247評論 3 371
  • 正文 我出身青樓界赔,卻偏偏與公主長得像丢习,于是被迫代替她去往敵國和親须妻。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,979評論 2 355