哈希算法你真的了解嘛逃默？

散列表

散列表（Hash table，也叫哈希表）暴凑，是根據鍵（Key）而直接訪問在內存存儲位置的數據結構。也就是說赘来，它通過計算一個關于鍵值的函數现喳，將所需查詢的數據映射到表中一個位置來訪問記錄，這加快了查找速度犬辰。這個映射函數稱做散列函數嗦篱，存放記錄的數組稱做散列表。

散列函數

散列函數幌缝，顧名思義灸促，它是一個函數。如果把它定義成 hash(key) 涵卵，其中 key 表示元素的鍵值浴栽，則 hash(key) 的值表示經過散列函數計算得到的散列值。

散列函數的特點：

1.確定性

如果兩個散列值是不相同的（根據同一函數）轿偎，那么這兩個散列值的原始輸入也是不相同的典鸡。

2.散列碰撞（collision）

散列函數的輸入和輸出不是唯一對應關系的，如果兩個散列值相同坏晦，兩個輸入值很可能是相同的萝玷，但也可能不同嫁乘。

3.不可逆性

一個哈希值對應無數個明文，理論上你并不知道哪個是球碉。

4.混淆特性

輸入一些數據計算出散列值蜓斧，然后部分改變輸入值，一個具有強混淆特性的散列函數會產生一個完全不同的散列值汁尺。

常見的散列函數

1. MD5

MD5 即 Message-Digest Algorithm 5（信息-摘要算法5）法精，用于確保信息傳輸完整一致。是計算機廣泛使用的雜湊算法之一痴突，主流編程語言普遍已有 MD5 實現搂蜓。

將數據（如漢字）運算為另一固定長度值，是雜湊算法的基礎原理辽装，MD5 的前身有 MD2 帮碰、MD3 和 MD4 。

MD5 是輸入不定長度信息拾积，輸出固定長度 128-bits 的算法殉挽。經過程序流程，生成四個32位數據拓巧，最后聯(lián)合起來成為一個 128-bits 散列斯碌。

基本方式為，求余肛度、取余傻唾、調整長度、與鏈接變量進行循環(huán)運算承耿，得出結果冠骄。

MD5 計算廣泛應用于錯誤檢查。在一些 BitTorrent 下載中加袋，軟件通過計算 MD5 來檢驗下載到的碎片的完整性凛辣。

2. SHA-1

SHA-1（英語：Secure Hash Algorithm 1，中文名：安全散列算法1）是一種密碼散列函數职烧，SHA-1可以生成一個被稱為消息摘要的160位（20字節(jié)）散列值扁誓，散列值通常的呈現形式為40個十六進制數。

SHA-1 曾經在許多安全協(xié)議中廣為使用蚀之，包括TLS和SSL跋理、PGP、SSH恬总、S/MIME和IPsec前普，曾被視為是MD5的后繼者。

散列沖突

理想中的一個散列函數壹堰，希望達到

如果 key1 ≠ key2拭卿，那 hash(key1) ≠ hash(key2)

這種效果骡湖，然而在真實的情況下，要想找到一個不同的 key 對應的散列值都不一樣的散列函數峻厚，幾乎是不可能的响蕴，即使是 MD5 或者由美國國家安全局設計的 SHA-1 算法也無法實現。

事實上惠桃，再好的散列函數都無法避免散列沖突浦夷。

為什么呢？

這涉及到數學中比較好理解的一個原理：抽屜原理辜王。

抽屜原理：桌上有十個蘋果劈狐，要把這十個蘋果放到九個抽屜里，無論怎樣放呐馆，我們會發(fā)現至少會有一個抽屜里面至少放兩個蘋果肥缔。這一現象就是我們所說的“抽屜原理”。

對于散列表而言汹来，無論設置的存儲區(qū)域（n）有多大续膳，當需要存儲的數據大于 n 時，那么必然會存在哈希值相同的情況收班。這就是所謂的散列沖突坟岔。

那應該如何解決散列沖突問題呢？

常用的散列沖突解決方法有兩類摔桦，開放尋址法（open addressing）和鏈表法（chaining）社付。

開放尋址法

定義：將散列函數擴展定義成探查序列，即每個關鍵字有一個探查序列h(k,0)酣溃、h(k,1)、…纪隙、h(k,m-1)赊豌，這個探查序列一定是0….m-1的一個排列（一定要包含散列表全部的下標，不然可能會發(fā)生雖然散列表沒滿绵咱，但是元素不能插入的情況）碘饼，如果給定一個關鍵字k，首先會看h(k,0)是否為空悲伶，如果為空艾恼，則插入；如果不為空麸锉，則看h(k,1)是否為空钠绍，以此類推。

開放尋址法是一種解決碰撞的方法花沉，對于開放尋址沖突解決方法柳爽，比較經典的有線性探測方法（Linear Probing）媳握、二次探測（Quadratic probing）和雙重散列（Double hashing）等方法。

開放尋址法

定義：將散列函數擴展定義成探查序列磷脯，即每個關鍵字有一個探查序列h(k,0)蛾找、h(k,1)、…赵誓、h(k,m-1)打毛，這個探查序列一定是0….m-1的一個排列（一定要包含散列表全部的下標，不然可能會發(fā)生雖然散列表沒滿俩功，但是元素不能插入的情況）幻枉，如果給定一個關鍵字k，首先會看h(k,0)是否為空绑雄，如果為空展辞，則插入；如果不為空万牺，則看h(k,1)是否為空罗珍，以此類推。

開放尋址法是一種解決碰撞的方法脚粟，對于開放尋址沖突解決方法覆旱，比較經典的有線性探測方法（Linear Probing）、二次探測（Quadratic probing）和雙重散列（Double hashing）等方法核无。

線性探測方法

當我們往散列表中插入數據時扣唱，如果某個數據經過散列函數散列之后，存儲位置已經被占用了团南，我們就從當前位置開始噪沙，依次往后查找，看是否有空閑位置吐根，直到找到為止正歼。

線性探測法一個很大的弊端就是當散列表中插入的數據越來越多時，散列沖突發(fā)生的可能性就會越來越大拷橘，空閑位置會越來越少局义，線性探測的時間就會越來越久。極端情況下冗疮，需要從頭到尾探測整個散列表萄唇，所以最壞情況下的時間復雜度為 O(n)。

二次探測方法

二次探測是二次方探測法的簡稱术幔。顧名思義另萤，使用二次探測進行探測的步長變成了原來的“二次方”，也就是說诅挑，它探測的下標序列為 hash(key)+0仲墨，hash(key)+1^2或[hash(key)-1^2]勾缭，hash(key)+2^2或[hash(key)-2^2]。

雙重散列方法

所謂雙重散列目养，意思就是不僅要使用一個散列函數俩由，而是使用一組散列函數 hash1(key)，hash2(key)癌蚁，hash3(key)幻梯。。努释。碘梢。。伐蒂。先用第一個散列函數煞躬，如果計算得到的存儲位置已經被占用，再用第二個散列函數逸邦，依次類推恩沛，直到找到空閑的存儲位置。

事實上缕减，不管采用哪種探測方法雷客，只要當散列表中空閑位置不多的時候，散列沖突的概率就會大大提高桥狡。為了盡可能保證散列表的操作效率搅裙，一般情況下，需要盡可能保證散列表中有一定比例的空閑槽位裹芝。

一般使用加載因子（load factor）來表示空位的多少部逮。

加載因子是表示 Hsah 表中元素的填滿的程度，若加載因子越大嫂易，則填滿的元素越多,這樣的好處是：空間利用率高了,但沖突的機會加大了兄朋。反之,加載因子越小,填滿的元素越少,好處是沖突的機會減小了，但空間浪費多了炬搭。

鏈表法

鏈表法是一種更加常用的散列沖突解決辦法蜈漓，相比開放尋址法穆桂，它要簡單很多宫盔。如下動圖所示，在散列表中享完，每個位置對應一條鏈表灼芭，所有散列值相同的元素都放到相同位置對應的鏈表中。

最后編輯于：2020.04.01 16:45:07

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末般又，一起剝皮案震驚了整個濱河市彼绷，隨后出現的幾起案子巍佑，更是在濱河造成了極大的恐慌，老刑警劉巖寄悯，帶你破解...
沈念sama閱讀 217,277評論 6贊 503
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件萤衰，死亡現場離奇詭異，居然都是意外死亡猜旬，警方通過查閱死者的電腦和手機脆栋，發(fā)現死者居然都...
沈念sama閱讀 92,689評論 3贊 393
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來洒擦，“玉大人椿争，你說我怎么就攤上這事∈炷郏” “怎么了秦踪？”我有些...
開封第一講書人閱讀 163,624評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長掸茅。經常有香客問我椅邓，道長，這世上最難降的妖魔是什么倦蚪？我笑而不...
開封第一講書人閱讀 58,356評論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任希坚，我火速辦了婚禮，結果婚禮上陵且，老公的妹妹穿的比我還像新娘裁僧。我一直安慰自己，他們只是感情好慕购，可當我...
茶點故事閱讀 67,402評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布聊疲。她就那樣靜靜地躺著，像睡著了一般沪悲。火紅的嫁衣襯著肌膚如雪获洲。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,292評論 1贊 301
城市分裂傳說
那天殿如，我揣著相機與錄音贡珊，去河邊找鬼。笑死涉馁，一個胖子當著我的面吹牛门岔，可吹牛的內容都是我干的。我是一名探鬼主播烤送，決...
沈念sama閱讀 40,135評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼寒随，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側響起妻往，我...
開封第一講書人閱讀 38,992評論 0贊 275
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤互艾，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后讯泣，有當地人在樹林里發(fā)現了一具尸體纫普，經...
沈念sama閱讀 45,429評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,636評論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年好渠，在試婚紗的時候發(fā)現自己被綠了局嘁。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 39,785評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡晦墙，死狀恐怖悦昵，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情晌畅，我是刑警寧澤但指，帶...
沈念sama閱讀 35,492評論 5贊 345
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站抗楔，受9級特大地震影響棋凳，放射性物質發(fā)生泄漏。R本人自食惡果不足惜连躏，卻給世界環(huán)境...
茶點故事閱讀 41,092評論 3贊 328
男人毒藥：我在死后第九天來索命
文/蒙蒙一剩岳、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧入热，春花似錦拍棕、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,723評論 0贊 22
一樁弒父案绰播，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至尚困，卻和暖如春蠢箩，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背事甜。一陣腳步聲響...
開封第一講書人閱讀 32,858評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工谬泌，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人逻谦。一個月前我還...
沈念sama閱讀 47,891評論 2贊 370
代替公主和親
正文我出身青樓掌实，卻偏偏與公主長得像，于是被迫代替她去往敵國和親跨跨。傳聞我的和親對象是個殘疾皇子潮峦，可洞房花燭夜當晚...
茶點故事閱讀 44,713評論 2贊 354

哈希算法你真的了解嘛玩祟？