算法之散列表

散列表——最有用的基本數(shù)據(jù)結(jié)構(gòu)之一坤候,用途廣泛。

散列表的內(nèi)部機(jī)制:實(shí)現(xiàn)枪眉、沖突和散列函數(shù)。

假設(shè)你在一家雜貨店上班预明。有顧客來(lái)買東西時(shí),你得在一個(gè)本子中查找價(jià)格耙箍。如果本子的內(nèi)容不是按字母順序排列的撰糠,你可能為查找蘋果 (apple)的價(jià)格而瀏覽每一行,這需要很長(zhǎng)的時(shí)間辩昆。

散列函數(shù)

無(wú)論你給它什么數(shù)據(jù)阅酪,它都還你一個(gè)數(shù)字。散列函數(shù)將輸入映射到數(shù)字

實(shí)散列函數(shù)必須滿足一些要求汁针。它必須是一致的术辐。
最理想的情況是,將不同的輸入映射到不同的數(shù)字施无。

散列表 (hash table)的數(shù)據(jù)結(jié)構(gòu)辉词。種包含額外邏輯的數(shù)據(jù)結(jié)構(gòu)。

數(shù)組和鏈表都被直接映射到內(nèi)存猾骡,但散列表更復(fù)雜瑞躺,它使用散列函數(shù)來(lái)確定元素的存儲(chǔ)位置。

散列表由組成兴想。

將散列表用于查找

假設(shè)你要?jiǎng)?chuàng)建一個(gè)類似這樣的電話簿隘蝎,將姓名映射到電話號(hào)碼。該電話簿需要提供如下功能襟企。添加聯(lián)系人及其電話號(hào)碼嘱么。通過(guò)輸入聯(lián)系人來(lái)獲悉其電話號(hào)碼。

phone_book = dict()
phone_book["jenny"] = 8675309
phone_book["emergency"] = 911
print phone_book["jenny"]
#8675309  

如果要求你使用數(shù)組來(lái)創(chuàng)建電話簿顽悼,你將如何做呢曼振?

散列表被用于大海撈針式的查找。訪問(wèn)網(wǎng)站時(shí)蔚龙,計(jì)算機(jī)必須將adit.io轉(zhuǎn)換為IP地址冰评。無(wú)論你訪問(wèn)哪個(gè)網(wǎng)站,其網(wǎng)址都必須轉(zhuǎn)換為IP地址木羹。這不是將網(wǎng)址映射到IP地址嗎甲雅?好像非常適合使用散列表啰!這個(gè)過(guò)程被稱為DNS解析 (DNS resolution)坑填,散列表是提供這種功能的方式之一抛人。

防止重復(fù)

假設(shè)你負(fù)責(zé)管理一個(gè)投票站。顯然脐瑰,每人只能投一票妖枚,但如何避免重復(fù)投票呢?有人來(lái)投票時(shí)苍在,你詢問(wèn)他的全名绝页,并將其與已投票者名單進(jìn)行比對(duì)荠商。如果名字在名單中,就說(shuō)明這個(gè)人投過(guò)票了续誉,因此將他拒之門外莱没!

voted = {}
def check_voter(name):  
  if voted.get(name):    
    print "kick them out!"  
  else:    
    voted[name] = True    
    print "let them vote!"

將散列表用作緩存

假設(shè)你訪問(wèn)網(wǎng)站facebook.com。
(1) 你向Facebook的服務(wù)器發(fā)出請(qǐng)求酷鸦。
(2) 服務(wù)器做些處理饰躲,生成一個(gè)網(wǎng)頁(yè)并將其發(fā)送給你。
(3) 你獲得一個(gè)網(wǎng)頁(yè)井佑。

緩存的工作原理:網(wǎng)站將數(shù)據(jù)記住属铁,而不再重新計(jì)算。
緩存是一種常用的加速方式躬翁,所有大型網(wǎng)站都使用緩存焦蘑,而緩存的數(shù)據(jù)則存儲(chǔ)在散列表中!

當(dāng)你訪問(wèn)Facebook的頁(yè)面時(shí)盒发,它首先檢查散列表中是否存儲(chǔ)了該頁(yè)面例嘱。

cache = {}
def get_page(url):  
  if cache.get(url):    
    return cache[url]  # 返回緩存的數(shù)據(jù)  
  else:    
    data = get_data_from_server(url)    
    cache[url] = data  # 先將數(shù)據(jù)保存到緩存中    
    return data

沖突

給兩個(gè)鍵分配的位置相同,這種情況被稱為沖突(collision):

如果兩個(gè)鍵映射到了同一個(gè)位置宁舰,就在這個(gè)位置存儲(chǔ)一個(gè)鏈表拼卵。

散列函數(shù)將所有的鍵都映射到一個(gè)位置,而最理想的情況是蛮艰,散列函數(shù)將鍵均勻地映射到散列表的不同位置腋腮。

著無(wú)論散列表包含一個(gè)元素還是10億個(gè)元素,從其中獲取數(shù)據(jù)所需的時(shí)間都相同壤蚜。

而要避免沖突即寡,需要有:

  • 較低的填裝因子;
  • 良好的散列函數(shù)袜刷。

填裝因子

散列表的填裝因子很容易計(jì)算聪富。散列表使用數(shù)組來(lái)存儲(chǔ)數(shù)據(jù),因此你需要計(jì)算數(shù)組中被占用的位置數(shù)著蟹。
填裝因子度量的是散列表中有多少位置是空的墩蔓。

填裝因子大于1意味著商品數(shù)量超過(guò)了數(shù)組的位置數(shù)。一旦填裝因子開(kāi)始增大萧豆,你就需要在散列表中添加位置奸披,這被稱為調(diào)整長(zhǎng)度

填裝因子越低炕横,發(fā)生沖突的可能性越小源内,散列表的性能越高。

一個(gè)不錯(cuò)的經(jīng)驗(yàn)規(guī)則是:一旦填裝因子大于0.7份殿,就調(diào)整散列表的長(zhǎng)度膜钓。


良好的散列函數(shù)

良好的散列函數(shù)讓數(shù)組中的值呈均勻分布。糟糕的散列函數(shù)讓值扎堆卿嘲,導(dǎo)致大量的沖突颂斜。

什么樣的散列函數(shù)是良好的呢?你根本不用操心——天塌下來(lái)有高個(gè)子頂著拾枣。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末沃疮,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子梅肤,更是在濱河造成了極大的恐慌司蔬,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,039評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件姨蝴,死亡現(xiàn)場(chǎng)離奇詭異俊啼,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)左医,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門授帕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人浮梢,你說(shuō)我怎么就攤上這事跛十。” “怎么了秕硝?”我有些...
    開(kāi)封第一講書人閱讀 165,417評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵芥映,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我远豺,道長(zhǎng)奈偏,這世上最難降的妖魔是什么? 我笑而不...
    開(kāi)封第一講書人閱讀 58,868評(píng)論 1 295
  • 正文 為了忘掉前任憋飞,我火速辦了婚禮霎苗,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘榛做。我一直安慰自己唁盏,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,892評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布检眯。 她就那樣靜靜地躺著厘擂,像睡著了一般。 火紅的嫁衣襯著肌膚如雪锰瘸。 梳的紋絲不亂的頭發(fā)上刽严,一...
    開(kāi)封第一講書人閱讀 51,692評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音避凝,去河邊找鬼舞萄。 笑死眨补,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的倒脓。 我是一名探鬼主播撑螺,決...
    沈念sama閱讀 40,416評(píng)論 3 419
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼崎弃!你這毒婦竟也來(lái)了甘晤?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 39,326評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤饲做,失蹤者是張志新(化名)和其女友劉穎线婚,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體盆均,經(jīng)...
    沈念sama閱讀 45,782評(píng)論 1 316
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡塞弊,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,957評(píng)論 3 337
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了缀踪。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片居砖。...
    茶點(diǎn)故事閱讀 40,102評(píng)論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖驴娃,靈堂內(nèi)的尸體忽然破棺而出奏候,到底是詐尸還是另有隱情,我是刑警寧澤唇敞,帶...
    沈念sama閱讀 35,790評(píng)論 5 346
  • 正文 年R本政府宣布蔗草,位于F島的核電站,受9級(jí)特大地震影響疆柔,放射性物質(zhì)發(fā)生泄漏咒精。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,442評(píng)論 3 331
  • 文/蒙蒙 一旷档、第九天 我趴在偏房一處隱蔽的房頂上張望模叙。 院中可真熱鬧,春花似錦鞋屈、人聲如沸范咨。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,996評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)渠啊。三九已至,卻和暖如春权旷,著一層夾襖步出監(jiān)牢的瞬間替蛉,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 33,113評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留躲查,地道東北人它浅。 一個(gè)月前我還...
    沈念sama閱讀 48,332評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像熙含,于是被迫代替她去往敵國(guó)和親罚缕。 傳聞我的和親對(duì)象是個(gè)殘疾皇子艇纺,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,044評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容