引入
哈夫曼、赫夫曼场刑、霍夫曼都說的是——Huffman
哈夫曼樹和哈夫曼編碼到底解決啥問題呢般此?
先看兩個(gè)常經(jīng)常用來解釋的例子:
1. 對(duì)學(xué)生成績(jī)進(jìn)行評(píng)級(jí)
本部分(例子1)出自博客# 樹問題總結(jié)之哈夫曼樹
下面就是在一次考試中某門課程的各分?jǐn)?shù)段的人數(shù)分布情況:
下面我們就利用哈夫曼樹尋找一棵最佳判定樹,即總的比較次數(shù)最少的判定樹摇邦。
第一種構(gòu)造方式:
第二種構(gòu)造方式:
這兩種方式恤煞,顯然后者的判定過程的效率要比前者高屎勘。在也沒有別地判定過程比第二種方式的效率更高施籍。
2. 哈夫曼編碼
具體可以搜百度,或者看這個(gè)博客——哈夫曼編碼的理解(Huffman Coding)
就是把字符用不等長(zhǎng)的形式給都編碼了概漱。
哈夫曼樹做了一件什么事情丑慎?
由例子我們可以總結(jié)出:哈夫曼樹就是一種算法思路,它能夠使得,當(dāng)只能用判斷(是或否竿裂,也就是if條件語句)的形式玉吁,從一堆元素中快速的找到所要的元素。換句話說哈夫曼樹就是一種提高判斷搜索能力的算法腻异。
回顧上面兩個(gè)例子:
第一個(gè)例子中进副,我們需要快速判斷出所需要的分的類是什么,可以通過哈夫曼樹去做
第二個(gè)例子中悔常,我們需要最少的判斷影斑,就把字符給確定了。
什么問題適合用哈夫曼樹解決机打?
除了剛剛說的矫户,它是用來從一堆元素中查找元素的算法,當(dāng)你需要用最少的判斷步驟獲取最重要的那個(gè)元素的時(shí)候残邀,就用哈夫曼樹皆辽,那么它有一些很重要的前提:
查找過程中只用判斷結(jié)構(gòu)
-
這堆元素必須可排序
- 例如二分查找就是一個(gè)例子,從有1~100個(gè)數(shù)的順序數(shù)組中找到輸入的數(shù)n芥挣,怎么找呢驱闷?可以先對(duì)100個(gè)數(shù)進(jìn)行哈夫曼樹的構(gòu)建,在構(gòu)建過程中你會(huì)發(fā)現(xiàn)每個(gè)數(shù)的權(quán)重都是1啊沒辦法排序空免,這時(shí)候可以根據(jù)數(shù)的大小來排序遗嗽,但是構(gòu)建哈夫曼樹的時(shí)候依然用權(quán)重來構(gòu)建,最后鼓蜒,構(gòu)建出來的每個(gè)非葉子結(jié)點(diǎn)中表示的判斷痹换,就是二分查找。
- 再比如剛剛的兩個(gè)例子中都弹,排序過程是通過每個(gè)結(jié)點(diǎn)中自帶的權(quán)重來排序的娇豫,因此它產(chǎn)生的效果就是能夠最快的
仔細(xì)研究哈夫曼樹的構(gòu)建步驟會(huì)發(fā)現(xiàn)至關(guān)重要的問題:
1.怎么去選擇兩個(gè)子結(jié)點(diǎn)去結(jié)合成一個(gè)父結(jié)點(diǎn)?——元素要有結(jié)合的規(guī)則畅厢,比如權(quán)重小的兩個(gè)結(jié)合
2.當(dāng)結(jié)點(diǎn)和結(jié)點(diǎn)的結(jié)合規(guī)則相同的時(shí)候怎么辦(例如很多結(jié)點(diǎn)當(dāng)權(quán)重相同的時(shí)候冯痢,誰和誰結(jié)合呢)?——元素排列的順序也要有規(guī)則也就是1~100這一百個(gè)數(shù)權(quán)重相同的的時(shí)候咋辦呢框杜?雖然說很多人的做法就是當(dāng)結(jié)點(diǎn)和結(jié)點(diǎn)權(quán)重相同的時(shí)候浦楣,就隨機(jī)取兩個(gè)數(shù)結(jié)合成一個(gè),這樣是不便于判斷語句的分類的咪辱,如果判斷語句變得很臃腫振劳,蘊(yùn)含很多小判斷,這樣就會(huì)加重程序負(fù)擔(dān)油狂。因此就給它加了個(gè)權(quán)重相同時(shí)的排序历恐,按照元素大小排序寸癌,這個(gè)可以簡(jiǎn)化判斷語句。