數(shù)據(jù)結(jié)構(gòu)必知 --- 前綴樹

寫在前

  • 什么是字典樹铡溪?

    1. Trie樹,即字典樹衡蚂,又稱單詞查找樹或鍵樹窿克,是一種樹形結(jié)構(gòu),是一種哈希樹的變種毛甲。Trie 一詞來自 retrieval年叮,發(fā)音為 /tri:/ "tree",也有人讀為 /tra?/ "try"玻募。
    2. 典型應用是用于統(tǒng)計和排序大量的字符串(但不僅限于字符串)只损,所以經(jīng)常被搜索引擎系統(tǒng)用于文本詞頻統(tǒng)計。它的優(yōu)點是:最大限度地減少無謂的字符串比較七咧。

    Trie的核心思想是空間換時間跃惫,利用字符串的公共前綴來降低查詢時間的開銷以達到提高效率的目的。

  • 基本性質(zhì)

    1. 根節(jié)點不包含字符艾栋,除根節(jié)點外每一個節(jié)點都只包含一個字符爆存。

    2. 從根節(jié)點到某一節(jié)點,路徑上經(jīng)過的字符連接起來裹粤,為該節(jié)點對應的字符串终蒂。

    3. 每個節(jié)點的所有子節(jié)點包含的字符都不相同蜂林。

  • 復雜度分析

    1.插入和查詢的效率很高遥诉,時間復雜度都為O(m)拇泣,其中 m 是待插入/查詢的字符串的長度

    注:關(guān)于查詢矮锈,會有人說 hash 表時間復雜度是O(1)不是更快霉翔?但是,哈希搜索的效率通常取決于 hash 函數(shù)的好壞苞笨,若一個壞的 hash 函數(shù)導致很多的沖突债朵,效率并不一定比Trie樹高。

    2.最壞的空間復雜度實現(xiàn)方式可以到S^L瀑凝,其中S為字符集L為最長長度

  • Trie樹的應用

    • 字符串檢索:事先將已知的一些字符串(字典)的有關(guān)信息保存到 Trie 里序芦,查找另外一些未知字符串是否出現(xiàn)過或者出現(xiàn)頻率。
    • 字符串最長公共前綴:Trie 利用多個字符串的公共前綴來節(jié)省存儲空間粤咪,反之谚中,當我們把大量字符串存儲到一棵 Trie 上時,我們可以快速得到某些字符串的公共前綴寥枝。
    • 排序:Trie 樹是一棵多叉樹宪塔,只要先序遍歷整棵樹,輸出相應的字符串囊拜,便是按字典序排序的結(jié)果某筐。
    • 作為其他數(shù)據(jù)結(jié)構(gòu)和算法的輔助結(jié)構(gòu):如后綴樹,AC自動機等冠跷。

基本實現(xiàn)

前綴樹創(chuàng)建

假設(shè)有b南誊,abc,abd蜜托,bcd弟疆,abcd,efg盗冷,hii 這6個單詞,那我們創(chuàng)建trie樹就得到怠苔。

可以看出,Trie樹的關(guān)鍵字一般都是字符串仪糖,而且Trie樹把每個關(guān)鍵字保存在一條路徑上柑司,而不是一個結(jié)點中。另外锅劝,兩個有公共前綴的關(guān)鍵字攒驰,在Trie樹中前綴部分的路徑相同。

前綴樹的主要操作就是插入和查詢故爵,即將一個字符串加入集合中和查詢集合中有沒有這個字符串玻粪。每個字符加兩個變量,path 定義節(jié)點經(jīng)過的次數(shù),end 定義最后一個插入的節(jié)點

public class TrieNode {
    private int path;
    private int end;
    private TrieNode[] nexts;
    
    public TrieNode() {
        path = 0;
        end = 0;
        nexts = new TrieNode[26];
    }
}

前綴樹插入

private TrieNode root;  // 根節(jié)點

public TrieNode {
    root = new TrieNode();
}
/**
    往前綴樹中插入字符串(這里只包含26個小寫字母)
*/
private void insert(String word) {
    if (word == null) {
        return;
    }
    int n = word.length();
    char[] chs = word.toCharArray();
    TrieNode node = root;
    int index = 0;
    
    for (int i = 0; i < n; i++) {
        index = chs[i] - 'a';
        if (node.nexts[index] == null) {
            node.nexts[index] = new TrieNode();    // 創(chuàng)建當前字符
        }
        node = node.nexts[index];
        node.path++;
    }
    node.end++;
}

前綴樹查詢

/**
    1劲室、查詢前綴樹某字符串出現(xiàn)的次數(shù)伦仍,返回結(jié)尾字符出現(xiàn)的次數(shù),即node.end
    2很洋、查詢以某字符串為前綴的數(shù)量充蓝,返回每個字符被劃過的次數(shù),即node.path
    如果不存在返回-1喉磁,類似插入操作谓苟!
*/
private int searchCount(String str) {
    if (str == null) {
        return -1;
    }
    int n = str.length();
    char[] chs = str.toCharArray();
    TrieNode node = root;
    int index = 0;
    
    for (int i = 0; i < n; i++) {
        index = chs[i] - 'a';
        if (node.nexts[index] == null) {
            return -1;    
        }
        node = node.nexts[index];  
    }
    return node.end;    // 返回以當前關(guān)鍵字結(jié)尾的字符串的個數(shù)
    //return node.path;  //插字符串時到達幾次
}

/**
    3、查詢集合中是否存在某個字符串协怒,同理
*/
private boolean search(String str) {
    if (str == null) {
        return false;
    }
    int n = str.length();
    char[] chs = str.toCharArray();
    TrieNode node = root;
    int index = 0;
    
    for (int i = 0; i < n; i++) {
        index = chs[i] - 'a';
        if (node.nexts[index] == null) {
            return false;    
        }
        node = node.nexts[index];  
    }
    return true;   
}

案例分析

T208 前綴樹

代碼實現(xiàn):

class Trie {

    class TrieNode {
        boolean isEnd;
        TrieNode[] nexts = new TrieNode[26];
    }

    TrieNode root;

    /** Initialize your data structure here. */
    public Trie() {
        root = new TrieNode(); 
    }
    
    /** Inserts a word into the trie. */
    public void insert(String word) {
        if (word == null) {
            return;
        }
        TrieNode node = root;
        int index = 0;

        for (int i = 0; i < word.length(); i++) {
            index = word.charAt(i) - 'a';
            if (node.nexts[index] == null) {
                node.nexts[index] = new TrieNode();
            }
            node = node.nexts[index];
        }
        node.isEnd = true;
    }

    /** Returns if the word is in the trie. */
    public boolean search(String word) {
        if (word == null) {
            return false;
        }
        TrieNode node = root;
        int index = 0;
 
        for (int i = 0; i < word.length(); i++) {
            index = word.charAt(i) - 'a';
            if (node.nexts[index] == null) {
                return false;
            }
            // 指針移動
            node = node.nexts[index];
        }
        return node.isEnd;
    }
    
    /** Returns if there is any word in the trie that starts with the given prefix. */
    public boolean startsWith(String prefix) {
        if (prefix == null) {
            return false;
        }
        TrieNode node = root;
        int index = 0;
 
        for (int i = 0; i < prefix.length(); i++) {
            index = prefix.charAt(i) - 'a';
            if (node.nexts[index] == null) {
                return false;
            }
            node = node.nexts[index];
        }
        return true;
    }
}

/**
 * Your Trie object will be instantiated and called as such:
 * Trie obj = new Trie();
 * obj.insert(word);
 * boolean param_2 = obj.search(word);
 * boolean param_3 = obj.startsWith(prefix);
 */

T421 數(shù)組最大異或值

待補充涝焙。。孕暇。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末仑撞,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子芭商,更是在濱河造成了極大的恐慌派草,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,490評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件铛楣,死亡現(xiàn)場離奇詭異近迁,居然都是意外死亡,警方通過查閱死者的電腦和手機簸州,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,581評論 3 395
  • 文/潘曉璐 我一進店門鉴竭,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人岸浑,你說我怎么就攤上這事搏存。” “怎么了矢洲?”我有些...
    開封第一講書人閱讀 165,830評論 0 356
  • 文/不壞的土叔 我叫張陵璧眠,是天一觀的道長。 經(jīng)常有香客問我读虏,道長责静,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,957評論 1 295
  • 正文 為了忘掉前任盖桥,我火速辦了婚禮灾螃,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘揩徊。我一直安慰自己腰鬼,他們只是感情好嵌赠,可當我...
    茶點故事閱讀 67,974評論 6 393
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著熄赡,像睡著了一般姜挺。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上本谜,一...
    開封第一講書人閱讀 51,754評論 1 307
  • 那天初家,我揣著相機與錄音偎窘,去河邊找鬼乌助。 笑死,一個胖子當著我的面吹牛陌知,可吹牛的內(nèi)容都是我干的他托。 我是一名探鬼主播,決...
    沈念sama閱讀 40,464評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼仆葡,長吁一口氣:“原來是場噩夢啊……” “哼赏参!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起沿盅,我...
    開封第一講書人閱讀 39,357評論 0 276
  • 序言:老撾萬榮一對情侶失蹤把篓,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后腰涧,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體韧掩,經(jīng)...
    沈念sama閱讀 45,847評論 1 317
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,995評論 3 338
  • 正文 我和宋清朗相戀三年窖铡,在試婚紗的時候發(fā)現(xiàn)自己被綠了疗锐。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,137評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡费彼,死狀恐怖滑臊,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情箍铲,我是刑警寧澤雇卷,帶...
    沈念sama閱讀 35,819評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站颠猴,受9級特大地震影響关划,放射性物質(zhì)發(fā)生泄漏芙粱。R本人自食惡果不足惜祭玉,卻給世界環(huán)境...
    茶點故事閱讀 41,482評論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望春畔。 院中可真熱鬧脱货,春花似錦岛都、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,023評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至扣孟,卻和暖如春烫堤,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背凤价。 一陣腳步聲響...
    開封第一講書人閱讀 33,149評論 1 272
  • 我被黑心中介騙來泰國打工鸽斟, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人利诺。 一個月前我還...
    沈念sama閱讀 48,409評論 3 373
  • 正文 我出身青樓富蓄,卻偏偏與公主長得像,于是被迫代替她去往敵國和親慢逾。 傳聞我的和親對象是個殘疾皇子立倍,可洞房花燭夜當晚...
    茶點故事閱讀 45,086評論 2 355

推薦閱讀更多精彩內(nèi)容