[算法詳解][KMP]Knuth–Morris–Pratt字符串匹配算法



一個效率非常高的字符串匹配算法

【基本思想】

利用部分匹配表比較字符串S是否包含字符串P

【步驟】

算出一張《部分匹配表》(Partial Match Table)--P
"部分匹配值"就是"前綴"和"后綴"的最長的共有元素的長度。
"前綴"指除了最后一個字符以外,一個字符串的全部頭部組合
"后綴"指除了第一個字符以外废离,一個字符串的全部尾部組合踪栋。
1. 部分匹配表
- "A"的前綴和后綴都為空集菠发,共有元素的長度為0纳决;
- "AB"的前綴為[A]凸椿,后綴為[B]游沿,共有元素的長度為0饰抒;
- "ABC"的前綴為[A, AB],后綴為[BC, C]诀黍,共有元素的長度0袋坑;
- "ABCD"的前綴為[A, AB, ABC],后綴為[BCD, CD, D]眯勾,共有元素的長度為0枣宫;
- "ABCDA"的前綴為[A, AB, ABC, ABCD]疆柔,后綴為[BCDA, CDA, DA, A],共有元素為"A"镶柱,長度為1旷档;
- "ABCDAB"的前綴為[A, AB, ABC, ABCD, ABCDA],后綴為[BCDAB, CDAB, DAB, AB, B]歇拆,共有元素為"AB"鞋屈,長度為2;
- "ABCDABD"的前綴為[A, AB, ABC, ABCD, ABCDA, ABCDAB]故觅,后綴為[BCDABD, CDABD, DABD, ABD, BD, D]厂庇,共有元素的長度為0。

A AB ABC ABCD ABCDA ABCDAB ABCDACD
0 0 0 0 1 2 0

2. next 數(shù)組
next 數(shù)組考慮的是除當前字符外的最長相同前綴后綴输吏。
計算某個字符對應(yīng)的 next 值权旷,就是看這個字符之前的字符串中有多大長度的相同前綴后綴,使其向右移動一位贯溅,然后初始值賦為 -1拄氯。

A B C D A B D
A B C D A B D
-1 0 0 0 0 1 2

3. 遍歷比較
假設(shè)現(xiàn)在文本串 S 匹配到 i 位置,模式串 P 匹配到 j 位置

  • 如果 j = -1它浅,或者當前字符匹配成功(即 S[i] == P[j])译柏,都令 i++,j++姐霍,繼續(xù)匹配下一個字符鄙麦;
  • 如果 j != -1,且當前字符匹配失斈髡邸(即 S[i] != P[j])胯府,則令 i 不變,j = next[j]恨胚。此舉意味著失配時骂因,模式串 P 相對于文本串 S 向右移動了 j - next [j] 位。
    • 換言之与纽,當匹配失敗時侣签,模式串向右移動的位數(shù)為:失配字符所在位置 - 失配字符對應(yīng)的 next 值,即移動的實際位數(shù)為:j - next[j]急迂,且此值大于等于1影所。

【實例分析】


S[10] 跟 P[6] 匹配失敗。j = next[j]僚碎,即 j 從 6 變到 2(字符 D 對應(yīng)部分匹配表的值為0猴娩,對應(yīng)的 next 值為 2)



C 處再度失配
j = next[j] = 0



A 與空格失配,j = next[j] = -1。
i++,j++

【偽代碼】

假設(shè)現(xiàn)在文本串 S 匹配到 i 位置卷中,模式串 P 匹配到 j 位置

*   如果 j = -1矛双,或者當前字符匹配成功(即 S[i] == P[j]),都令 i++蟆豫,j++议忽,繼續(xù)匹配下一個字符;
*   如果 j != -1十减,且當前字符匹配失斦恍摇(即 S[i] != P[j]),則令 i 不變帮辟,j = next[j]速址。此舉意味著失配時,模式串 P 相對于文本串 S 向右移動了 j - next [j] 位由驹。

【代碼實現(xiàn)】

int KmpSearch(char* s, char* p)  
{  
    int i = 0;  
    int j = 0;  
    int sLen = strlen(s);  
    int pLen = strlen(p);  
    while (i < sLen && j < pLen)  
    {  
        //①如果j = -1芍锚,或者當前字符匹配成功(即S[i] == P[j]),都令i++蔓榄,j++      
        if (j == -1 || s[i] == p[j])  
        {  
            i++;  
            j++;  
        }  
        else  
        {  
            //②如果j != -1并炮,且當前字符匹配失敗(即S[i] != P[j])润樱,則令 i 不變渣触,j = next[j]      
            //next[j]即為j所對應(yīng)的next值        
            j = next[j];  
        }  
    }  
    if (j == pLen)  
        return i - j;  
    else  
        return -1;  
}  

【性能分析】

O(n+m)

字符串匹配的KMP算法
KMP 算法

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市壹若,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌皂冰,老刑警劉巖店展,帶你破解...
    沈念sama閱讀 217,542評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異秃流,居然都是意外死亡赂蕴,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,822評論 3 394
  • 文/潘曉璐 我一進店門舶胀,熙熙樓的掌柜王于貴愁眉苦臉地迎上來概说,“玉大人,你說我怎么就攤上這事嚣伐√桥猓” “怎么了?”我有些...
    開封第一講書人閱讀 163,912評論 0 354
  • 文/不壞的土叔 我叫張陵轩端,是天一觀的道長放典。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么奋构? 我笑而不...
    開封第一講書人閱讀 58,449評論 1 293
  • 正文 為了忘掉前任壳影,我火速辦了婚禮,結(jié)果婚禮上弥臼,老公的妹妹穿的比我還像新娘宴咧。我一直安慰自己,他們只是感情好径缅,可當我...
    茶點故事閱讀 67,500評論 6 392
  • 文/花漫 我一把揭開白布悠汽。 她就那樣靜靜地躺著,像睡著了一般芥驳。 火紅的嫁衣襯著肌膚如雪柿冲。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,370評論 1 302
  • 那天兆旬,我揣著相機與錄音假抄,去河邊找鬼。 笑死丽猬,一個胖子當著我的面吹牛宿饱,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播脚祟,決...
    沈念sama閱讀 40,193評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼谬以,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了由桌?” 一聲冷哼從身側(cè)響起为黎,我...
    開封第一講書人閱讀 39,074評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎行您,沒想到半個月后铭乾,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,505評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡娃循,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,722評論 3 335
  • 正文 我和宋清朗相戀三年炕檩,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片捌斧。...
    茶點故事閱讀 39,841評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡笛质,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出捞蚂,到底是詐尸還是另有隱情妇押,我是刑警寧澤,帶...
    沈念sama閱讀 35,569評論 5 345
  • 正文 年R本政府宣布洞难,位于F島的核電站舆吮,受9級特大地震影響揭朝,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜色冀,卻給世界環(huán)境...
    茶點故事閱讀 41,168評論 3 328
  • 文/蒙蒙 一潭袱、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧锋恬,春花似錦屯换、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,783評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至索守,卻和暖如春晕窑,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背卵佛。 一陣腳步聲響...
    開封第一講書人閱讀 32,918評論 1 269
  • 我被黑心中介騙來泰國打工杨赤, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人截汪。 一個月前我還...
    沈念sama閱讀 47,962評論 2 370
  • 正文 我出身青樓疾牲,卻偏偏與公主長得像,于是被迫代替她去往敵國和親衙解。 傳聞我的和親對象是個殘疾皇子阳柔,可洞房花燭夜當晚...
    茶點故事閱讀 44,781評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 字符串匹配KMP算法詳解 1. 引言 以前看過很多次KMP算法,一直覺得很有用蚓峦,但都沒有搞明白舌剂,一方面是網(wǎng)上很少有...
    張晨輝Allen閱讀 2,400評論 0 3
  • 數(shù)據(jù)結(jié)構(gòu)與算法--KMP算法查找子字符串 部分內(nèi)容和圖片來自這三篇文章: 這篇文章、這篇文章枫匾、還有這篇他們寫得非常...
    sunhaiyu閱讀 1,737評論 1 21
  • title: 串的模式匹配算法之kmptags: 數(shù)據(jù)結(jié)構(gòu)與算法之美author: 辰砂tj 1.引言 首先我們需...
    tojian閱讀 972評論 0 0
  • KMP算法目的:盡快解決字符串匹配問題架诞,時間復雜度為O(m+n),而常規(guī)的簡單匹配算法時間復雜度:O(m*n) 這...
    安靜1337閱讀 978評論 0 51
  • 為什么要寫KMP字符串匹配算法呢干茉?因為近段時間在補數(shù)據(jù)結(jié)構(gòu)和算法,然后重拾大學的《大話數(shù)據(jù)結(jié)構(gòu)》很泊,記錄一下學習的進...
    一劍孤城閱讀 4,363評論 0 8