KMP算法及求解next/nextval方法簡要推導

其實嚴蔚敏版《數(shù)據(jù)結(jié)構(gòu)》的4.3節(jié)已經(jīng)把推導過程講得很清楚了(不過沒講nextval)囱井,個人覺得比算法導論上要好懂。雖然本人也是花了好多時間才搞清楚盹靴,原因還是嚴蔚敏書上的偽碼真是太差,而且每次理論看到一半時就想去看偽碼,結(jié)果還是不懂崖技。這次靜下心來把書上理論部分一步步看下來,發(fā)現(xiàn)其實挺簡單的钟哥。
這里自己簡要推導下并給出C++實現(xiàn)迎献。網(wǎng)上的教程一搜一大把,這里主要還是便于自己記憶腻贰。

next數(shù)組含義


如上圖所示吁恍,樸素匹配算法在匹配失敗時,模式串向右移動1位播演。而KMP匹配則可能向右移動多位冀瓦,因為灰色部分bcab中cab和ab都是以c和a開頭的,不可能與b相等写烤,KMP匹配做了個預處理(即求解next數(shù)組)翼闽,使得能在此時知道移動多少位。
下文中用s表示匹配串洲炊,p表示模式串感局,a[i..j]表示數(shù)組a[]的一個閉區(qū)間子序列a[i],a[i+1],...,a[j]
當前狀態(tài)s[i-k..i-1]=p[0..k-1],而s[i]!=p[k]暂衡。
j=next[k]<k代表下次將s[i]p[j]進行比較询微。
既然如此,p[j]的前綴就和s[i]的前綴必須相同狂巢,即s[i-j..i-1]=p[k-j..k-1]
由于j<k拓提,結(jié)合當前狀態(tài),有s[i-j..j-1]=p[0..j-1]隧膘,因為等號兩邊分別為s[i-k..i-1]p[0..k-1]的前綴代态。
因此有p[0..j-1]=p[k-j..k-1],問題可以變成求解p[0..k-1]的前綴=后綴時的最長長度(這話有點繞= =)疹吃,比如對"abcab"蹦疑,最長長度是2,對應此時的前綴和后綴均為"ab"萨驶。

KMP算法實現(xiàn)

size_t search_kmp(const std::string& src, const std::string& pattern, size_t pos = 0) {
    auto next = get_next(pattern);   // 關(guān)鍵!!!
    size_t i = pos;  // 匹配串當前字符序號
    size_t j = 0;  // 模式串當前字符序號
    while (i < src.size() && j < pattern.size()) {
        if (src[i] == pattern[j]) {
            i++;
            j++;
        } else {
            j = next[j];
            // j == -1即整個模式串要與s[i+1..n]進行匹配
            if (j == static_cast<size_t>(-1)) {
                i++;
                j = 0;
            }
        }
    }
    // -1代表查找失敗
    return (j < pattern.size()) ? -1 : (i - pattern.size());
}

從上述代碼中可以進一步看到next數(shù)組的作用歉摧,于是問題關(guān)鍵就在于求解next數(shù)組,這也是很多筆試題只要求算next數(shù)組的原因。

next數(shù)組求解方法

樸素的求法是找到所有等長前綴和后綴叁温,然后一一比較再悼。但無疑這種做法效率極其低下的。這里用數(shù)學歸納法可以推導遞推式膝但。

  1. next[0]=-1冲九,next[1]=0。因為如果模式串第1位p[0]就匹配失敗跟束,那么就會向右移動1位莺奸,p[0]s[i+1]比較,等價于p[-1]s[i]比較冀宴。而p[1]匹配失敗時灭贷,會用p[0]s[i]進行比較。
  2. 設(shè)next[k]=j略贮,則有p[0..j]=p[k-j..k]甚疟,且不存在更大的j'使得p[0..j ']=p[k-j'..k]。現(xiàn)在求解j'=next[k+1]逃延,分類討論
    2.1 p[j+1]=p[k+1]古拴,則有p[0..j+1]=p[k-j..k+1],因此next[k+1]=next[k]+1真友。
    2.2 p[j+1]!=p[k+1]黄痪,這里就是求解next的關(guān)鍵部分了。此時可以把p[0..k+1]看成匹配串盔然,p[k+1-j'..k+1]看出模式串桅打,該模式串等于p[0..j'-1]。因此p[0..j'-2]=p[k-j'..k]愈案,可以用同樣的方法來滑動該模式串挺尾。
    比如

    現(xiàn)在求解next[6],可以發(fā)現(xiàn)p[2]!=p[6]站绪,然后就可以再比較p[0]p[6]遭铺。

next數(shù)組求解實現(xiàn)

inline std::vector<int> get_next(const std::string& pattern) {
    int n = pattern.size();
    if (n == 0)
        return {};
    if (n == 1)
        return { -1 };

    std::vector<int> next(n);
    next[0] = -1;
    next[1] = 0;
    int k = next[1];

    for (int i = 2; i < n; i++) {
        if (pattern[k] == pattern[i - 1]) {
            k = next[i] = next[i - 1] + 1;
        } else {
            while (true) {
                k = next[k];
                if (k == -1 || pattern[k] == pattern[i - 1])
                    break;
            }
            next[i] = ++k;
        }
    }

    return next;
}

注意while語句部分,可以簡化成像嚴蔚敏書上偽碼一樣恢准,但是不如上面代碼那么直觀魂挂。
至于考題上由于字符串下標一般從1開始,所以next數(shù)組的每個值都要加1馁筐。

nextval數(shù)組

nextval數(shù)組和next數(shù)組的關(guān)系如下

if (p[i] != p[next[i]])
    nextval[i] = next[i];
else
    nextval[i] = nextval[next[i]];

具體nextval為何成立暫時沒找到資料涂召,先應付應試吧。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末敏沉,一起剝皮案震驚了整個濱河市果正,隨后出現(xiàn)的幾起案子炎码,更是在濱河造成了極大的恐慌,老刑警劉巖秋泳,帶你破解...
    沈念sama閱讀 207,113評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件潦闲,死亡現(xiàn)場離奇詭異,居然都是意外死亡迫皱,警方通過查閱死者的電腦和手機歉闰,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,644評論 2 381
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來舍杜,“玉大人,你說我怎么就攤上這事赵辕〖燃ǎ” “怎么了?”我有些...
    開封第一講書人閱讀 153,340評論 0 344
  • 文/不壞的土叔 我叫張陵还惠,是天一觀的道長饲握。 經(jīng)常有香客問我,道長蚕键,這世上最難降的妖魔是什么救欧? 我笑而不...
    開封第一講書人閱讀 55,449評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮锣光,結(jié)果婚禮上笆怠,老公的妹妹穿的比我還像新娘。我一直安慰自己誊爹,他們只是感情好蹬刷,可當我...
    茶點故事閱讀 64,445評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著频丘,像睡著了一般办成。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上搂漠,一...
    開封第一講書人閱讀 49,166評論 1 284
  • 那天迂卢,我揣著相機與錄音,去河邊找鬼桐汤。 笑死而克,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的怔毛。 我是一名探鬼主播拍摇,決...
    沈念sama閱讀 38,442評論 3 401
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼馆截!你這毒婦竟也來了充活?” 一聲冷哼從身側(cè)響起蜂莉,我...
    開封第一講書人閱讀 37,105評論 0 261
  • 序言:老撾萬榮一對情侶失蹤测垛,失蹤者是張志新(化名)和其女友劉穎错洁,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體诈胜,經(jīng)...
    沈念sama閱讀 43,601評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡幕随,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,066評論 2 325
  • 正文 我和宋清朗相戀三年蚁滋,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片赘淮。...
    茶點故事閱讀 38,161評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡辕录,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出梢卸,到底是詐尸還是另有隱情走诞,我是刑警寧澤,帶...
    沈念sama閱讀 33,792評論 4 323
  • 正文 年R本政府宣布蛤高,位于F島的核電站蚣旱,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏戴陡。R本人自食惡果不足惜塞绿,卻給世界環(huán)境...
    茶點故事閱讀 39,351評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望恤批。 院中可真熱鬧异吻,春花似錦、人聲如沸喜庞。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,352評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽赋荆。三九已至笋妥,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間窄潭,已是汗流浹背春宣。 一陣腳步聲響...
    開封第一講書人閱讀 31,584評論 1 261
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留嫉你,地道東北人月帝。 一個月前我還...
    沈念sama閱讀 45,618評論 2 355
  • 正文 我出身青樓,卻偏偏與公主長得像幽污,于是被迫代替她去往敵國和親嚷辅。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,916評論 2 344

推薦閱讀更多精彩內(nèi)容