正則表達(dá)式

非確定有限狀態(tài)機(jī)
我們可以將KMP算法看做一臺(tái)由模式字符串構(gòu)造的能夠掃描文本的有限狀態(tài)自動(dòng)機(jī)焊刹，而對(duì)于正則表達(dá)式我們要將這個(gè)思想推廣擎值。
KMP的有限狀態(tài)自動(dòng)機(jī)會(huì)根據(jù)文本中的字符改變自身的狀態(tài)。當(dāng)且僅當(dāng)自動(dòng)機(jī)達(dá)到停止?fàn)顟B(tài)時(shí)它才找到了一個(gè)匹配眉抬。算法本身就是模擬這種自動(dòng)機(jī)儡嘶，這種自動(dòng)機(jī)運(yùn)行很容易模擬的原因是因?yàn)樗谴_定的：每種狀態(tài)的轉(zhuǎn)換都完全由文本中的字符所決定张峰。
要處理正則表達(dá)式，就需要一種更加強(qiáng)大的抽象狀態(tài)機(jī)堪簿。因?yàn)榛虿僮鞯拇嬖谌詣?dòng)機(jī)無(wú)法僅根據(jù)一個(gè)字符就判斷模式是否出現(xiàn)；事實(shí)上椭更，因?yàn)殚]包的存在哪审，自動(dòng)機(jī)甚至無(wú)法知道檢查多少個(gè)字符才會(huì)匹配失效。為了克服這些困難虑瀑，我們需要非確定性的自動(dòng)機(jī)：當(dāng)面對(duì)匹配模式的多種可能時(shí)，自動(dòng)機(jī)能夠“猜出”正確的轉(zhuǎn)換，也就是所謂的非確定有限狀態(tài)自動(dòng)機(jī)（NFA）虐骑。
Kleene定理是理論計(jì)算機(jī)科學(xué)中的一個(gè)重要結(jié)論俱两，它證明了對(duì)于任意正則表達(dá)式都存在一個(gè)與之對(duì)應(yīng)的非確定有限狀態(tài)機(jī)（反之亦然）。
NFA中從一個(gè)狀態(tài)轉(zhuǎn)移到另一個(gè)狀態(tài)規(guī)則與DFA有所不同：

如果當(dāng)前狀態(tài)和字母表中的一個(gè)字符相對(duì)應(yīng)且文本中的當(dāng)前字符和該字符相匹配痛侍，自動(dòng)機(jī)可以燒過(guò)文本中的該字符并轉(zhuǎn)換到下一個(gè)狀態(tài)（匹配轉(zhuǎn)換朝氓，具有唯一性）。
自動(dòng)機(jī)可以通過(guò)紅色的邊轉(zhuǎn)換到另一個(gè)狀態(tài)而不掃描文本中的任何字符（可以轉(zhuǎn)換至多種狀態(tài)）恋日。

以上充分說(shuō)明了NFA和DFA之間的關(guān)鍵區(qū)別膀篮，NFA離開(kāi)一個(gè)狀態(tài)的轉(zhuǎn)換有多種，因此從這種狀態(tài)可能進(jìn)行的轉(zhuǎn)換是不確定的岂膳。但和DFA一樣誓竿，列出所有狀態(tài)的轉(zhuǎn)換即可追蹤NFA處理文本字符串的軌跡，而找到這一序列的方法就是系統(tǒng)的嘗試所有的可能性谈截。

判定一個(gè)長(zhǎng)度為M的正則表達(dá)式所對(duì)應(yīng)的NFA能否識(shí)別一段長(zhǎng)度為N的文本所需的時(shí)間在最壞的情況下和MN成正比筷屡。

public boolean recognizes(String txt){
    Bag<Integer> pc = new Bag<Integer>();
    Directed dfs = new DirectedDFS(G,0);
    for(int v = 0; v<G.V(); v++)
        if(dfs.marked(v)) pc.add(v);

    for(int i = 0; i<txt.length(); i++){
        Bag<Integer> match = new Bag<Integer>();
        for(int v: pc)
            if( v<M)
                if(re[v] == txt.charAt(i) || re[v] == ".")
                    match.add(v+1）；
        pc = new Bag<integer>();
        dfs = new DirectedDFS(G,match);
        for(int v=0; v<G.V(); v++)
            if(dfs.marked(v)) pc.add(v);
    }
    for(int v: pc) if(v==M) return true;
    return false;
}

將正則表達(dá)式轉(zhuǎn)化為NFA的過(guò)程在某種程度上類(lèi)似于之前所說(shuō)過(guò)的Dijkstra的雙棧算法對(duì)表達(dá)式求值簸喂。

public class NFA{
    private char[] re;
    private Digraph G;
    private int M;

    public NFA(String regexp){
        Stack<Integer> ops = new Stack<Integer>();
        re = regexp.toCharArray();
        M = re.length;
        G = new Digraph(M+1);

        for(int i=0; i<M; i++){
            int lp = i;
            if(re[i] == '(' || re[i] == '|')
                ops.push(i);
            else if(re[i] == ')'){
                int or = ops.pop();
                if(re[or] == '|'){
                    lp = ops.pop();
                    G.addEdge(lp, or+1);
                    G.addEdge(or, i);
                }
                else  lp = or;
            }
            if( i<M-1 && re[i+1] == '*'){
                G.addEdge(lp, i+1);
                G.addEdge(i+1, lp);
            }
            if(re[i] == '(' || re[i] == '*' || re[i] == ')')
                G.addEdge(i, i+1);
        }
    }
    public boolean recognizes(String txt)
}

最后編輯于：2017.12.04 05:29:36

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末毙死，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子喻鳄，更是在濱河造成了極大的恐慌扼倘，老刑警劉巖，帶你破解...
沈念sama閱讀 217,277評(píng)論 6贊 503
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異再菊，居然都是意外死亡爪喘，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,689評(píng)論 3贊 393
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)纠拔，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)秉剑，“玉大人，你說(shuō)我怎么就攤上這事稠诲≌炫簦” “怎么了？”我有些...
開(kāi)封第一講書(shū)人閱讀 163,624評(píng)論 0贊 353
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵臀叙，是天一觀的道長(zhǎng)略水。經(jīng)常有香客問(wèn)我，道長(zhǎng)匹耕，這世上最難降的妖魔是什么聚请？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,356評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮稳其，結(jié)果婚禮上驶赏，老公的妹妹穿的比我還像新娘。我一直安慰自己既鞠，他們只是感情好煤傍，可當(dāng)我...
茶點(diǎn)故事閱讀 67,402評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著嘱蛋，像睡著了一般蚯姆。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上洒敏，一...
開(kāi)封第一講書(shū)人閱讀 51,292評(píng)論 1贊 301
城市分裂傳說(shuō)
那天龄恋，我揣著相機(jī)與錄音，去河邊找鬼凶伙。笑死郭毕，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的函荣。我是一名探鬼主播显押，決...
沈念sama閱讀 40,135評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼傻挂！你這毒婦竟也來(lái)了乘碑？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書(shū)人閱讀 38,992評(píng)論 0贊 275
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤金拒，失蹤者是張志新（化名）和其女友劉穎兽肤，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,429評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡轿衔，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,636評(píng)論 3贊 334
?白月光啟示錄
正文我和宋清朗相戀三年沉迹，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片害驹。...
茶點(diǎn)故事閱讀 39,785評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖蛤育，靈堂內(nèi)的尸體忽然破棺而出宛官，到底是詐尸還是另有隱情，我是刑警寧澤瓦糕，帶...
沈念sama閱讀 35,492評(píng)論 5贊 345
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布底洗，位于F島的核電站，受9級(jí)特大地震影響咕娄，放射性物質(zhì)發(fā)生泄漏亥揖。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,092評(píng)論 3贊 328
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一圣勒、第九天我趴在偏房一處隱蔽的房頂上張望费变。院中可真熱鬧，春花似錦圣贸、人聲如沸挚歧。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,723評(píng)論 0贊 22
一樁弒父案吁峻，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)滑负。三九已至，卻和暖如春用含，著一層夾襖步出監(jiān)牢的瞬間矮慕，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 32,858評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工啄骇，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留痴鳄，地道東北人。一個(gè)月前我還...
沈念sama閱讀 47,891評(píng)論 2贊 370
代替公主和親
正文我出身青樓肠缔，卻偏偏與公主長(zhǎng)得像夏跷，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子明未，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,713評(píng)論 2贊 354

正則表達(dá)式

推薦閱讀更多精彩內(nèi)容