正則表達(dá)式

非確定有限狀態(tài)機(jī)
我們可以將KMP算法看做一臺(tái)由模式字符串構(gòu)造的能夠掃描文本的有限狀態(tài)自動(dòng)機(jī)焊刹,而對(duì)于正則表達(dá)式我們要將這個(gè)思想推廣擎值。
KMP的有限狀態(tài)自動(dòng)機(jī)會(huì)根據(jù)文本中的字符改變自身的狀態(tài)。當(dāng)且僅當(dāng)自動(dòng)機(jī)達(dá)到停止?fàn)顟B(tài)時(shí)它才找到了一個(gè)匹配眉抬。算法本身就是模擬這種自動(dòng)機(jī)儡嘶,這種自動(dòng)機(jī)運(yùn)行很容易模擬的原因是因?yàn)樗谴_定的:每種狀態(tài)的轉(zhuǎn)換都完全由文本中的字符所決定张峰。
要處理正則表達(dá)式,就需要一種更加強(qiáng)大的抽象狀態(tài)機(jī)堪簿。因?yàn)榛虿僮鞯拇嬖谌詣?dòng)機(jī)無(wú)法僅根據(jù)一個(gè)字符就判斷模式是否出現(xiàn);事實(shí)上椭更,因?yàn)殚]包的存在哪审,自動(dòng)機(jī)甚至無(wú)法知道檢查多少個(gè)字符才會(huì)匹配失效。為了克服這些困難虑瀑,我們需要非確定性的自動(dòng)機(jī):當(dāng)面對(duì)匹配模式的多種可能時(shí),自動(dòng)機(jī)能夠“猜出”正確的轉(zhuǎn)換,也就是所謂的非確定有限狀態(tài)自動(dòng)機(jī)(NFA)虐骑。
Kleene定理是理論計(jì)算機(jī)科學(xué)中的一個(gè)重要結(jié)論俱两,它證明了對(duì)于任意正則表達(dá)式都存在一個(gè)與之對(duì)應(yīng)的非確定有限狀態(tài)機(jī)(反之亦然)。
NFA中從一個(gè)狀態(tài)轉(zhuǎn)移到另一個(gè)狀態(tài)規(guī)則與DFA有所不同:

  • 如果當(dāng)前狀態(tài)和字母表中的一個(gè)字符相對(duì)應(yīng)且文本中的當(dāng)前字符和該字符相匹配痛侍,自動(dòng)機(jī)可以燒過(guò)文本中的該字符并轉(zhuǎn)換到下一個(gè)狀態(tài)(匹配轉(zhuǎn)換朝氓,具有唯一性)。
  • 自動(dòng)機(jī)可以通過(guò)紅色的邊轉(zhuǎn)換到另一個(gè)狀態(tài)而不掃描文本中的任何字符(可以轉(zhuǎn)換至多種狀態(tài))恋日。

以上充分說(shuō)明了NFA和DFA之間的關(guān)鍵區(qū)別膀篮,NFA離開(kāi)一個(gè)狀態(tài)的轉(zhuǎn)換有多種,因此從這種狀態(tài)可能進(jìn)行的轉(zhuǎn)換是不確定的岂膳。但和DFA一樣誓竿,列出所有狀態(tài)的轉(zhuǎn)換即可追蹤NFA處理文本字符串的軌跡,而找到這一序列的方法就是系統(tǒng)的嘗試所有的可能性谈截。

判定一個(gè)長(zhǎng)度為M的正則表達(dá)式所對(duì)應(yīng)的NFA能否識(shí)別一段長(zhǎng)度為N的文本所需的時(shí)間在最壞的情況下和MN成正比筷屡。

public boolean recognizes(String txt){
    Bag<Integer> pc = new Bag<Integer>();
    Directed dfs = new DirectedDFS(G,0);
    for(int v = 0; v<G.V(); v++)
        if(dfs.marked(v)) pc.add(v);

    for(int i = 0; i<txt.length(); i++){
        Bag<Integer> match = new Bag<Integer>();
        for(int v: pc)
            if( v<M)
                if(re[v] == txt.charAt(i) || re[v] == ".")
                    match.add(v+1);
        pc = new Bag<integer>();
        dfs = new DirectedDFS(G,match);
        for(int v=0; v<G.V(); v++)
            if(dfs.marked(v)) pc.add(v);
    }
    for(int v: pc) if(v==M) return true;
    return false;
}

將正則表達(dá)式轉(zhuǎn)化為NFA的過(guò)程在某種程度上類(lèi)似于之前所說(shuō)過(guò)的Dijkstra的雙棧算法對(duì)表達(dá)式求值簸喂。

public class NFA{
    private char[] re;
    private Digraph G;
    private int M;

    public NFA(String regexp){
        Stack<Integer> ops = new Stack<Integer>();
        re = regexp.toCharArray();
        M = re.length;
        G = new Digraph(M+1);

        for(int i=0; i<M; i++){
            int lp = i;
            if(re[i] == '(' || re[i] == '|')
                ops.push(i);
            else if(re[i] == ')'){
                int or = ops.pop();
                if(re[or] == '|'){
                    lp = ops.pop();
                    G.addEdge(lp, or+1);
                    G.addEdge(or, i);
                }
                else  lp = or;
            }
            if( i<M-1 && re[i+1] == '*'){
                G.addEdge(lp, i+1);
                G.addEdge(i+1, lp);
            }
            if(re[i] == '(' || re[i] == '*' || re[i] == ')')
                G.addEdge(i, i+1);
        }
    }
    public boolean recognizes(String txt)
}
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末毙死,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子喻鳄,更是在濱河造成了極大的恐慌扼倘,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,277評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異再菊,居然都是意外死亡爪喘,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門(mén)纠拔,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)秉剑,“玉大人,你說(shuō)我怎么就攤上這事稠诲≌炫簦” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 163,624評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵臀叙,是天一觀的道長(zhǎng)略水。 經(jīng)常有香客問(wèn)我,道長(zhǎng)匹耕,這世上最難降的妖魔是什么聚请? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,356評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮稳其,結(jié)果婚禮上驶赏,老公的妹妹穿的比我還像新娘。我一直安慰自己既鞠,他們只是感情好煤傍,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,402評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著嘱蛋,像睡著了一般蚯姆。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上洒敏,一...
    開(kāi)封第一講書(shū)人閱讀 51,292評(píng)論 1 301
  • 那天龄恋,我揣著相機(jī)與錄音,去河邊找鬼凶伙。 笑死郭毕,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的函荣。 我是一名探鬼主播显押,決...
    沈念sama閱讀 40,135評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼傻挂!你這毒婦竟也來(lái)了乘碑?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書(shū)人閱讀 38,992評(píng)論 0 275
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤金拒,失蹤者是張志新(化名)和其女友劉穎兽肤,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,429評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡轿衔,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,636評(píng)論 3 334
  • 正文 我和宋清朗相戀三年沉迹,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片害驹。...
    茶點(diǎn)故事閱讀 39,785評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖蛤育,靈堂內(nèi)的尸體忽然破棺而出宛官,到底是詐尸還是另有隱情,我是刑警寧澤瓦糕,帶...
    沈念sama閱讀 35,492評(píng)論 5 345
  • 正文 年R本政府宣布底洗,位于F島的核電站,受9級(jí)特大地震影響咕娄,放射性物質(zhì)發(fā)生泄漏亥揖。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,092評(píng)論 3 328
  • 文/蒙蒙 一圣勒、第九天 我趴在偏房一處隱蔽的房頂上張望费变。 院中可真熱鬧,春花似錦圣贸、人聲如沸挚歧。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,723評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)滑负。三九已至,卻和暖如春用含,著一層夾襖步出監(jiān)牢的瞬間矮慕,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,858評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工啄骇, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留痴鳄,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,891評(píng)論 2 370
  • 正文 我出身青樓肠缔,卻偏偏與公主長(zhǎng)得像夏跷,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子明未,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,713評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容