自然語言處理——3.2 有限自動機與正則文法

確定的有限自動機(definite automata, DFA)

1. 定義

確定的有限自動機 M 是一個五元組:
M = (\Sigma ,Q,\delta ,{q_0},F)

  • \Sigma 是輸入符號的有窮集合拟赊;
  • Q 是狀態(tài)的有限集合具壮;
  • {q_0} \in Q是初始狀態(tài);
  • F 是終止狀態(tài)集合,F \subseteq Q
  • \deltaQ\Sigma 的直積Q×\SigmaQ (下一個狀態(tài)) 的映射首尼。它支配著有限狀態(tài)控制的行為,有時也稱為狀態(tài)轉(zhuǎn)移函數(shù)叹放。

2. DFA示意圖


處在狀態(tài)
q \in Q
中的有限控制器從左到右依次從輸入帶上讀入字符饰恕。開始時有限控制器處在狀態(tài)
q_0
挠羔,并注視
{\Sigma ^*}
中一個鏈的最左符號井仰。映射
\delta (q,a) = q'(q,q' \in Q,a \in \Sigma )
表示在狀態(tài)
q
時,若輸入符號為
a
破加,則自動機進入狀態(tài)
q’
并且將輸入頭向右移動一個字符俱恶。

3. 狀態(tài)轉(zhuǎn)換圖

映射\delta (q,a) = q'可以由狀態(tài)變換圖描述。


為了明確起見,終止狀態(tài)用雙圈表示合是,起始狀態(tài)用有“開始”標記的箭頭表示了罪。如:

4. DFA 定義的語言

如果一個句子x 使得有限自動機M\delta (q_0,a) = p,p \in F,那么聪全,稱句子xM 接受泊藕。
M 定義的語言 T(M) 就是被 M 接受的句子的全集。即:
T(M) = \{ x|\delta ({q_0},x) \in F\}

  • 例子:

    x = 110101M 接受难礼。T(M)= {含偶數(shù)個0和偶數(shù)個1的鏈}

不確定的有限自動機(non-definite automata, NFA)

1. 定義

不確定的有限自動機 M 是一個五元組:
M = (\Sigma ,Q,\delta ,{q_0},F)

  • \Sigma 是輸入符號的有窮集合娃圆;
  • Q 是狀態(tài)的有限集合;
  • {q_0} \in Q是初始狀態(tài)蛾茉;
  • F 是終止狀態(tài)集合讼呢,F \subseteq Q
  • \deltaQ\Sigma 的直積Q×\SigmaQ的冪集2^Q 的映射谦炬。

DFA與NFA

1. DFA與NFA的唯一區(qū)別

NFADFA 的唯一區(qū)別是:在 NFA\delta(q, a) 是一個狀態(tài)集合悦屏,而在 DFA\delta(q, a) 是一個狀態(tài)。

  • 例子

    該自動機為不確定自動機键思;句子x =01011 可以被接受础爬。

1. DFA與NFA的關(guān)系

設(shè)L 是一個被 NFA 所接受的句子的集合,則存在一個 DFA它能夠接受L 吼鳞。

正則文法與有限自動機的關(guān)系

1. 正則文法 \to 自動機

  • 定理
    G = (V_N,V_T, P, S )是一個正則文法幕帆,則存在一個有限自動機M=(\Sigma ,Q,\delta , q_0, F),使得:T(M) = L(G)赖条。

  • G 構(gòu)造M 的一般步驟:
    (1) 令\Sigma =V_T, Q=V_N \cup { T }失乾,q_0=S,其中纬乍, T 是一個新增加的非終結(jié)符碱茁。
    (2) 如果在P 中有產(chǎn)生式S \to \varepsilon ,則F={S, T}仿贬,否則F={T}纽竣。
    (3) 如果在P 中有產(chǎn)生式B \to aB \in V_N 茧泪,a \in V_T蜓氨,則T \in \delta(B, a)
    (4) 如果在P 中有產(chǎn)生式B \to aC队伟,B, C \in V_N穴吹,a \in V_T, 則 C \in \delta(B, a)
    (5) 對于每一個a \in V_T,有\delta(T, a) = \emptyset嗜侮。

1. 自動機 \to 正則文法

  • 定理
    M=(\Sigma ,Q,\delta , q_0, F)是一有限自動機港令,則存在正則文法G = (V_N,V_T, P, S ),使L(G)=T(M)啥容。

  • M 構(gòu)造G 的一般步驟:
    (1) 令V_N = Q,V_T = \Sigma顷霹,S =q_0 咪惠;
    (2) 如果C \in \delta(B, a),B, C \in Q淋淀,a \in \Sigma遥昧,則在P 中有產(chǎn)生式B \to aC
    (3) 如果C \in \delta(B, a)朵纷,C \in F渠鸽,則在P中有產(chǎn)生式B \to a

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末柴罐,一起剝皮案震驚了整個濱河市徽缚,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌革屠,老刑警劉巖凿试,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異似芝,居然都是意外死亡那婉,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進店門党瓮,熙熙樓的掌柜王于貴愁眉苦臉地迎上來详炬,“玉大人,你說我怎么就攤上這事寞奸∏好眨” “怎么了?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵枪萄,是天一觀的道長隐岛。 經(jīng)常有香客問我,道長瓷翻,這世上最難降的妖魔是什么聚凹? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮齐帚,結(jié)果婚禮上妒牙,老公的妹妹穿的比我還像新娘。我一直安慰自己对妄,他們只是感情好湘今,可當我...
    茶點故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著饥伊,像睡著了一般象浑。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上琅豆,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天愉豺,我揣著相機與錄音,去河邊找鬼茫因。 笑死蚪拦,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的冻押。 我是一名探鬼主播驰贷,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼洛巢!你這毒婦竟也來了括袒?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤稿茉,失蹤者是張志新(化名)和其女友劉穎锹锰,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體漓库,經(jīng)...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡恃慧,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了渺蒿。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片痢士。...
    茶點故事閱讀 38,577評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖茂装,靈堂內(nèi)的尸體忽然破棺而出怠蹂,到底是詐尸還是另有隱情,我是刑警寧澤少态,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布褥蚯,位于F島的核電站,受9級特大地震影響况增,放射性物質(zhì)發(fā)生泄漏赞庶。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一澳骤、第九天 我趴在偏房一處隱蔽的房頂上張望歧强。 院中可真熱鬧,春花似錦为肮、人聲如沸摊册。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽茅特。三九已至忘分,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間白修,已是汗流浹背妒峦。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留兵睛,地道東北人肯骇。 一個月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像祖很,于是被迫代替她去往敵國和親笛丙。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,452評論 2 348

推薦閱讀更多精彩內(nèi)容