用 Antlr 重構(gòu)腳本解釋器

[圖片上傳失敗...(image-636c17-1659876521176)]

前言

在上一個(gè)版本實(shí)現(xiàn)的腳本解釋器 GScript 中實(shí)現(xiàn)了基本的四則運(yùn)算以及 AST 的生成棒拂。

[圖片上傳失敗...(image-2b6f3b-1659876521176)]

當(dāng)我準(zhǔn)備再新增一個(gè) % 取模的運(yùn)算符時(shí),會(huì)發(fā)現(xiàn)工作很繁瑣而且?guī)缀醵际侵貜?fù)的玫氢;主要是兩步:

  1. 需要在詞法解析器中新增對 % 符號(hào)的支持。
  2. 在語法解析器遍歷 AST 時(shí)對 % token 實(shí)現(xiàn)具體邏輯谜诫。

其中的詞法解析和遍歷 AST 完全是重復(fù)工作漾峡,所以我們可否能夠簡化這兩步呢?

Antlr

Antlr 就是做幫我們解決這些問題的常用工具喻旷,利用它我們只需要編寫詞法文件生逸,然后就可以自動(dòng)生成詞法、語法解析器,并且可以生成不同語言的代碼槽袄。

下面以 GScript 的示例來看看 antlr 是如何幫我們生成詞法分析器的烙无。

func TestGScriptVisitor_Visit_Lexer(t *testing.T) {
    expression := "(2+3) * 2"
    input := antlr.NewInputStream(expression)
    lexer := parser.NewGScriptLexer(input)
    for {
        t := lexer.NextToken()
        if t.GetTokenType() == antlr.TokenEOF {
            break
        }
        fmt.Printf("%s (%q) %d\n",
            lexer.SymbolicNames[t.GetTokenType()], t.GetText(),t.GetColumn())
    }
}
//output:
 ("(") 0
DECIMAL_LITERAL ("2") 1
PLUS ("+") 2
DECIMAL_LITERAL ("3") 3
 (")") 4
MULT ("*") 6
DECIMAL_LITERAL ("2") 8

Antlr 會(huì)自動(dòng)將我們的表達(dá)式解析為 token,遍歷 token 時(shí)還能拿到該 token 所在的代碼行數(shù)遍尺、位置等信息截酷,在編譯期間做語法檢查非常有用。

要實(shí)現(xiàn)這些我們只需要編寫詞法乾戏、語法規(guī)則文件即可迂苛。

剛才的示例所對應(yīng)的詞法、語法規(guī)則如下:

expr
    : '(' expr ')'                        #NestedExpr
    | liter=literal #Liter
    | lhs=expr bop=( MULT | DIV ) rhs=expr #MultDivExpr
    | lhs=expr bop=MOD rhs=expr            #ModExpr
    | lhs=expr bop=( PLUS | SUB ) rhs=expr #PlusSubExpr
    | expr bop=(LE | GE | GT | LT ) expr # GLe
    | expr bop=(EQUAL | NOTEQUAL) expr # EqualOrNot
    ;
DECIMAL_LITERAL:    ('0' | [1-9] (Digits? | '_'+ Digits)) [lL]?;    

完整規(guī)則:https://github.com/crossoverJie/gscript/blob/main/GScript.g4

運(yùn)行:

antlr -Dlanguage=Go -o parser -visitor -no-listener GScript.g4

就可以幫我們生成 Go 的代碼(默認(rèn)是 Java)鼓择,關(guān)于 Antlr 的詞法三幻、文法規(guī)則以及安裝步驟請參考官網(wǎng)

而我們要實(shí)現(xiàn)具體的語法邏輯時(shí)只需要實(shí)現(xiàn)相關(guān)的接口呐能,Antlr 會(huì)自動(dòng)遍歷 AST(當(dāng)然也可以手動(dòng)控制)念搬,同時(shí)在訪問不同的 AST 節(jié)點(diǎn)時(shí)會(huì)回調(diào)我們自己實(shí)現(xiàn)的接口,這樣我們就能編寫自己的語法規(guī)則了摆出。

以這里的新增的取模運(yùn)算為例:

func (v *GScriptVisitor) VisitModExpr(ctx *parser.ModExprContext) interface{} {
    lhs := v.Visit(ctx.GetLhs())
    rhs := v.Visit(ctx.GetRhs())
    return lhs.(int) % rhs.(int)
}

當(dāng) Antlr 回調(diào) VisitModExpr 方法時(shí)朗徊,便能獲取到 % 符號(hào)左右兩側(cè)的數(shù)據(jù),這時(shí)只需要做相關(guān)運(yùn)算即可懊蒸。

基于這個(gè)模式這次新增了一個(gè) statement荣倾,具體語法如下:

func TestGScriptVisitor_VisitIfElse8(t *testing.T) {
    expression := `
if(3!=(1+2)){
    return 1+3
} else {
    return false
}`
    input := antlr.NewInputStream(expression)
    lexer := parser.NewGScriptLexer(input)
    stream := antlr.NewCommonTokenStream(lexer, 0)
    parser := parser.NewGScriptParser(stream)
    parser.BuildParseTrees = true
    tree := parser.Prog()
    visitor := GScriptVisitor{}
    var result = visitor.Visit(tree)
    fmt.Println(expression, " result:", result)
    assert.Equal(t, result, false)
}

Antlr 還有其他各種優(yōu)勢,比如可以解決:

  • 左遞歸骑丸。
  • 二義性舌仍。
  • 優(yōu)先級。

等問題通危。

這里也推薦在 IDE 中安裝 Antlr 的插件铸豁,這樣就可以直觀的查看 AST 語法樹,可以幫我們更好的調(diào)試代碼菊碟。

[圖片上傳失敗...(image-f05c05-1659876521176)]
[圖片上傳失敗...(image-1adeb1-1659876521176)]

升級 xjson

借助 GScript 提供的 statement节芥,xjson 也提供了有些有意思的寫法:
[圖片上傳失敗...(image-4a7b95-1659876521176)]

因?yàn)?xjson 的四則運(yùn)算語法沒有使用 Antlr 生成,所以為了能支持 GScript 提供的 statement 需要手寫許多詞法代碼逆害。

[圖片上傳失敗...(image-66f2e8-1659876521176)]

這也體現(xiàn)了 Antlr 這類前端工具的重要性头镊,效率提升是非常明顯的。

總結(jié)

借助于 Antlr 后續(xù) GScript 會(huì)繼續(xù)支持函數(shù)調(diào)用魄幕、更完善的類型系統(tǒng)相艇、面向?qū)ο蟮忍匦裕桓信d趣的朋友請持續(xù)關(guān)注纯陨。

源碼地址:
https://github.com/crossoverJie/gscript

https://github.com/crossoverJie/xjson

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末坛芽,一起剝皮案震驚了整個(gè)濱河市留储,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌咙轩,老刑警劉巖获讳,帶你破解...
    沈念sama閱讀 206,214評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異活喊,居然都是意外死亡丐膝,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評論 2 382
  • 文/潘曉璐 我一進(jìn)店門胧弛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來尤误,“玉大人,你說我怎么就攤上這事结缚∷鹞睿” “怎么了?”我有些...
    開封第一講書人閱讀 152,543評論 0 341
  • 文/不壞的土叔 我叫張陵红竭,是天一觀的道長尤勋。 經(jīng)常有香客問我,道長茵宪,這世上最難降的妖魔是什么最冰? 我笑而不...
    開封第一講書人閱讀 55,221評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮稀火,結(jié)果婚禮上暖哨,老公的妹妹穿的比我還像新娘。我一直安慰自己凰狞,他們只是感情好篇裁,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,224評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著赡若,像睡著了一般达布。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上逾冬,一...
    開封第一講書人閱讀 49,007評論 1 284
  • 那天黍聂,我揣著相機(jī)與錄音,去河邊找鬼身腻。 笑死产还,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的嘀趟。 我是一名探鬼主播雕沉,決...
    沈念sama閱讀 38,313評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼去件!你這毒婦竟也來了坡椒?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,956評論 0 259
  • 序言:老撾萬榮一對情侶失蹤尤溜,失蹤者是張志新(化名)和其女友劉穎倔叼,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體宫莱,經(jīng)...
    沈念sama閱讀 43,441評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡丈攒,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,925評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了授霸。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片巡验。...
    茶點(diǎn)故事閱讀 38,018評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖碘耳,靈堂內(nèi)的尸體忽然破棺而出显设,到底是詐尸還是另有隱情,我是刑警寧澤辛辨,帶...
    沈念sama閱讀 33,685評論 4 322
  • 正文 年R本政府宣布捕捂,位于F島的核電站,受9級特大地震影響斗搞,放射性物質(zhì)發(fā)生泄漏指攒。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,234評論 3 307
  • 文/蒙蒙 一僻焚、第九天 我趴在偏房一處隱蔽的房頂上張望允悦。 院中可真熱鬧,春花似錦虑啤、人聲如沸隙弛。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽驶鹉。三九已至,卻和暖如春铣墨,著一層夾襖步出監(jiān)牢的瞬間室埋,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評論 1 261
  • 我被黑心中介騙來泰國打工伊约, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留姚淆,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,467評論 2 352
  • 正文 我出身青樓屡律,卻偏偏與公主長得像腌逢,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子超埋,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,762評論 2 345

推薦閱讀更多精彩內(nèi)容