練習 35:解釋器
譯者:飛龍
協(xié)議:CC BY-NC-SA 4.0
自豪地采用谷歌翻譯
解析中的最后一個練習應該既具有挑戰(zhàn)性又有趣掌桩。你終于可以看到铺厨,你的微型 Python 腳本運行并做了一些事情。難以理解這個章節(jié)和解析的概念很正常。如果你發(fā)現(xiàn)你已經(jīng)到達了這里革娄,而且你不太明白發(fā)生了什么,請退后一步纪他,再考慮在這一部分做一些練習桶至。在繼續(xù)之前,重復幾次這個章節(jié)啦桌,這可以幫助你在最后兩個練習中制作自己的小語言溯壶。
我故意不會在本練習中包含任何代碼,以便你必須根據(jù)解釋器工作方式的描述來嘗試甫男。你已經(jīng)有了 Python 作為參考且改,我們的微型 Python 示例應該如何操作這些小語句。你知道如何用訪問者模式來遍歷你的解析樹板驳。剩下的就是讓你編寫一個解釋器又跛,它可以將它們結(jié)合在一起,并使你的小腳本運行若治。
解釋器和編譯器
在編程語言的世界里慨蓝,存在解釋語言和編譯語言感混。編譯語言接受你的輸入的源碼,并進行掃描菌仁,解析和分析階段。然后静暂,編譯器基于這個分析產(chǎn)生機器碼济丘,通過遍歷它并編寫真正的(或假的)計算機所需的字節(jié),來使 CPU 運行洽蛀。一些編譯器增加了一個額外的步驟摹迷,將輸入的源碼翻譯成通用的“中間語言”,然后將其編譯為機器的字節(jié)郊供。編譯器通常是確定的峡碉,因為你通常不能僅僅運行編譯器,而是首先必須通過編譯器運行源代碼驮审,然后執(zhí)行結(jié)果鲫寄。C 是一個經(jīng)典的編譯器,你可以這樣運行 C 程序:
$ cc ex1.c -o ex1
$ ./ex1
cc
命令是“C 編譯器”的意思疯淫,也就是說地来,你選取了文件ex1.c
,掃描熙掺,解析未斑,并進行分析,然后輸出可執(zhí)行字節(jié)到文件ex1
币绩。一旦你完成了蜡秽,你就可以像其他任何程序一樣運行它。
解釋器不會生成你運行的編譯后字節(jié)碼缆镣,而是直接運行并分析結(jié)果芽突。它“解釋”輸入語言,就像我把我的漢語轉(zhuǎn)換為我朋友的泰語董瞻。它加載源文件诉瓦,然后像編譯器那樣進行掃描,解析和分析力细。之后睬澡,它只是使用解釋器的自己的語言(在這里是 Python),來根據(jù)分析來運行它眠蚂。
如果我們要在 Python 中實現(xiàn) JavaScript 解釋器煞聪,我們會“使用 Python 解釋 JavaScript”。JavaScript 是我的漢語逝慧,一個解釋器正在為我將其憑空解釋為 Python(泰語)昔脯。如果我想用 Python 解釋 JavaScript 的1 + 2
啄糙,我可能會這樣做:
掃描
1 + 2
并產(chǎn)生記號INT(1) PLUS INT(2)
。將其解析為表達式
AddExpr(IntExpr(1), IntExpr(2))
分析它云稚,將文本
1
和2
轉(zhuǎn)換為實際的 Python 整數(shù)隧饼。使用 Python 代碼
result = 1 + 2
解釋它,我可以將其轉(zhuǎn)給剩余的解析樹静陈。
與之相比燕雁,編譯器會做 1~3 的任何事情。但是在第四步它會編寫字節(jié)碼(機器碼)到另一個文件鲸拥,我可以將其運行在 CPU 上拐格。
Python 兩者都是
Python 更現(xiàn)代化,通過幾乎完成編譯和解釋刑赶,利用更快的計算機捏浊。它將像解釋器一樣工作,所以你不必經(jīng)歷編譯階段撞叨。但是金踪,解釋器出奇地慢,所以 Python 有一個內(nèi)部的虛擬機牵敷。當你運行腳本時热康,例如python ex1.py
,Python 實際上會運行它并將其編譯到__pycache__
目錄中的ex1.cpython -36.pyc
文件劣领。該文件是字節(jié)碼姐军,Python 程序知道如何加載和運行,它的工作原理就像假的機器代碼尖淘。
譯者注:但是沒有 JIT 的情況下還是很慢奕锌。
你的解釋器永遠不會,也不應該是這樣的村生。你的解釋器應該只是掃描惊暴,解析,分析和解釋微型 Python 腳本趁桃。
如何編寫解釋器
當你編寫解釋器時辽话,你將需要工作在所有三個階段之間,來修復你錯過或做錯的東西卫病。我建議你先添加數(shù)字油啤,然后再處理更復雜的表達式,直到你的腳本能夠運行蟀苛。我會像這樣完成它:
- 將你的第一個
interpret
方法添加到AddExpr
類益咬,并讓它打印出一條消息。 - 讓你的解釋器能夠可靠地訪問這個類帜平,并傳入它需要的
PunyPyWorld
幽告。 - 一旦你完成了梅鹦,你可以調(diào)用
AddExpr.interpret
來計算它的兩個表達式的和,并返回結(jié)果冗锁。 - 之后齐唆,你必須弄清楚,這個
interpret
步驟的結(jié)果應該到哪里去冻河。為了保持簡單箍邮,讓我們假設(shè)微型 Python 是一種基于表達式的語言,所以一切都返回一個值芋绸。在這種情況下媒殉,對一個解釋器的調(diào)用總是具有返回值担敌,父調(diào)用可以使用它摔敛。 - 最后,由于微型 Python 基于表達式全封,你可以讓你的
Interpreter
打印出其interpret
調(diào)用的最終結(jié)果马昙。 - 如果你這樣做,你將會獲得解釋器的基礎(chǔ)知識刹悴,你可以開始執(zhí)行所有其他的
interpret
方法行楞,使其運行。
挑戰(zhàn)練習
編寫微型 Python 的解釋器土匀,應該只涉及編寫另一個訪問者模式子房,它遍歷分析后的解析樹,并完成解析樹讓它做的任何事情就轧。你唯一的目標就是讓這個很小的(甚至是微型的)腳本運行证杭。這似乎是愚蠢的,因為這只是三行代碼妒御,但它涵蓋編程語言中的各種主題:變量解愤,加法,表達式乎莉,函數(shù)定義和函數(shù)調(diào)用送讲。如果你實現(xiàn)了if
語句,你幾乎可以有一個可工作的編程語言惋啃。
你的任務是編寫一個PunyPyInterpreter
類哼鬓,它接受PunyPyWorld
和PunyPyAnalyzer
的運行結(jié)果來執(zhí)行腳本。你必須實現(xiàn)print
边灭,僅僅用于打印其變量魄宏,但其余的代碼,應該在你遍歷每個產(chǎn)生式類的時候運行存筏。
研究性學習
- 一旦你擁有了
PunyPyInterpreter
宠互,你應該實現(xiàn)if
語句和布爾表達式味榛,然后擴展你的語言測試集,來確保這是有效的予跌。盡可能為這個小型 Python 解釋器增加功能搏色。 - 如何使微型 Python 也擁有語句?
深入學習
你應該能夠?qū)W習盡可能多的語言的語法和規(guī)范券册。繼續(xù)尋找一些語言并學習它們频轿,但是使用該語言的源代碼來完成。你還應該完整學習 https://tools.ietf.org/html/rfc5234 上面的 IETF ABNF 規(guī)范烁焙,來為自己準備接下來的兩項練習航邢。