用c語(yǔ)言手搓一個(gè)600行的類c語(yǔ)言解釋器: 給編程初學(xué)者的解釋器教程(2)- 簡(jiǎn)介和設(shè)計(jì)

用c語(yǔ)言手搓一個(gè)600行的類c語(yǔ)言解釋器: 給編程初學(xué)者的解釋器教程(2)- 簡(jiǎn)介和設(shè)計(jì)

項(xiàng)目github地址及源碼:
https://github.com/yunwei37/tryC

需要了解的一些基本概念

編譯器和解釋器的區(qū)別不同

通常我們說(shuō)的 “編譯器” 是一種計(jì)算機(jī)程序挥等,負(fù)責(zé)把一種編程語(yǔ)言編寫(xiě)的源碼轉(zhuǎn)換成另外一種計(jì)算機(jī)代碼投放,后者往往是以二進(jìn)制的形式被稱為目標(biāo)代碼(object code)。這個(gè)轉(zhuǎn)換的過(guò)程通常的目的是生成可執(zhí)行的程序添瓷。

而解釋器是一種計(jì)算機(jī)程序署咽,它直接執(zhí)行由編程語(yǔ)言或腳本語(yǔ)言編寫(xiě)的代碼谱醇,它并不會(huì)把源代碼預(yù)編譯成機(jī)器碼泽论,而是一行一行地分析源代碼并且直接執(zhí)行,相對(duì)編譯器而言可能效率較為低下叫倍,但實(shí)現(xiàn)也相對(duì)簡(jiǎn)單偷卧,并且容易在不同的機(jī)器上進(jìn)行移植(比如x86和mips指令集的機(jī)器)。

先來(lái)看看通常的編譯器是如何實(shí)現(xiàn)的:

編譯器從源碼翻譯為目標(biāo)代碼大致需要這樣幾個(gè)步驟吆倦,每個(gè)步驟都依賴于上一個(gè)步驟的結(jié)果:

  1. 詞法分析:

    編譯器對(duì)源程序進(jìn)行閱讀听诸,并將字符序列,也就是源代碼中一個(gè)個(gè)符號(hào)收集到稱作記號(hào)(token)的單元中蚕泽;比如:

        num = 123.4;
    

    這樣個(gè)賦值語(yǔ)句中晌梨,變量num算是一個(gè)token,“=”符號(hào)算是一個(gè)token须妻,“123.4”算是一個(gè)token仔蝌;每個(gè)token有自己的類別和屬性,比如“123.4”的類別是數(shù)字荒吏,屬性(值)是123.4

  2. 語(yǔ)法分析:

    語(yǔ)法分析指將詞法分析得到的標(biāo)記流(token)進(jìn)行分析敛惊,組成事先定義好的有意義的語(yǔ)句,這與自然語(yǔ)言中句子的語(yǔ)法分析類似绰更。通城萍罚可以用抽象語(yǔ)法樹(shù)表示語(yǔ)法分析的結(jié)果,比如賦值語(yǔ)句:

        num = 123.4 * 3;
    

    可以用這樣一個(gè)抽象語(yǔ)法樹(shù)來(lái)表示:

        graph TD
        = --> num
        = --> *
        * --> 123.4
        * --> 3
    
  3. 語(yǔ)義分析:
    程序的語(yǔ)義就是它的“意思”儡湾,程序的語(yǔ)義確定程序的運(yùn)行方式特恬。語(yǔ)義分析階段通常包括聲明和類型檢查、計(jì)算需要的一些屬性值等等徐钠。編譯器在這個(gè)階段中通常會(huì)維護(hù)一個(gè)叫做“符號(hào)表”的東西癌刽,保存變量的值、屬性和名稱。同樣以

        num = 123.4 * 3;
    

    為例显拜,假如我們是第一次在這里遇見(jiàn)“num”衡奥,就將num的名稱字符串“num” 和當(dāng)前計(jì)算出來(lái)的初始值370.2插入符號(hào)表中,當(dāng)下次再遇見(jiàn)num時(shí)讼油。我們就知道它是一個(gè)數(shù)字杰赛,已經(jīng)初始化完畢,并且當(dāng)前值是370.2矮台;

  4. 目標(biāo)代碼生成:
    在語(yǔ)義分析之后,我們就可以將語(yǔ)法分析和語(yǔ)義分析的結(jié)果(通常是抽象語(yǔ)法樹(shù))轉(zhuǎn)換成可執(zhí)行的目標(biāo)代碼根时。

解釋器與編譯器僅在代碼生成階段有區(qū)別瘦赫,而在前三個(gè)階段如詞法分析、語(yǔ)法分析蛤迎、語(yǔ)義分析基本是一樣的确虱。

當(dāng)然,已經(jīng)有許多工具可以幫助我們處理階段1和2替裆,如 flex 用于詞法分析校辩,bison 用于語(yǔ)法分析;但它們的功能都過(guò)于強(qiáng)大辆童,屏蔽了許多實(shí)現(xiàn)上的細(xì)節(jié)宜咒,對(duì)于學(xué)習(xí)構(gòu)建編譯器幫助不大,所以我們要完全手寫(xiě)這些功能把鉴。

(實(shí)際上完成一個(gè)可以跑起來(lái)的解釋器并不難故黑,而且還是一件很有成就感的事,不是嘛庭砍?)

tryC編譯器的設(shè)計(jì):

從上面可以看出场晶,我們的tryC解釋器需要這三個(gè)模塊:

  1. 詞法分析
  2. 語(yǔ)法分析
  3. 語(yǔ)義分析和解釋執(zhí)行

需要這兩個(gè)數(shù)據(jù)結(jié)構(gòu)(用來(lái)在階段之間保存或傳遞值):

  1. token,用來(lái)在詞法分析和語(yǔ)法分析之間傳遞標(biāo)記怠缸;
  2. 符號(hào)表诗轻,保存語(yǔ)義分析階段遇見(jiàn)的變量值,使用一個(gè)數(shù)組存儲(chǔ)揭北;

在了解過(guò)這些之后扳炬,我們來(lái)看看代碼的基本結(jié)構(gòu):

(從上往下在代碼中依次對(duì)應(yīng),“...”表示省略的相關(guān)代碼)

  • 數(shù)據(jù)結(jié)構(gòu)的聲明部分:token類型罐呼、符號(hào)表結(jié)構(gòu):
#include <stdio.h>
...

typedef struct symStruct {  
    int type;                
    char name[MAXNAMESIZE];    
    double value;             
    ..........
} symbol;
symbol symtab[SYMTABSIZE];          // 符號(hào)表
int symPointer = 0;             

char* src, * old_src;               // 當(dāng)前分析的源代碼位置指針

// tokens 的枚舉類型
enum {
    Num = 128, Char, Str, Array, Func,
    ........
};

// token 的表示形式
int token;                      // current token type
union tokenValue {
    symbol* ptr;               
    double val;                 
} token_val;

  • 詞法分析的兩個(gè)函數(shù):
// 獲取輸入流中的下一個(gè)記號(hào):
void next() {
    char* last_pos;

    while (token = *src) {
        ++src;
        if(token == AAA ){
            .....
        }else if(token == BBB ){
            .....
        }
    }
}

// 匹配一個(gè)記號(hào)鞠柄,并獲取下一個(gè)token:
void match(int tk) {
    if (token == tk) {
        next();
    }
    else {          // 遇到了一個(gè)錯(cuò)誤
        exit(-1);
    }
}

  • 語(yǔ)法分析和語(yǔ)義分析,以及執(zhí)行階段:使用遞歸下降法實(shí)現(xiàn)(后面會(huì)再提到什么是遞歸下降法啦)

// 計(jì)算表達(dá)式的值:
double expression(){}
double factor(){}
double term(){}

// 計(jì)算布爾表達(dá)式的值:
int boolOR();
int boolAND();
int boolexp();

// 執(zhí)行一個(gè)語(yǔ)句嫉柴;
double statement();

// 執(zhí)行一個(gè)函數(shù):
double function();

  • main() 函數(shù)厌杜,代碼的入口,并

int main(int argc, char** argv)
{   
    // 往符號(hào)表里面添加關(guān)鍵詞
    int i, fd;
    src = "array func else if return while print puts read";
    for (i = Array; i <= Read; ++i) {
        next();
        symtab[symPointer -1].type = i;
    }

    src = old_src = (char*)malloc(POOLSIZE); // 分配空間

    ....

    fd = open(*argv, 0);        // 打開(kāi)讀取文件

    read(fd, src, POOLSIZE - 1);

    src[i] = 0; 
    close(fd);
    next();
    while (token != 0) {        // 一條一條語(yǔ)句執(zhí)行
        statement();
    }
    return 0;
}

可參照源碼查看
https://github.com/yunwei37/tryC

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市夯尽,隨后出現(xiàn)的幾起案子瞧壮,更是在濱河造成了極大的恐慌,老刑警劉巖匙握,帶你破解...
    沈念sama閱讀 219,366評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件咆槽,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡圈纺,警方通過(guò)查閱死者的電腦和手機(jī)秦忿,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,521評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)蛾娶,“玉大人灯谣,你說(shuō)我怎么就攤上這事』桌牛” “怎么了胎许?”我有些...
    開(kāi)封第一講書(shū)人閱讀 165,689評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)罗售。 經(jīng)常有香客問(wèn)我辜窑,道長(zhǎng),這世上最難降的妖魔是什么寨躁? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,925評(píng)論 1 295
  • 正文 為了忘掉前任穆碎,我火速辦了婚禮,結(jié)果婚禮上朽缎,老公的妹妹穿的比我還像新娘惨远。我一直安慰自己,他們只是感情好话肖,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,942評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布北秽。 她就那樣靜靜地躺著,像睡著了一般最筒。 火紅的嫁衣襯著肌膚如雪贺氓。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,727評(píng)論 1 305
  • 那天床蜘,我揣著相機(jī)與錄音辙培,去河邊找鬼。 笑死邢锯,一個(gè)胖子當(dāng)著我的面吹牛扬蕊,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播丹擎,決...
    沈念sama閱讀 40,447評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼尾抑,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼歇父!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起再愈,我...
    開(kāi)封第一講書(shū)人閱讀 39,349評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤榜苫,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后翎冲,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體垂睬,經(jīng)...
    沈念sama閱讀 45,820評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,990評(píng)論 3 337
  • 正文 我和宋清朗相戀三年抗悍,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了驹饺。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,127評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡缴渊,死狀恐怖逻淌,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情疟暖,我是刑警寧澤,帶...
    沈念sama閱讀 35,812評(píng)論 5 346
  • 正文 年R本政府宣布田柔,位于F島的核電站俐巴,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏硬爆。R本人自食惡果不足惜欣舵,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,471評(píng)論 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望缀磕。 院中可真熱鬧缘圈,春花似錦、人聲如沸袜蚕。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 32,017評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)牲剃。三九已至遣疯,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間凿傅,已是汗流浹背缠犀。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,142評(píng)論 1 272
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留聪舒,地道東北人辨液。 一個(gè)月前我還...
    沈念sama閱讀 48,388評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像箱残,于是被迫代替她去往敵國(guó)和親滔迈。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,066評(píng)論 2 355