build流程
構(gòu)建一次項(xiàng)目需要經(jīng)歷一些4個(gè)階段
- 預(yù)處理
preprocess
讀入頭文件,展開(kāi)宏 - 編譯
生成匯編語(yǔ)言
, - 匯編
由匯編器assembler
轉(zhuǎn)換為機(jī)器語(yǔ)言,生成.o
的目標(biāo)文件 - 鏈接
將目標(biāo)文件生成可執(zhí)行文件.
第二個(gè)步驟的編譯一般稱(chēng)之為狹義的編譯,下面我們討論的都是狹義的編譯.好了,開(kāi)始對(duì)編譯階段解析詳細(xì)解析.
編譯過(guò)程
狹義的編譯大致大致分為4個(gè)階段
- 語(yǔ)法分析
- 語(yǔ)義分析
- 生成中間代碼
- 代碼生成
語(yǔ)法分析
將代碼進(jìn)行解析,將其轉(zhuǎn)換為計(jì)算機(jī)易于理解的形式,這里的解析(parse
)也成為語(yǔ)法分析(syntax analyzing
),解析代碼的程序模塊成為解析器(parser
)或語(yǔ)法分析器(syntax analyzer
).
最終會(huì)將代碼轉(zhuǎn)換成語(yǔ)法樹(shù)的形式.
語(yǔ)義分析
通過(guò)解析代碼獲得語(yǔ)法樹(shù)后,就要解析語(yǔ)法樹(shù),除去多余內(nèi)容,添加必要信息,生成AST
抽象語(yǔ)法樹(shù).這個(gè)步驟成為語(yǔ)義分析.
語(yǔ)義分析包括一些處理
- 區(qū)分變量為局部變量還是全局變量
- 解析變量的聲明和引用
- 變量和表達(dá)式的類(lèi)型檢查
- 檢查在引用變量之前是否進(jìn)行了初始化
- 檢查函數(shù)是否按照定義返回了結(jié)果
語(yǔ)法分析只是將代碼的構(gòu)造照搬了過(guò)來(lái),語(yǔ)義分析生成的AST
包含了語(yǔ)義信息.例如在變量引用和定義直接添加鏈接,適當(dāng)增加類(lèi)型轉(zhuǎn)換等.
生成中間代碼
生成AST
之后,將AST
轉(zhuǎn)化為只在編譯器內(nèi)部使用的中間代碼(IR
, Intermediate Representation
).
這樣做是為了支持多種匯編語(yǔ)言或者機(jī)器語(yǔ)言.
代碼生成
把中間代碼轉(zhuǎn)換成匯編語(yǔ)言,這個(gè)階段稱(chēng)為代碼生成(code generation
),負(fù)責(zé)此程序的模塊稱(chēng)為代碼生成器(code generator
).
優(yōu)化
除了上述4個(gè)階段外,現(xiàn)實(shí)編譯器還包括優(yōu)化(optimization
).
優(yōu)化可以在編譯器的各個(gè)環(huán)節(jié)進(jìn)行.可以對(duì)AST
進(jìn)行優(yōu)化,可以對(duì)中間代碼的代碼進(jìn)行優(yōu)化,可以對(duì)轉(zhuǎn)換后的機(jī)器語(yǔ)言進(jìn)行優(yōu)化.進(jìn)一步來(lái)說(shuō),不僅是編譯器,鏈接和運(yùn)行時(shí)調(diào)用的程序庫(kù)(library
)的代碼也可以進(jìn)行優(yōu)化.