一谭贪、C++編譯過程概述
不管是Linux系統(tǒng)還是Windows系統(tǒng),C++源文件的編譯流程都是一樣的沾歪,只是編譯過程中產(chǎn)生的過度文件的格式不一樣中捆,但作用大致相同威鹿。Linux系統(tǒng)下生成的目標(biāo)文件是.o文件,Windows系統(tǒng)下生成的目標(biāo)文件是.obj文件
1) 編譯單元
首先要搞清楚編譯單元和它的特點(diǎn)轨香。
簡單來說一個(gè)cpp文件就是一個(gè)編譯單元忽你,頭文件不用被編譯。我們把所有的函數(shù)聲明全部放進(jìn)一個(gè)頭文件中臂容,當(dāng).cpp文件被編譯時(shí)科雳,它們就可以通過一個(gè)宏命令 “#include”包含進(jìn)這個(gè).cpp文件中根蟹,從而把它們的內(nèi)容合并到.cpp文件中去,從而形成一個(gè)含有所有 必要信息的單個(gè)源文件糟秘,這個(gè)源文件就是一個(gè)編譯單元简逮。
事實(shí)上編譯每個(gè)編譯單元(.cpp)時(shí)是相互獨(dú)立的,即每個(gè)cpp文件之間是不知道對方的存在的(不考慮#include “xxx.cpp" 這種奇葩的寫法)
編譯器會分別將每個(gè)編譯單元 .cpp 進(jìn)行編譯尿赚,生成相應(yīng)的.obj \ .o文件(下文會仔細(xì)介紹這兩鐘文件)
然后鏈接器會將所有的.obj \ .o文件進(jìn)行鏈接散庶,生成最終可執(zhí)行文件。
2) 預(yù)編譯(預(yù)處理)
C++的預(yù)處理是指在C++程序源代碼被編譯之前凌净,由預(yù)處理器對C++程序源代碼進(jìn)行的處理悲龟。這個(gè)過程并不對程序的源代碼進(jìn)行解析。
這里的預(yù)處理器(preprocessor)是指真正的編譯開始之前由編譯器調(diào)用的一個(gè)獨(dú)立程序冰寻。↓↓↓↓↓預(yù)處理器主要負(fù)責(zé)以下的幾處↓↓↓↓↓↓
1.將所有的#define刪除须教,并展開所有的宏定義;
2.處理所有的預(yù)編譯指令斩芭,例如:#if,#elif,#else,#endif;
3.處理#include預(yù)編譯指令轻腺,將被包含的文件插入到預(yù)編譯指令的位置;
4.添加行號信息文件名信息划乖,便于調(diào)試贬养;
5.刪除所有的注釋;
6.保留所有的#pragma編譯指令,因?yàn)樵诰帉懗绦虻臅r(shí)候,我們經(jīng)常要用到#pragma指令來設(shè)定編譯器的狀態(tài)
3) 編譯
- ↓↓↓↓↓編譯器主要負(fù)責(zé)以下的幾處↓↓↓↓↓↓
1.掃描琴庵,語法分析误算,語義分析,源代碼優(yōu)化细卧,目標(biāo)代碼生成尉桩,目標(biāo)代碼優(yōu)化筒占;
2.生成匯編代碼贪庙;
4) 匯編
- ↓↓↓↓↓匯編器主要負(fù)責(zé)以下的幾處↓↓↓↓↓↓
1.根據(jù)匯編指令和特定平臺,把匯編指令翻譯成二進(jìn)制機(jī)器指令翰苫;
2.生成目標(biāo)文件(.o文件或者.obj); -
重要知識點(diǎn):.o或者.obj文件內(nèi)部至少要有3張表
1.導(dǎo)出符號表: 即該目標(biāo)文件可以提供的符號及地址
2.未解決符號表:即找不到地址的符號的列表止邮,告訴鏈接器這些符號沒找到地址
3.地址重定向表:鏈接的時(shí)候,鏈接器會為目標(biāo)文件的“未解決符號表”里的符號在其他目標(biāo)文件中尋找地址奏窑,但是每個(gè)目標(biāo)文件的地址都是從0x0000開始的导披,這樣直接將對方文件中符號的地址拿過來用顯然會是不正確的,為了區(qū)分不同的文件埃唯,鏈接器在鏈接時(shí)就會對每個(gè)目標(biāo)文件的地址進(jìn)行調(diào)整撩匕。 - 總結(jié):也就是說在編譯一個(gè)編譯單元(.cpp)生成相應(yīng)的obj或o文件過程中編譯器會將這個(gè)編譯單元(.cpp)所能提供給其他編譯單元(.cpp)使用的函數(shù),變量定義記錄下來墨叛。而將自己缺少的函數(shù)止毕,變量的定義也記錄下來模蜡。
-
例子
然后在鏈接器連接的時(shí)候就會知道a.obj需要show函數(shù)定義,而b.obj中恰好提供了show函數(shù)的定義扁凛,通過鏈接忍疾,在最終的可執(zhí)行文件中我們能看到show函數(shù)的運(yùn)行。
5) 鏈接
鏈接程序的主要工作就是將有關(guān)的目標(biāo)文件(庫文件谨朝、.obj文件)彼此相連接卤妒,也即將在一個(gè)文件中引用的符號同該符號在另外一個(gè)文件中的定義連接起來,使得所有的這些目標(biāo)文件成為一個(gè)能夠被操作系統(tǒng)裝入執(zhí)行的統(tǒng)一整體字币。
如圖:最后一個(gè)是鏈接器 不是 連接器寫錯(cuò)