當(dāng)你寫完一個helloworld程序,興致勃勃地你通過gcc把它編譯成一個由機器碼(machine code)組成的可執(zhí)行文件并在命令行輸入./hello時鹿寻,你看到屏幕上出現(xiàn)一行"Hello, world."看起來很酷,你也許會問這中間發(fā)生了什么诽凌?
·高級語言->匯編->機器碼
當(dāng)我們用高級語言毡熏,例如C語言,寫了一個程序并用gcc -o hello helloworld.c命令將它編譯成可執(zhí)行文件時侣诵,會發(fā)生下面的一系列事情痢法。
1.預(yù)處理(Preprocessing)。預(yù)處理器(Preprocessor)處理源文件中以#開頭的預(yù)處理指令杜顺,從相應(yīng)的系統(tǒng)文件中得到所需的內(nèi)容并修改源文件榜轿。這一步可以用gcc-E helloworld.c-o hello.i實現(xiàn)据忘。產(chǎn)生的是一個.i文件。
2.編譯(Compilig)。簡單來說就是編譯器(Compiler)將第一步得到的文件翻譯成一個以.s(或.asm)結(jié)尾的匯編文件饿肺。
3.匯編(Assembling)提鸟。匯編器(Assembler)將匯編文件翻譯成機器指令文件并打包成可重定位目標(biāo)文件(Relocatable Object Program)斩跌,一種以.o結(jié)尾的文件桩警。
4.鏈接(Linking)。合并.o文件及其所用到的庫中的目標(biāo)文件膘滨,生成可執(zhí)行文件hello甘凭。
·CPU對機器碼指令的處理
當(dāng)你成功得到一個可執(zhí)行文件之后,在命令行輸入./hello火邓,并滿心歡喜地打入回車丹弱,此時這個由機器碼組成的文件就被加載到內(nèi)存中。
程序計數(shù)器(Program Counter)記錄當(dāng)前指令(一條機器碼)的地址铲咨,在取完一條指令之后改變自己的值為下一跳要執(zhí)行的指令的地址躲胳,依次取出每一條指令。每一條被取出的指令就放在指令寄存器(Instruction Register)中纤勒。
讓我們再仔細(xì)看看坯苹!
通過取指(Fetch),譯碼(Decode)CPU就可以了解所要執(zhí)行的機器碼的內(nèi)容摇天。接下來運用算術(shù)邏輯單元(ALU)執(zhí)行指令中的運算粹湃。接下來通過訪存(Memory)讀取/寫入內(nèi)存,通過寫回(Write Back)寫入寄存器泉坐。之后更新PC準(zhǔn)備讀取下一條指令为鳄。
·地址的抽象
在CPU和主存之間進(jìn)行數(shù)據(jù)傳輸時,數(shù)據(jù)通過兩條線交互:地址線(Address Bus)腕让,數(shù)據(jù)線(Data Bus)孤钦,還有一條控制線(Control Bus)先不說。其中數(shù)據(jù)線很容易理解。就是將在相應(yīng)地址/寄存器上的數(shù)據(jù)相互傳遞偏形,但是如果我們將目光投向地址線静袖,我們會發(fā)現(xiàn)這里用到了一層抽象,地址線上的地址通過一個譯碼器將地址信息翻譯成具體要訪問的的內(nèi)存單元壳猜,這樣看起來就像是每個內(nèi)存單元有自己的地址一般。
如果我們的地址兩位長度的A0, A1,那么地址00滑凉, 01统扳, 10, 11分別就代表D0, D1, D2, D3畅姊≈渲樱看起來就好像每個內(nèi)存單元有了自己的地址一樣!