#include <stdio.h>
int main(){
printf("hello,world\n");
return 0;
}
那程序究竟是怎么執(zhí)行的?峭咒?
進(jìn)一步轉(zhuǎn)換成二進(jìn)制表示
00100011011010010110111001100011011011000111010101100100011001010010000000111100011100110111010001100100011010010110111100101110011010000011111000001010000010100110100101101110011101000010000001101101011000010110100101101110001010000010100101111011000010100000101000100000001000000111000001110010011010010110111001110100011001100010100000100010011010000110010101101100011011000110111100101100011101110110111101110010011011000110010001011100011011100010001000101001001110110000101000100000001000000111001001100101011101000111010101110010011011100010000000110000001110110000101001111101
源程序?qū)嶋H上就是一個由值0和1組成的位(bit)序列税弃。
8個位被組織成一組,稱為字節(jié)(Byte)
像上面這個程序只由ASCII字符構(gòu)成的文件稱為文本文件凑队,所有其他文件都稱為二進(jìn)制文件则果。
hello.c的表示方法說明了一個基本思想:系統(tǒng)中所有信息——包括磁盤文件、內(nèi)存中的程序漩氨、內(nèi)存中存放的用戶數(shù)據(jù)以及網(wǎng)絡(luò)上傳送的數(shù)據(jù)西壮,都是由一串比特表示的。區(qū)分不同數(shù)據(jù)對象的唯一方法就是我們讀到這些數(shù)據(jù)對象時的上下文叫惊。比如款青,在不同的上下文中,一個同樣的字節(jié)序列可能表示一個整數(shù)霍狰、浮點(diǎn)數(shù)抡草、字符串或者機(jī)器指令。
程序被其他程序翻譯成不同的格式
hello程序的生命周期是從一個高級C語言程序開始的蚓耽,因?yàn)檫@種形式能夠被人讀懂渠牲。然而為了在系統(tǒng)上執(zhí)行hello.c程序旋炒,每條C語句都必須被其他程序轉(zhuǎn)化為一系列的低級機(jī)器語言指令步悠。然后這些指令按照一種稱為可執(zhí)行目標(biāo)程序的格式打好包,并以二進(jìn)制磁盤文件的形式存放起來瘫镇。目標(biāo)程序也稱為可執(zhí)行目標(biāo)文件鼎兽。
預(yù)處理階段:根據(jù)以字符#開頭的命令答姥,修改原始的C程序。
比如hello.c的第一行#include <stdio.h>告訴預(yù)處理器讀取系統(tǒng)頭文件stdio.h的內(nèi)容谚咬,并把它直接插入程序文本中鹦付,結(jié)果就得到了另一個C程序,通常是以.i作為文件擴(kuò)展名择卦。編譯階段:編譯器將文本文件hello.i翻譯成文本文件hello.s敲长,它包含一個匯編語言程序。該程序包含函數(shù)main的定義秉继。
匯編階段:匯編器將hello.s翻譯成機(jī)器語言指令祈噪,把這些指令打包成一種叫做可重定位目標(biāo)程序的格式,并將結(jié)果保存在文件hello.o中尚辑。hello.o文件是一個二進(jìn)制文件辑鲤。它包含的17個字節(jié)是函數(shù)main的指令編碼。
鏈接階段:hello程序調(diào)用了printf函數(shù)杠茬,它是每個C編譯器都提供的標(biāo)準(zhǔn)C庫中的一個函數(shù)月褥。printf函數(shù)存在于一個名為printf.o的單獨(dú)的預(yù)編譯好了的目標(biāo)文件中,而這個文件必須以某種方式合并到hello.o程序中瓢喉。鏈接器負(fù)責(zé)處理這種合并宁赤,結(jié)果得到hello文件。它是一個可執(zhí)行目標(biāo)文件栓票,可以被加載到內(nèi)存中礁击,由系統(tǒng)執(zhí)行。
預(yù)處理 gcc –E hello.c –o hello.i
編譯 gcc –S hello.i –o hello.s
匯編 gcc –c hello.s –o hello.o
鏈接 gcc hello.o –o hello
處理器讀并解釋儲存在內(nèi)存中的指令:
此刻逗载,hello.c源程序已經(jīng)被編譯系統(tǒng)翻譯成了可執(zhí)行目標(biāo)文件hello哆窿,并被存放在磁盤上。為了理解運(yùn)行hello程序時到底發(fā)生了什么厉斟,我們需要了解一個典型系統(tǒng)的硬件組織挚躯。
總線:貫穿整個系統(tǒng)的是一組電子管道。它攜帶信息字節(jié)并負(fù)責(zé)在各個部件間傳遞擦秽。通陈肜螅總線被設(shè)計成傳送定長的字節(jié)塊,也就是字感挥。字中的字節(jié)數(shù)(即字長)是一個基本的系統(tǒng)參數(shù)缩搅,各個系統(tǒng)中都不盡相同。現(xiàn)在大多數(shù)機(jī)器字長要么是4個字節(jié)(32位)触幼,要么是8個字節(jié)(64位)硼瓣。
I/O設(shè)備:是系統(tǒng)與外部世界的聯(lián)系通道。
主存:一個臨時存儲設(shè)備日麸,在處理器執(zhí)行程序時决采,用來存放程序和程序處理的數(shù)據(jù)碑诉。存儲器是一個線性的字節(jié)數(shù)組忍啸,每個字節(jié)多有唯一的地址察净,這些地址是從零開始的渊啰。一般來說胳蛮,組成程序的每條機(jī)器指令都由不同數(shù)量的字節(jié)構(gòu)成麸粮。C程序變量相對應(yīng)的數(shù)據(jù)項(xiàng)的大小是根據(jù)類型變化的半哟。比如酬滤,在運(yùn)行Linux的x86-64機(jī)器上,short類型數(shù)據(jù)需要2個字節(jié)寓涨,int和float類型需要4個字節(jié)敏晤,而long和double類型需要8個字節(jié)。
處理器:解釋(或執(zhí)行)存儲在主存中指令的引擎缅茉。處理器的核心是一個大小為一個字的存儲設(shè)備(或寄存器)嘴脾,稱為程序計數(shù)器(PC),在任何時刻蔬墩,PC都指向主存中的某條機(jī)器語言指令(即含有該條指令的地址)译打。從系統(tǒng)通電開始,直到系統(tǒng)斷電拇颅,處理器一直不斷的執(zhí)行程序計數(shù)器指向的命令奏司,再更新程序計數(shù)器,使其指向下一條指令樟插。
運(yùn)行hello程序
操作系統(tǒng)管理硬件
hello程序運(yùn)行時沒有直接訪問鍵盤韵洋、顯示器、磁盤或者主存黄锤。取而代之的是搪缨,依靠操作系統(tǒng)提供的服務(wù)。所有應(yīng)用程序?qū)τ布牟僮鲊L試都必須通過操作系統(tǒng)鸵熟。
操作系統(tǒng)有兩個作用:
- 防止硬件被失控的應(yīng)用程序?yàn)E用副编;
- 向應(yīng)用程序提供簡單一致的機(jī)制來控制復(fù)雜而又通常大不相同的低級硬件設(shè)備。操作系統(tǒng)通過幾個基本的抽象概念(進(jìn)程流强、虛擬內(nèi)存和文件)來實(shí)現(xiàn)這兩個功能痹届。
進(jìn)程:是操作系統(tǒng)對一個正在運(yùn)行的程序的一種抽象。
虛擬內(nèi)存:它為每個進(jìn)程提供一個假象打月,即每個進(jìn)程都在獨(dú)占的使用主存队腐。每個進(jìn)程看到的內(nèi)存都是一致的,稱為虛擬地址空間奏篙。
上圖所示是Linux進(jìn)程的虛擬地址空間柴淘。在Linux中,地址空間最上面的區(qū)域是保留給操作系統(tǒng)中的代碼和數(shù)據(jù)的,這對所有進(jìn)程來說都是一樣的悠就。地址空間的底部區(qū)域存放用戶進(jìn)程定義的代碼和數(shù)據(jù)千绪。圖中地址是從下往上增大的充易。
每個進(jìn)程看到的虛擬地址空間由大量準(zhǔn)確定義的區(qū)構(gòu)成梗脾,每個區(qū)都有專門的功能。
- 程序代碼和數(shù)據(jù):對所有的進(jìn)程來說盹靴,代碼是從一固定地址開始炸茧,緊接著是和C全局變量相對應(yīng)的數(shù)據(jù)位置。代碼和數(shù)據(jù)區(qū)是直接按照可執(zhí)行目標(biāo)文件的內(nèi)容初始化的稿静,此處就是可執(zhí)行目標(biāo)文件hello梭冠。
- 堆:代碼和數(shù)據(jù)區(qū)后緊跟著的是運(yùn)行時堆。代碼和數(shù)據(jù)區(qū)在進(jìn)程一開始時就被指定來大小改备。與此不同控漠,當(dāng)調(diào)用像malloc和free這樣的C標(biāo)準(zhǔn)庫函數(shù)時,堆可以在運(yùn)行時動態(tài)的擴(kuò)展和收縮悬钳。
- 共享庫:大約在地址空間的中間部分是一塊用來存放像C標(biāo)準(zhǔn)庫和數(shù)學(xué)庫這樣的共享庫的代碼和數(shù)據(jù)的區(qū)域盐捷。
- 棧:位于用戶虛擬地址空間頂部的是用戶棧,編譯器用它來實(shí)現(xiàn)函數(shù)調(diào)用默勾。和堆一樣碉渡,用戶棧在程序執(zhí)行期間可以動態(tài)的擴(kuò)展和收縮。特別的母剥,我們每次調(diào)用一個函數(shù)滞诺,棧就會增長;從函數(shù)返回時环疼,棧就會收縮习霹。
- 內(nèi)核虛擬地址。地址空間頂部的區(qū)域是為內(nèi)核保留的炫隶。不允許應(yīng)用程序讀寫這個區(qū)域的內(nèi)容或直接調(diào)用內(nèi)核代碼定義的函數(shù)序愚。相反,它們必須調(diào)用內(nèi)核來執(zhí)行這些操作等限。
文件:文件就是字節(jié)序列爸吮,僅此而已。每個I/O設(shè)備望门,包括磁盤形娇、鍵盤、顯示器筹误,甚至包括網(wǎng)絡(luò)桐早,都可以看成是文件。文件這個簡單而精致的概念是非常強(qiáng)大的,因?yàn)樗驊?yīng)用程序提供了一個統(tǒng)一的視圖哄酝,來看待系統(tǒng)中可能含有的所有各式各樣的I/O設(shè)備友存。