可執(zhí)行文件的裝載與進(jìn)程小結(jié)
進(jìn)程的虛擬地址空間
??每個程序被運行起來之后都擁有自己獨立的虛擬地址空間,這個虛擬地址空間的大小是CPU的位數(shù)決定的。比如邦鲫,32位的硬件平臺決定了虛擬地址空間的地址為(2^32-1)例获,也就是我們常說的4GB虛擬內(nèi)存的大小。
??需要注意的是印叁,分配的4GB的虛擬空間并不是全部給進(jìn)程的被冒,比如,linux下1GB給操作系統(tǒng)轮蜕,余下的3GB中基本上都分配給進(jìn)程昨悼,但是3GB中的其中小部分要分配給其他用途;win下面按照2GB跃洛、2GB進(jìn)行類似的劃分率触。-
裝載的方式
- 裝載的基本思想
??將程序最常用的部分駐留在內(nèi)存。最常用的方法是頁映射汇竭,如下葱蝗。 - 頁映射
??要完成頁映射就要將內(nèi)存和磁盤中的數(shù)據(jù)和指令按“頁”為單位劃分成若干頁穴张,以后所有的裝載和操作的單位就是頁。下圖就是可執(zhí)行文件(虛擬空間)與物理內(nèi)存的映射(不考慮程序運行的虛擬地址空間):
??關(guān)于頁的操作有很多種情況两曼,比如“內(nèi)存滿時的頁置換”皂甘、“頁錯誤”等等情況下采取的種種策略(FIFO、LUR)這里不再贅述悼凑。
- 裝載的基本思想
-
從操作系統(tǒng)的角度看可執(zhí)行文件的裝載方法
- 進(jìn)程的創(chuàng)建
??從操作系統(tǒng)的角度看叮贩,一個進(jìn)程最關(guān)鍵的特征就是他有獨立的虛擬地址空間,這使得它有別于其他進(jìn)程佛析,上述的映射關(guān)系直接使用物理地址進(jìn)行操作益老,那么每次頁裝入的時候就要就行重定位,所以我們需要引入進(jìn)程的虛擬運行地址空間寸莫。那么捺萌,下面就說一下從操作系統(tǒng)角度看一個程序被執(zhí)行的大致過程:
??1.首先是創(chuàng)建程序?qū)?yīng)的虛擬地址空間。即進(jìn)行虛擬地址空間與程序執(zhí)行的物理內(nèi)存的映射(方向是進(jìn)程虛擬空間到進(jìn)程物理內(nèi)存)膘茎。我們知道一個虛擬空間由一組頁映射函數(shù)將虛擬空間各個頁映射至相應(yīng)的物理空間桃纯。此處所謂的“創(chuàng)建”并不是創(chuàng)建空間,而是創(chuàng)建虛擬空間到物理內(nèi)存空間的映射函數(shù)所需要的一系列的數(shù)據(jù)結(jié)構(gòu)披坏,對于Linux就是創(chuàng)建一個“頁目錄”結(jié)構(gòu)即可态坦,并不需要設(shè)置虛擬頁到物理頁的映射關(guān)系。linux下將虛擬空間的各個頁映射至相應(yīng)的物理空間棒拂,實際上只是分配了一個頁目錄(Page Directory)就可以了伞梯,并且不用設(shè)置頁映射關(guān)系,這些映射關(guān)系到后面程序發(fā)生頁錯誤的時候再進(jìn)行設(shè)置帚屉。
??2.讀取可執(zhí)行文件頭谜诫,建立進(jìn)程虛擬地址空間和可執(zhí)行文件的映射關(guān)系。這一步將可執(zhí)行文件空間與虛擬空間關(guān)聯(lián)起來(方向是可執(zhí)行文件虛擬空間到進(jìn)程虛擬空間)攻旦,使得發(fā)生缺頁錯誤時喻旷,OS能夠知道到可執(zhí)行文件中的哪個位置去找到所需要加載到物理內(nèi)存的內(nèi)容;這種映射關(guān)系只是保存在操作系統(tǒng)內(nèi)部的一個數(shù)據(jù)結(jié)構(gòu)牢屋。Linux中將進(jìn)程虛擬空間中的一個段叫做虛擬內(nèi)存區(qū)域(VMA且预,Virtual Memory Area);在Windows中將這個叫做虛擬段(Virtual Section)烙无。
??【注意】由于可執(zhí)行文件在裝載的時候?qū)嶋H上是被映射的虛擬空間锋谐,所以可執(zhí)行文件很多時候被稱作映射文件。進(jìn)程虛擬地址空間和可執(zhí)行文件的映射關(guān)系如下:
??3.設(shè)置CPU的指令寄存器為可執(zhí)行文件的入口地址皱炉,啟動運行:OS將控制權(quán)交給了進(jìn)程怀估。從進(jìn)程的角度看這一步可以簡單的認(rèn)為操作系統(tǒng)執(zhí)行了一條跳轉(zhuǎn)指令,直接跳轉(zhuǎn)到可執(zhí)行文件的入口(ELF文件頭中保存了入口地址項)。 - 頁錯誤
??完成上述三個步驟之后多搀,其實OS僅僅只是可執(zhí)行文件與進(jìn)程虛存之間建立起了映射——即通常意義上所說的程序加載到了內(nèi)存歧蕉,實際上這里說的是程序完全加載到了虛擬內(nèi)存,但是代碼和數(shù)據(jù)根本就沒有加載到物理內(nèi)存中康铭,進(jìn)程虛存與物理內(nèi)存空間的映射關(guān)系其實也沒有建立起來(上面也說了在“頁錯誤階段進(jìn)行映射關(guān)系的設(shè)置”)惯退,這樣程序一旦開始執(zhí)行,將會立即出現(xiàn)缺頁錯誤从藤,即程序?qū)⒁L問的進(jìn)程虛存地址并沒有映射到物理內(nèi)存空間的某個page(虛擬頁)催跪,(頁錯誤的處理線程執(zhí)行)此時OS會重新接管系統(tǒng)控制權(quán),查詢剛才第二步保存的可執(zhí)行文件到進(jìn)程虛存映射關(guān)系的數(shù)據(jù)結(jié)構(gòu)夷野,找到所缺的虛擬頁對應(yīng)于可執(zhí)行文件中的偏移懊蒸,然后在進(jìn)程物理內(nèi)存分配一個物理頁,將可執(zhí)行文件中的內(nèi)容從磁盤讀入到內(nèi)存中悯搔,并將這個物理頁(進(jìn)程物理內(nèi)存)與該虛擬頁(進(jìn)程虛存)建立起映射骑丸,然后OS將控制權(quán)重新交給進(jìn)程,程序繼續(xù)執(zhí)行妒貌。如下圖所示:
- 進(jìn)程的創(chuàng)建
-
進(jìn)程虛存空間分布
- ELF文件在映射到進(jìn)程虛存的過程中是以系統(tǒng)的頁作為單位的通危,那么每個段在映射時的長度都應(yīng)該是系統(tǒng)頁長度的整數(shù)倍;如果不是那么多余部分也將占用一頁灌曙。這樣的話內(nèi)存浪費是大問題菊碟。
-
ELF文件中, 段的權(quán)限只有為數(shù)不多的幾種組合:
1.以代碼段為代表的權(quán)限為可讀可執(zhí)行的段
2.以數(shù)據(jù)段和BSS段為代表的權(quán)限為可讀可寫的段
3.以只讀數(shù)據(jù)段為代表的權(quán)限為只讀的段。
對于相同權(quán)限的段在刺,把它們合并到一起當(dāng)作一個段進(jìn)行映射逆害。如下圖,".text"和".init"段都是可讀可執(zhí)行的增炭,則進(jìn)行合并忍燥,形成一個"segment":
-
堆和棧
kernel使用VMA劃分來管理進(jìn)程的虛擬地址空間。典型的進(jìn)程包括代碼:
1.代碼VMA(RE屬性隙姿,有映像文件)
2.數(shù)據(jù)VMA(RWE屬性,有映像文件)
3.堆VMA(RWE屬性厂捞,無映像文件输玷,向上擴(kuò)展)
4.棧VMA(RW屬性,無映像文件靡馁,向下擴(kuò)展)
如下圖所示:
【需要注意】其實DATA segment對應(yīng)的就是DATA VMA欲鹏;CODE segment對應(yīng)的就是CODE VMA。幾乎在每一個進(jìn)程的VMS視圖中都可以看見[heap]和[stack]這兩個VMA臭墨,但是這兩個VMA在可執(zhí)行文件中都沒有對應(yīng)的segment存在赔嚎,所以它們被稱之為匿名VMA。malloc()庫函數(shù)就是從堆VMA中分配空間。
-
Linux內(nèi)核裝載ELF過程
??Linux環(huán)境下尤误,fork系統(tǒng)調(diào)用將會創(chuàng)建一個與當(dāng)前task完全一樣的新task侠畔,直到應(yīng)用程序調(diào)用exec*系列的Glibc庫函數(shù)最終調(diào)用execve()系統(tǒng)調(diào)用之后,Linux內(nèi)核才開始真正裝載ELF可執(zhí)行文件(映像文件)损晤。execve內(nèi)核入口為sys_execve()软棺,隨之調(diào)用do_execve()將查找這個可執(zhí)行文件,如果找到則讀取ELF可執(zhí)行文件的前128個字節(jié)尤勋,然后調(diào)用search_binary_handle()通過ELF文件頭中的e_ident得到可執(zhí)行文件的Magic Number喘落,判斷出這是一個什么類型的可執(zhí)行文件,并調(diào)用不同可執(zhí)行文件的裝載處理程序最冰,對于ELF可執(zhí)行文件而言瘦棋,其裝載處理程序為load_elf_binary(),這個函數(shù)將會把execve系統(tǒng)調(diào)用的返回地址修改為ELF可執(zhí)行文件的入口點暖哨,對于靜態(tài)鏈接得到的ELF文件即文件頭中定義的e_entry兽狭,對于動態(tài)鏈接得到的ELF可執(zhí)行文件則是動態(tài)鏈接器。一步一步返回到sys_execve()之后鹿蜀,因為返回地址已經(jīng)被修改為了ELF程序入口地址了箕慧,所以系統(tǒng)調(diào)用返回到用戶態(tài)之后,EIP指令寄存器將直接跳轉(zhuǎn)到ELF程序入口地址茴恰,程序開始執(zhí)行颠焦,裝載完成。
ELF文件的裝載過程:fork -> execve() -> sys_execve() -> do_execve()
do_execve() 讀取文件的前128個字節(jié)判斷文件的格式(一般根據(jù)魔數(shù)來判斷往枣,比如elf的頭四個字節(jié)為:0x7F, e, l, f)伐庭。
??然后調(diào)用search_binary_handle()去搜索和匹配合適的可執(zhí)行文件裝載處理過程,對于elf則調(diào)用load_elf_binary():- 檢查ELF可執(zhí)行文件格式的有效性
- 尋找動態(tài)鏈接的“.interp”段分冈,設(shè)置動態(tài)連接器路徑
- 根據(jù)ELF可執(zhí)行文件的程序頭表的描述圾另,對ELF文件進(jìn)行映射,比如代碼雕沉、數(shù)據(jù)集乔、只讀數(shù)據(jù)。
- 根據(jù)ELF進(jìn)程環(huán)境坡椒,比如進(jìn)程啟動是EDX寄存器的地址應(yīng)該是DT_FINI的地址扰路。
- 將系統(tǒng)調(diào)用的返回地址修改成ELF可執(zhí)行文件的入口點,這個入口點取決于程序的鏈接方式倔叼,靜態(tài)ELF可執(zhí)行文件為e_entry所指的地址汗唱,對于動態(tài)ELF入口點為動態(tài)連接器。
Load_elf_binary()執(zhí)行完畢丈攒,返回至do_execve()再返回至sys_execve()哩罪,最后一步的系統(tǒng)調(diào)用返回地址改成了被裝在的ELF程序入口地址授霸。當(dāng)sys_execve()系統(tǒng)調(diào)用從內(nèi)核態(tài)返回到用戶態(tài)時,EIP寄存器直接跳轉(zhuǎn)到了ELF程序的入口地址际插,新程序開始執(zhí)行碘耳。