可執(zhí)行文件的裝載與進(jìn)程一點小總結(jié) 《程序員的自我修養(yǎng)》·筆記

可執(zhí)行文件的裝載與進(jìn)程小結(jié)

  • 進(jìn)程的虛擬地址空間
    ??每個程序被運行起來之后都擁有自己獨立的虛擬地址空間,這個虛擬地址空間的大小是CPU的位數(shù)決定的。比如邦鲫,32位的硬件平臺決定了虛擬地址空間的地址為(2^32-1)例获,也就是我們常說的4GB虛擬內(nèi)存的大小。
    ??需要注意的是印叁,分配的4GB的虛擬空間并不是全部給進(jìn)程的被冒,比如,linux下1GB給操作系統(tǒng)轮蜕,余下的3GB中基本上都分配給進(jìn)程昨悼,但是3GB中的其中小部分要分配給其他用途;win下面按照2GB跃洛、2GB進(jìn)行類似的劃分率触。

  • 裝載的方式

    • 裝載的基本思想
      ??將程序最常用的部分駐留在內(nèi)存。最常用的方法是頁映射汇竭,如下葱蝗。
    • 頁映射
      ??要完成頁映射就要將內(nèi)存和磁盤中的數(shù)據(jù)和指令按“頁”為單位劃分成若干頁穴张,以后所有的裝載和操作的單位就是頁。下圖就是可執(zhí)行文件(虛擬空間)與物理內(nèi)存的映射(不考慮程序運行的虛擬地址空間):

      ??關(guān)于頁的操作有很多種情況两曼,比如“內(nèi)存滿時的頁置換”皂甘、“頁錯誤”等等情況下采取的種種策略(FIFO、LUR)這里不再贅述悼凑。
  • 從操作系統(tǒng)的角度看可執(zhí)行文件的裝載方法

    • 進(jìn)程的創(chuàng)建
      ??從操作系統(tǒng)的角度看叮贩,一個進(jìn)程最關(guān)鍵的特征就是他有獨立的虛擬地址空間,這使得它有別于其他進(jìn)程佛析,上述的映射關(guān)系直接使用物理地址進(jìn)行操作益老,那么每次頁裝入的時候就要就行重定位,所以我們需要引入進(jìn)程的虛擬運行地址空間寸莫。那么捺萌,下面就說一下從操作系統(tǒng)角度看一個程序被執(zhí)行的大致過程:
      ??1.首先是創(chuàng)建程序?qū)?yīng)的虛擬地址空間。即進(jìn)行虛擬地址空間與程序執(zhí)行的物理內(nèi)存的映射(方向是進(jìn)程虛擬空間到進(jìn)程物理內(nèi)存)膘茎。我們知道一個虛擬空間由一組頁映射函數(shù)將虛擬空間各個頁映射至相應(yīng)的物理空間桃纯。此處所謂的“創(chuàng)建”并不是創(chuàng)建空間,而是創(chuàng)建虛擬空間到物理內(nèi)存空間的映射函數(shù)所需要的一系列的數(shù)據(jù)結(jié)構(gòu)披坏,對于Linux就是創(chuàng)建一個“頁目錄”結(jié)構(gòu)即可态坦,并不需要設(shè)置虛擬頁到物理頁的映射關(guān)系。linux下將虛擬空間的各個頁映射至相應(yīng)的物理空間棒拂,實際上只是分配了一個頁目錄(Page Directory)就可以了伞梯,并且不用設(shè)置頁映射關(guān)系,這些映射關(guān)系到后面程序發(fā)生頁錯誤的時候再進(jìn)行設(shè)置帚屉。
      ??2.讀取可執(zhí)行文件頭谜诫,建立進(jìn)程虛擬地址空間和可執(zhí)行文件的映射關(guān)系。這一步將可執(zhí)行文件空間與虛擬空間關(guān)聯(lián)起來(方向是可執(zhí)行文件虛擬空間到進(jìn)程虛擬空間)攻旦,使得發(fā)生缺頁錯誤時喻旷,OS能夠知道到可執(zhí)行文件中的哪個位置去找到所需要加載到物理內(nèi)存的內(nèi)容;這種映射關(guān)系只是保存在操作系統(tǒng)內(nèi)部的一個數(shù)據(jù)結(jié)構(gòu)牢屋。Linux中將進(jìn)程虛擬空間中的一個段叫做虛擬內(nèi)存區(qū)域(VMA且预,Virtual Memory Area);在Windows中將這個叫做虛擬段(Virtual Section)烙无。
      ??【注意】由于可執(zhí)行文件在裝載的時候?qū)嶋H上是被映射的虛擬空間锋谐,所以可執(zhí)行文件很多時候被稱作映射文件。進(jìn)程虛擬地址空間和可執(zhí)行文件的映射關(guān)系如下:

      ??3.設(shè)置CPU的指令寄存器為可執(zhí)行文件的入口地址皱炉,啟動運行:OS將控制權(quán)交給了進(jìn)程怀估。從進(jìn)程的角度看這一步可以簡單的認(rèn)為操作系統(tǒng)執(zhí)行了一條跳轉(zhuǎn)指令,直接跳轉(zhuǎn)到可執(zhí)行文件的入口(ELF文件頭中保存了入口地址項)。
    • 頁錯誤
      ??完成上述三個步驟之后多搀,其實OS僅僅只是可執(zhí)行文件與進(jìn)程虛存之間建立起了映射——即通常意義上所說的程序加載到了內(nèi)存歧蕉,實際上這里說的是程序完全加載到了虛擬內(nèi)存,但是代碼和數(shù)據(jù)根本就沒有加載到物理內(nèi)存中康铭,進(jìn)程虛存與物理內(nèi)存空間的映射關(guān)系其實也沒有建立起來(上面也說了在“頁錯誤階段進(jìn)行映射關(guān)系的設(shè)置”)惯退,這樣程序一旦開始執(zhí)行,將會立即出現(xiàn)缺頁錯誤从藤,即程序?qū)⒁L問的進(jìn)程虛存地址并沒有映射到物理內(nèi)存空間的某個page(虛擬頁)催跪,(頁錯誤的處理線程執(zhí)行)此時OS會重新接管系統(tǒng)控制權(quán),查詢剛才第二步保存的可執(zhí)行文件到進(jìn)程虛存映射關(guān)系的數(shù)據(jù)結(jié)構(gòu)夷野,找到所缺的虛擬頁對應(yīng)于可執(zhí)行文件中的偏移懊蒸,然后在進(jìn)程物理內(nèi)存分配一個物理頁,將可執(zhí)行文件中的內(nèi)容從磁盤讀入到內(nèi)存中悯搔,并將這個物理頁(進(jìn)程物理內(nèi)存)與該虛擬頁(進(jìn)程虛存)建立起映射骑丸,然后OS將控制權(quán)重新交給進(jìn)程,程序繼續(xù)執(zhí)行妒貌。如下圖所示:
  • 進(jìn)程虛存空間分布

    • ELF文件在映射到進(jìn)程虛存的過程中是以系統(tǒng)的頁作為單位的通危,那么每個段在映射時的長度都應(yīng)該是系統(tǒng)頁長度的整數(shù)倍;如果不是那么多余部分也將占用一頁灌曙。這樣的話內(nèi)存浪費是大問題菊碟。
    • ELF文件中, 段的權(quán)限只有為數(shù)不多的幾種組合:
      1.以代碼段為代表的權(quán)限為可讀可執(zhí)行的段
      2.以數(shù)據(jù)段和BSS段為代表的權(quán)限為可讀可寫的段
      3.以只讀數(shù)據(jù)段為代表的權(quán)限為只讀的段。
      對于相同權(quán)限的段在刺,把它們合并到一起當(dāng)作一個段進(jìn)行映射逆害。如下圖,".text"和".init"段都是可讀可執(zhí)行的增炭,則進(jìn)行合并忍燥,形成一個"segment":


    • 堆和棧
      kernel使用VMA劃分來管理進(jìn)程的虛擬地址空間。典型的進(jìn)程包括代碼:
      1.代碼VMA(RE屬性隙姿,有映像文件)
      2.數(shù)據(jù)VMA(RWE屬性,有映像文件)
      3.堆VMA(RWE屬性厂捞,無映像文件输玷,向上擴(kuò)展)
      4.棧VMA(RW屬性,無映像文件靡馁,向下擴(kuò)展)
      如下圖所示:



      【需要注意】其實DATA segment對應(yīng)的就是DATA VMA欲鹏;CODE segment對應(yīng)的就是CODE VMA。幾乎在每一個進(jìn)程的VMS視圖中都可以看見[heap]和[stack]這兩個VMA臭墨,但是這兩個VMA在可執(zhí)行文件中都沒有對應(yīng)的segment存在赔嚎,所以它們被稱之為匿名VMA。malloc()庫函數(shù)就是從堆VMA中分配空間。

  • Linux內(nèi)核裝載ELF過程
    ??Linux環(huán)境下尤误,fork系統(tǒng)調(diào)用將會創(chuàng)建一個與當(dāng)前task完全一樣的新task侠畔,直到應(yīng)用程序調(diào)用exec*系列的Glibc庫函數(shù)最終調(diào)用execve()系統(tǒng)調(diào)用之后,Linux內(nèi)核才開始真正裝載ELF可執(zhí)行文件(映像文件)损晤。execve內(nèi)核入口為sys_execve()软棺,隨之調(diào)用do_execve()將查找這個可執(zhí)行文件,如果找到則讀取ELF可執(zhí)行文件的前128個字節(jié)尤勋,然后調(diào)用search_binary_handle()通過ELF文件頭中的e_ident得到可執(zhí)行文件的Magic Number喘落,判斷出這是一個什么類型的可執(zhí)行文件,并調(diào)用不同可執(zhí)行文件的裝載處理程序最冰,對于ELF可執(zhí)行文件而言瘦棋,其裝載處理程序為load_elf_binary(),這個函數(shù)將會把execve系統(tǒng)調(diào)用的返回地址修改為ELF可執(zhí)行文件的入口點暖哨,對于靜態(tài)鏈接得到的ELF文件即文件頭中定義的e_entry兽狭,對于動態(tài)鏈接得到的ELF可執(zhí)行文件則是動態(tài)鏈接器。一步一步返回到sys_execve()之后鹿蜀,因為返回地址已經(jīng)被修改為了ELF程序入口地址了箕慧,所以系統(tǒng)調(diào)用返回到用戶態(tài)之后,EIP指令寄存器將直接跳轉(zhuǎn)到ELF程序入口地址茴恰,程序開始執(zhí)行颠焦,裝載完成。
    ELF文件的裝載過程:

    fork -> execve() -> sys_execve() -> do_execve()

    do_execve() 讀取文件的前128個字節(jié)判斷文件的格式(一般根據(jù)魔數(shù)來判斷往枣,比如elf的頭四個字節(jié)為:0x7F, e, l, f)伐庭。
    ??然后調(diào)用search_binary_handle()去搜索和匹配合適的可執(zhí)行文件裝載處理過程,對于elf則調(diào)用load_elf_binary():

    • 檢查ELF可執(zhí)行文件格式的有效性
    • 尋找動態(tài)鏈接的“.interp”段分冈,設(shè)置動態(tài)連接器路徑
    • 根據(jù)ELF可執(zhí)行文件的程序頭表的描述圾另,對ELF文件進(jìn)行映射,比如代碼雕沉、數(shù)據(jù)集乔、只讀數(shù)據(jù)。
    • 根據(jù)ELF進(jìn)程環(huán)境坡椒,比如進(jìn)程啟動是EDX寄存器的地址應(yīng)該是DT_FINI的地址扰路。
    • 將系統(tǒng)調(diào)用的返回地址修改成ELF可執(zhí)行文件的入口點,這個入口點取決于程序的鏈接方式倔叼,靜態(tài)ELF可執(zhí)行文件為e_entry所指的地址汗唱,對于動態(tài)ELF入口點為動態(tài)連接器。

    Load_elf_binary()執(zhí)行完畢丈攒,返回至do_execve()再返回至sys_execve()哩罪,最后一步的系統(tǒng)調(diào)用返回地址改成了被裝在的ELF程序入口地址授霸。當(dāng)sys_execve()系統(tǒng)調(diào)用從內(nèi)核態(tài)返回到用戶態(tài)時,EIP寄存器直接跳轉(zhuǎn)到了ELF程序的入口地址际插,新程序開始執(zhí)行碘耳。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市腹鹉,隨后出現(xiàn)的幾起案子藏畅,更是在濱河造成了極大的恐慌,老刑警劉巖功咒,帶你破解...
    沈念sama閱讀 211,348評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件愉阎,死亡現(xiàn)場離奇詭異,居然都是意外死亡力奋,警方通過查閱死者的電腦和手機(jī)榜旦,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,122評論 2 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來景殷,“玉大人溅呢,你說我怎么就攤上這事≡持浚” “怎么了咐旧?”我有些...
    開封第一講書人閱讀 156,936評論 0 347
  • 文/不壞的土叔 我叫張陵,是天一觀的道長绩蜻。 經(jīng)常有香客問我铣墨,道長,這世上最難降的妖魔是什么办绝? 我笑而不...
    開封第一講書人閱讀 56,427評論 1 283
  • 正文 為了忘掉前任伊约,我火速辦了婚禮,結(jié)果婚禮上孕蝉,老公的妹妹穿的比我還像新娘屡律。我一直安慰自己,他們只是感情好降淮,可當(dāng)我...
    茶點故事閱讀 65,467評論 6 385
  • 文/花漫 我一把揭開白布超埋。 她就那樣靜靜地躺著,像睡著了一般骤肛。 火紅的嫁衣襯著肌膚如雪纳本。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,785評論 1 290
  • 那天腋颠,我揣著相機(jī)與錄音,去河邊找鬼吓笙。 笑死淑玫,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播絮蒿,決...
    沈念sama閱讀 38,931評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼尊搬,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了土涝?” 一聲冷哼從身側(cè)響起佛寿,我...
    開封第一講書人閱讀 37,696評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎但壮,沒想到半個月后冀泻,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,141評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡蜡饵,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,483評論 2 327
  • 正文 我和宋清朗相戀三年弹渔,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片溯祸。...
    茶點故事閱讀 38,625評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡肢专,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出焦辅,到底是詐尸還是另有隱情博杖,我是刑警寧澤,帶...
    沈念sama閱讀 34,291評論 4 329
  • 正文 年R本政府宣布筷登,位于F島的核電站剃根,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏仆抵。R本人自食惡果不足惜跟继,卻給世界環(huán)境...
    茶點故事閱讀 39,892評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望镣丑。 院中可真熱鬧舔糖,春花似錦、人聲如沸莺匠。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,741評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽趣竣。三九已至摇庙,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間遥缕,已是汗流浹背卫袒。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留单匣,地道東北人夕凝。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓宝穗,卻偏偏與公主長得像,于是被迫代替她去往敵國和親码秉。 傳聞我的和親對象是個殘疾皇子逮矛,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,492評論 2 348

推薦閱讀更多精彩內(nèi)容