最近學(xué)習(xí)了一下 Mach-O ,這里做個(gè)筆記記錄示损,整理思路,加深理解迅栅。
概述
第一章 描述了 Mach-O 文件的基本結(jié)構(gòu)小泉;
第二章 概述了符號(hào),分析了符號(hào)表(symbol table)肢预。
第三章 探尋動(dòng)態(tài)鏈接矛洞。
第四章 分析fishhook。
第五章 分析BeeHive烫映。
第六章 App啟動(dòng)時(shí)間沼本。
關(guān)于App啟動(dòng)時(shí)間的優(yōu)化,網(wǎng)上有無(wú)數(shù)的文章锭沟,本文不講如何具體優(yōu)化抽兆。只是結(jié)合前面幾章Mach-O文件的學(xué)習(xí),帶著大家一塊分析啟動(dòng)中的一部分操作族淮,加深理解辫红。
背景知識(shí)
APP的啟動(dòng)流程
iOS系統(tǒng)首先會(huì)加載解析該APP的Info.plist文件,因?yàn)镮nfo.plist文件中包含了支持APP加載運(yùn)行所需要的眾多Key祝辣,value配置信息厉熟,例如APP的運(yùn)行條件(Required device capabilities),是否全屏较幌,APP啟動(dòng)圖信息等揍瑟。
創(chuàng)建沙盒(iOS8后,每次啟動(dòng)APP都會(huì)生成一個(gè)新的沙盒路徑)
根據(jù)Info.plist的配置檢查相應(yīng)權(quán)限狀態(tài)
-
加載Mach-O文件讀取dyld路徑并運(yùn)行dyld動(dòng)態(tài)連接器(內(nèi)核加載了主程序乍炉,dyld只會(huì)負(fù)責(zé)動(dòng)態(tài)庫(kù)的加載)
- 4.1 首先dyld會(huì)尋找合適的CPU運(yùn)行環(huán)境
- 4.2 然后加載程序運(yùn)行所需的依賴(lài)庫(kù)和我們自己寫(xiě)的.h.m文件編譯成的.o可執(zhí)行文件绢片,并對(duì)這些庫(kù)進(jìn)行鏈接。
- 4.3 加載所有方法(runtime就是在這個(gè)時(shí)候被初始化并完成OC的內(nèi)存布局)
- 4.4 加載C函數(shù)
- 4.5 加載category的擴(kuò)展(此時(shí)runtime會(huì)對(duì)所有類(lèi)結(jié)構(gòu)進(jìn)行初始化)
- 4.6 加載C++靜態(tài)函數(shù)岛琼,加載OC+load
- 4.7 最后dyld返回main函數(shù)地址底循,main函數(shù)被調(diào)用
安全
ASLR(Address Space Layout Randomization):地址空間布局隨機(jī)化,鏡像會(huì)在隨機(jī)的地址上加載槐瑞。
代碼簽名:為了在運(yùn)行時(shí)驗(yàn)證 Mach-O 文件的簽名熙涤,并不是每次重復(fù)的去讀入整個(gè)文件,而是把文件每頁(yè)內(nèi)容都生成一個(gè)單獨(dú)的加密散列值困檩,并把值存儲(chǔ)在 __LINKEDIT
中祠挫。這使得文件每頁(yè)的內(nèi)容都能及時(shí)被校驗(yàn)確并保不被篡改。而不是每個(gè)文件都做hash加密并做數(shù)字簽名悼沿。
加載Mach-O文件
dyld
dyld叫做動(dòng)態(tài)鏈接器等舔,主要的職責(zé)是完成各種庫(kù)的連接。dyld是蘋(píng)果用C++寫(xiě)的一個(gè)開(kāi)源庫(kù)糟趾,可以在蘋(píng)果的git上直接查看源代碼慌植。
Unix 的前二十年很安逸甚牲,因?yàn)槟菚r(shí)還沒(méi)有發(fā)明動(dòng)態(tài)鏈接庫(kù)。有了動(dòng)態(tài)鏈接庫(kù)后蝶柿,一個(gè)用于加載鏈接庫(kù)的幫助程序被創(chuàng)建丈钙。在蘋(píng)果的平臺(tái)里是 dyld
,其他 Unix 系統(tǒng)也有 ld.so
交汤。 當(dāng)內(nèi)核完成映射進(jìn)程的工作后會(huì)將名字為 dyld
的Mach-O 文件映射到進(jìn)程中的隨機(jī)地址雏赦,它將 PC 寄存器設(shè)為 dyld
的地址并運(yùn)行。dyld
在應(yīng)用進(jìn)程中運(yùn)行的工作是加載應(yīng)用依賴(lài)的所有動(dòng)態(tài)鏈接庫(kù)蜻展,準(zhǔn)備好運(yùn)行所需的一切,它擁有的權(quán)限跟應(yīng)用一樣邀摆。
下面的步驟構(gòu)成了 dyld
的時(shí)間線:
Load dylibs -> Rebase -> Bind -> ObjC -> Initializers
加載 Dylib
從主執(zhí)行文件的 header 獲取到需要加載的所依賴(lài)動(dòng)態(tài)庫(kù)列表纵顾,而 header 早就被內(nèi)核映射過(guò)。然后它需要找到每個(gè) dylib栋盹,然后打開(kāi)文件讀取文件起始位置施逾,確保它是 Mach-O 文件。接著會(huì)找到代碼簽名并將其注冊(cè)到內(nèi)核例获。然后在 dylib 文件的每個(gè) segment 上調(diào)用 mmap()
汉额。應(yīng)用所依賴(lài)的 dylib 文件可能會(huì)再依賴(lài)其他 dylib,所以 dyld
所需要加載的是動(dòng)態(tài)庫(kù)列表一個(gè)遞歸依賴(lài)的集合榨汤。一般應(yīng)用會(huì)加載 100 到 400 個(gè) dylib 文件蠕搜,但大部分都是系統(tǒng) dylib,它們會(huì)被預(yù)先計(jì)算和緩存起來(lái)收壕,加載速度很快妓灌。
Rebasing
正如我們前面幾章學(xué)到的,Mach-O文件中蜜宪,對(duì)于鏡像內(nèi)部的一些指針指向虫埂,都是按照虛擬內(nèi)存地址沒(méi)有偏移計(jì)算的。如今用了 ASLR 后會(huì)將 dylib 加載到新的隨機(jī)地址(actual_address)圃验,這個(gè)隨機(jī)的地址跟代碼和數(shù)據(jù)指向的舊地址(preferred_address)會(huì)有偏差掉伏,dyld
需要修正這個(gè)偏差(slide),做法就是將 dylib 內(nèi)部的指針地址都加上這個(gè)偏移量澳窑,偏移量的計(jì)算方法如下:
Slide = actual_address - preferred_address
然后就是重復(fù)不斷地對(duì) __DATA
段中需要 rebase 的指針加上這個(gè)偏移量斧散。這就又涉及到 page fault 和 COW(copy-on-write
)。這可能會(huì)產(chǎn)生 I/O 瓶頸摊聋,但因?yàn)?rebase 的順序是按地址排列的颅湘,所以從內(nèi)核的角度來(lái)看這是個(gè)有次序的任務(wù),它會(huì)預(yù)先讀入數(shù)據(jù)栗精,減少 I/O 消耗闯参。
Binding
Binding 是處理那些指向 dylib 外部的指針瞻鹏,它們實(shí)際上被符號(hào)(symbol)名稱(chēng)綁定,也就是個(gè)字符串鹿寨。具體如何綁定的新博,不清楚的同學(xué)可以再回顧一下第三章相關(guān)知識(shí)。在這步時(shí)脚草,鏈接器會(huì)需要找到 symbol 對(duì)應(yīng)的實(shí)現(xiàn)赫悄,這需要很多計(jì)算,去符號(hào)表里查找馏慨。找到后會(huì)將內(nèi)容存儲(chǔ)到 __DATA
段中的那個(gè)指針中埂淮。Binding 看起來(lái)計(jì)算量比 Rebasing 更大,但其實(shí)需要的 I/O 操作很少写隶,因?yàn)橹?Rebasing 已經(jīng)替 Binding 做過(guò)了倔撞。
這里,Rebasing
和 Binding
都可以被統(tǒng)稱(chēng)為 Fix-ups
慕趴。即修正(fix-up)指針和數(shù)據(jù)痪蝇。
- Rebasing:在鏡像內(nèi)部調(diào)整指針的指向
- Binding:將指針指向鏡像外部的內(nèi)容
Objective-C 中有很多數(shù)據(jù)結(jié)構(gòu)都是靠 Rebasing 和 Binding 來(lái)修正(fix-up)的,比如 Class
中指向超類(lèi)的指針和指向方法的指針冕房。
ObjC 是個(gè)動(dòng)態(tài)語(yǔ)言躏啰,可以用類(lèi)的名字來(lái)實(shí)例化一個(gè)類(lèi)的對(duì)象。這意味著 ObjC Runtime 需要維護(hù)一張映射類(lèi)名與類(lèi)的全局表耙册。當(dāng)加載一個(gè) dylib 時(shí)给僵,其定義的所有的類(lèi)都需要被注冊(cè)到這個(gè)全局表中。
在 ObjC 中可以通過(guò)定義類(lèi)別(Category)的方式改變一個(gè)類(lèi)的方法详拙。有時(shí)你想要添加方法的類(lèi)在另一個(gè) dylib 中想际,而不在你的鏡像中(也就是對(duì)系統(tǒng)或別人的類(lèi)動(dòng)刀),這時(shí)也需要做些 fix-up溪厘。
總結(jié)
Fix-up之后胡本,就是創(chuàng)建OC的內(nèi)存布局,runtime等等畸悬,本文就不一一細(xì)講了侧甫。
結(jié)合上面的知識(shí),我們可以知道蹋宦,想要加快App的啟動(dòng)速度:
- 加載Dylib階段披粟,之前提到過(guò)加載系統(tǒng)的 dylib 很快,因?yàn)橛袃?yōu)化冷冗。但加載內(nèi)嵌(embedded)的 dylib 文件很占時(shí)間守屉,所以盡可能把多個(gè)內(nèi)嵌 dylib 合并成一個(gè)來(lái)加載,或者使用 static archive蒿辙。
-
Rebase/Binding
階段拇泛,查看__DATA
段中需要修正(fix-up)的指針滨巴,減少指針數(shù)量才會(huì)減少這部分工作的耗時(shí)。對(duì)于 ObjC 來(lái)說(shuō)就是減少Class
,selector
和category
這些元數(shù)據(jù)的數(shù)量俺叭。從編碼原則和設(shè)計(jì)模式之類(lèi)的理論都會(huì)鼓勵(lì)大家多寫(xiě)精致短小的類(lèi)和方法恭取,并將每部分方法獨(dú)立出一個(gè)類(lèi)別,其實(shí)這會(huì)增加啟動(dòng)時(shí)間熄守。對(duì)于 C++ 來(lái)說(shuō)需要減少虛方法蜈垮,因?yàn)樘摲椒〞?huì)創(chuàng)建 vtable,這也會(huì)在__DATA
段中創(chuàng)建結(jié)構(gòu)裕照。雖然 C++ 虛方法對(duì)啟動(dòng)耗時(shí)的增加要比 ObjC 元數(shù)據(jù)要少攒发,但依然不可忽視。最后推薦使用 Swift 結(jié)構(gòu)體晋南,它需要 fix-up 的內(nèi)容較少惠猿。
本文只是簡(jiǎn)要的介紹了相關(guān)方面知識(shí),感興趣的同學(xué)搬俊,可以自行 google 相關(guān)資料紊扬。