前言
在開發(fā)中秦踪,我們做的很多事情都是main函數(shù)之后的捌肴,那main之前Xcode為我們做了哪些事呢式矫?
當(dāng)我們用Xcode連接真機(jī)或者模擬器運行應(yīng)用程序的的時候狸驳,都會有一個生成可執(zhí)行文件
的過程预明,稱之為編譯流程,如下圖:
我們這里只做簡單介紹缩赛,由于內(nèi)容過多,就不展開了撰糠,有興趣請自行查閱資料酥馍,或購買書《程序員的自我修養(yǎng):鏈接、裝載與庫》
-
預(yù)編譯:Xcode會將我們寫的.m .h等文件拿到阅酪,處理預(yù)編譯指令旨袒,比如:
刪除#define
并展開宏定義
,將#include
包含的文件插入到該指令位置
等 -
編譯:對預(yù)編譯處理過的文件進(jìn)行
詞法分析
遮斥、語法分析
峦失、語義分析
,并進(jìn)行源代碼優(yōu)化
术吗,生成匯編代碼
-
匯編:通過匯編器將
匯編代碼
轉(zhuǎn)為機(jī)器可以執(zhí)行
的指令,并生成目標(biāo).o文件
-
鏈接:將
動態(tài)庫
(.so帆精、.lib较屿、.framework),靜態(tài)庫
(.a卓练、. framework)和所有目標(biāo)文件進(jìn)行鏈接隘蝎,生成可執(zhí)行文件
一、dyld的定義
dyld:全稱
the dynamic loader
襟企,動態(tài)加載器嘱么,是蘋果操作系統(tǒng)的重要組成部分,在應(yīng)用程序被編譯打包成可執(zhí)行文件后顽悼,交由dyld
負(fù)責(zé)鏈接曼振,加載程序
該定義來自官方文檔
二、dyld的作用
加載應(yīng)用程序的可執(zhí)行文件蔚龙,并檢查可執(zhí)行文件中的Mach加載命令冰评,以查找應(yīng)用程序所需的框架和動態(tài)庫。然后木羹,它將每個框架加載到內(nèi)存中甲雅,并解析可執(zhí)行文件中的動態(tài)符號,以指向動態(tài)庫中的適當(dāng)?shù)刂贰?/p>
App啟動流程:
三坑填、dyld加載流程
3.1 定位入口函數(shù)_dyld_start
- 添加類
GomuPerson
- 實現(xiàn)類方法
load
臭家,并打下斷點
- 運行項目拿到堆棧信息:
1. 從左邊堆棧欄
中看堆棧信息
2. 在lldb
中用bt命令
打印堆棧信息
- 定位到入口函數(shù)
_dyld_start
长已,并獲取到_dyld_start
位于dyld庫
- 官網(wǎng)下載源碼:dyld750.6
3.2 _dyld_start源碼介紹
由于源碼會根據(jù)架構(gòu)不同,有不同的現(xiàn)實,這里以arm64
為例
- 找到匯編入口:
__dyld_start:
- 匯編看不懂就看后面的
注釋
-
__dyld_start:
會執(zhí)行到紅框處吩谦,調(diào)用dyldbootstrap
命名空間里面的start
方法
3.2.1 dyldbootstrap源碼和其中的start源碼介紹
由于代碼量過大,請自行查詢帜篇,這里只介紹主要的一些方法
namespace dyldbootstrap {
//: -- 定義別名Initializer
typedef void (*Initializer)(int argc, const char* argv[], const char* envp[], const char* apple[]);
//: -- 調(diào)用dyld的初始化方法
static void runDyldInitializers(int argc, const char* argv[], const char* envp[], const char* apple[])
{
for (const Initializer* p = &inits_start; p < &inits_end; ++p) {
(*p)(argc, argv, envp, apple);
}
}
#endif // DYLD_INITIALIZER_SUPPORT
//: -- 給dyld的數(shù)據(jù)段關(guān)聯(lián)指針
static void rebaseDyld(const dyld3::MachOLoaded* dyldMH)
{
......
}
//: -- dyld的引導(dǎo)方法
uintptr_t start(const dyld3::MachOLoaded* appsMachHeader, int argc, const char* argv[],
const dyld3::MachOLoaded* dyldsMachHeader, uintptr_t* startGlue)
{
//: -- 發(fā)送一個kdebug追蹤點表面dyld已經(jīng)開始引導(dǎo)
dyld3::kdebug_trace_dyld_marker(DBG_DYLD_TIMING_BOOTSTRAP_START, 0, 0, 0, 0);
//: -- 查詢設(shè)定dyld,dyld滑動之后中剩,必須重新設(shè)定
rebaseDyld(dyldsMachHeader);
//: -- 將env指針設(shè)置為剛好超出agv數(shù)組的末尾
const char** envp = &argv[argc+1];
//: -- 將envp指針設(shè)置為剛好超出agv數(shù)組的末尾
const char** apple = envp;
while(*apple != NULL) { ++apple; }
++apple;
//: -- 為堆棧設(shè)置隨機(jī)值
__guard_setup(apple);
#if DYLD_INITIALIZER_SUPPORT
//: -- 在dyld中運行所有C ++ initializers
runDyldInitializers(argc, argv, envp, apple);
#endif
//: -- 調(diào)用dyld::_main
uintptr_t appsSlide = appsMachHeader->getSlide();
return dyld::_main((macho_header*)appsMachHeader, appsSlide, argc, argv, envp, apple, startGlue);
}
#if TARGET_OS_SIMULATOR
//: -- 模擬器會多調(diào)用一次start_sim
uintptr_t start_sim(int argc, const char* argv[], const char* envp[], const char* apple[],
const dyld3::MachOLoaded* mainExecutableMH, const dyld3::MachOLoaded* dyldSimMH, uintptr_t dyldSlide,
const dyld::SyscallHelpers* sc, uintptr_t* startGlue)
{
......
}
#endif
} // end of namespace
- 源碼分析得出下一個流程
dyld::_main
調(diào)用
3.3 dyld::_main源碼介紹
由于dyld::_main
源量太大,但又極為重要抒寂,所以我們分步說明主要流程
3.3.1 配置環(huán)境變量
//: -- 給imageLoader設(shè)置平臺id
if (gProcessInfo->version >= 16){...}
//: -- 檢測并設(shè)置環(huán)境變量
checkEnvironmentVariables(envp);
//: -- 如果沒有設(shè)置環(huán)境變量结啼,則為DYLD_FALLBACK_FRAMEWORK_PATH賦默認(rèn)值
defaultUninitializedFallbackPaths(envp);
....
//: -- 獲取CPU架構(gòu)
getHostInfo(mainExecutableMH, mainExecutableSlide);
3.3.2 共享緩存
//: -- 如果主可執(zhí)行文件的區(qū)域與共享區(qū)域重疊,則禁用共享區(qū)域
//: -- iOS無法在沒有共享區(qū)域的情況下運行
checkSharedRegionDisable((dyld3::MachOLoaded*)mainExecutableMH, mainExecutableSlide);
if ( gLinkContext.sharedRegionMode != ImageLoader::kDontUseSharedRegion ) {
#if TARGET_OS_SIMULATOR
//: -- 判斷共享緩存是否映射到了共享區(qū)域
if ( sSharedCacheOverrideDir)
//: -- 共享緩存
mapSharedCache();
#else
//: -- 共享緩存
mapSharedCache();
#endif
3.3.3 主程序初始化
//: -- 主程序賦值屈芜,給主程序初始化ImageLoader
sMainExecutable = instantiateFromLoadedImage(mainExecutableMH, mainExecutableSlide, sExecPath);
- 給主程序變量
sMainExecutable
賦值了一個ImageLoaderMachO
類型的對象
3.3.3.1 instantiateFromLoadedImage源碼介紹
static ImageLoaderMachO* instantiateFromLoadedImage(const macho_header* mh, uintptr_t slide, const char* path)
{
// try mach-o loader
if ( isCompatibleMachO((const uint8_t*)mh, path) ) {
//: -- 實例化對象image接收實例主程序
ImageLoader* image = ImageLoaderMachO::instantiateMainExecutable(mh, slide, path, gLinkContext);
//: -- 添加到sAllImages里面
addImage(image);
return (ImageLoaderMachO*)image;
}
//: -- 拋出異常
throw "main executable not a known format";
}
- 通過
instantiateMainExecutable
方法創(chuàng)建一個ImageLoader
的實例化對象郊愧,然后添加到sAllImages
中
3.3.3.2 instantiateMainExecutable源碼介紹
ImageLoader* ImageLoaderMachO::instantiateMainExecutable(const macho_header* mh, uintptr_t slide, const char* path, const LinkContext& context)
{
bool compressed;
unsigned int segCount;
unsigned int libCount;
const linkedit_data_command* codeSigCmd;
const encryption_info_command* encryptCmd;
//: -- 獲取`Mach-O`類型文件的`Load Command`的相關(guān)信息,賦值給`compressed `等對象
sniffLoadCommands(mh, path, false, &compressed, &segCount, &libCount, context, &codeSigCmd, &encryptCmd);
// instantiate concrete class based on content of load commands
if ( compressed )
//: -- 返回壓縮過的Mach-O子類
return ImageLoaderMachOCompressed::instantiateMainExecutable(mh, slide, path, segCount, libCount, context);
else
#if SUPPORT_CLASSIC_MACHO
//: -- 返回普通的Mach-O子類
return ImageLoaderMachOClassic::instantiateMainExecutable(mh, slide, path, segCount, libCount, context);
#else
throw "missing LC_DYLD_INFO load command";
#endif
}
- 為主可執(zhí)行文件創(chuàng)建映像井佑,返回一個ImageLoader對象
3.3.4 插入動態(tài)庫
//: -- 插入動態(tài)庫
//: -- 加載所以DYLD_INSERT_LIBRARIES類型的庫
if ( sEnv.DYLD_INSERT_LIBRARIES != NULL ) {
for (const char* const* lib = sEnv.DYLD_INSERT_LIBRARIES; *lib != NULL; ++lib)
loadInsertedDylib(*lib);
}
3.3.5 鏈接主程序
link(sMainExecutable, sEnv.DYLD_BIND_AT_LAUNCH, true, ImageLoader::RPathChain(NULL, NULL), -1);
3.3.6 鏈接動態(tài)庫
//: -- 鏈接所有插入的動態(tài)庫
//: -- 鏈接主可執(zhí)行文件后執(zhí)行此操作属铁,這樣插入dylib(例如libSystem),將不會在程序使用的dylib之前
if ( sInsertedDylibCount > 0 ) {
for(unsigned int i=0; i < sInsertedDylibCount; ++i) {
ImageLoader* image = sAllImages[i+1];
link(image, sEnv.DYLD_BIND_AT_LAUNCH, true, ImageLoader::RPathChain(NULL, NULL), -1);
image->setNeverUnloadRecursive();
}
if ( gLinkContext.allowInterposing ) {
//: -- 只有被表示 INSERTED 的庫才能插入
//: -- 綁定所有插入的庫后再注冊插入信息躬翁,是為了鏈接
for(unsigned int i=0; i < sInsertedDylibCount; ++i) {
ImageLoader* image = sAllImages[i+1];
//: -- 注冊插入的image
image->registerInterposing(gLinkContext);
}
}
}
3.3.7 弱符號綁定
//: -- 通知插入的的Image已經(jīng)被綁定
if ( sInsertedDylibCount > 0 ) {
for(unsigned int i=0; i < sInsertedDylibCount; ++i) {
ImageLoader* image = sAllImages[i+1];
image->recursiveBind(gLinkContext, sEnv.DYLD_BIND_AT_LAUNCH, true);
}
}
3.3.8 執(zhí)行初始化方法
//: -- 執(zhí)行所以初始化程序
initializeMainExecutable();
3.3.8.1 initializeMainExecutable源碼介紹
void initializeMainExecutable()
{
//: -- 狀態(tài)變量焦蘑,記錄已經(jīng)進(jìn)入這里
gLinkContext.startedInitializingMainExecutable = true;
//: -- 運行所有的插入的dylib的initializers方法
ImageLoader::InitializerTimingList initializerTimes[allImagesCount()];
initializerTimes[0].count = 0;
const size_t rootCount = sImageRoots.size();
if ( rootCount > 1 ) {
for(size_t i=1; i < rootCount; ++i) {
//: -- 關(guān)鍵方法
sImageRoots[i]->runInitializers(gLinkContext, initializerTimes[0]);
}
}
//: -- 運行主要可執(zhí)行文件以及他附帶的一切的初始化方法
sMainExecutable->runInitializers(gLinkContext, initializerTimes[0]);
//: -- 當(dāng)此進(jìn)程退出時,調(diào)用cxa_atexit()處理程序所有image加載的的靜態(tài)終止符
if ( gLibSystemHelpers != NULL )
(*gLibSystemHelpers->cxa_atexit)(&runAllStaticTerminators, NULL, NULL);
// dump info if requested
if ( sEnv.DYLD_PRINT_STATISTICS )
ImageLoader::printStatistics((unsigned int)allImagesCount(), initializerTimes[0]);
if ( sEnv.DYLD_PRINT_STATISTICS_DETAILS )
ImageLoaderMachO::printStatisticsDetails((unsigned int)allImagesCount(), initializerTimes[0]);
}
- 進(jìn)入
initializeMainExecutable
方法后盒发,循環(huán)遍歷例嘱,為每一個插入的dylib
執(zhí)行initializers
方法
3.3.8.2 runInitializers源碼介紹
void ImageLoader::runInitializers(const LinkContext& context, InitializerTimingList& timingInfo)
{
uint64_t t1 = mach_absolute_time();
mach_port_t thisThread = mach_thread_self();
ImageLoader::UninitedUpwards up;
up.count = 1;
up.imagesAndPaths[0] = { this, this->getPath() };
processInitializers(context, thisThread, timingInfo, up);
context.notifyBatch(dyld_image_state_initialized, false);
mach_port_deallocate(mach_task_self(), thisThread);
uint64_t t2 = mach_absolute_time();
fgTotalInitTime += (t2 - t1);
}
- 調(diào)用
runInitializers
后,主要調(diào)用processInitializers
方法
3.3.8.3 processInitializers源碼介紹
void ImageLoader::processInitializers(const LinkContext& context, mach_port_t thisThread,
InitializerTimingList& timingInfo, ImageLoader::UninitedUpwards& images)
{
uint32_t maxImageCount = context.imageCount()+2;
ImageLoader::UninitedUpwards upsBuffer[maxImageCount];
ImageLoader::UninitedUpwards& ups = upsBuffer[0];
ups.count = 0;
//: -- 在所有images類表中宁舰,遞歸調(diào)用init拼卵,構(gòu)建未初始化的向上依賴關(guān)系新列表
for (uintptr_t i=0; i < images.count; ++i) {
images.imagesAndPaths[i].first->recursiveInitialization(context, thisThread, images.imagesAndPaths[i].second, timingInfo, ups);
}
//: -- 如果還有向上依賴的,init他們
if ( ups.count > 0 )
processInitializers(context, thisThread, timingInfo, ups);
}
- `processInitializers `函數(shù)中蛮艰,主要是對鏡像列表調(diào)用`recursiveInitialization `函數(shù)進(jìn)行遞歸實例化
3.3.8.4 recursiveInitialization源碼介紹
void ImageLoader::recursiveInitialization(const LinkContext& context, mach_port_t this_thread, const char* pathToInitialize,
InitializerTimingList& timingInfo, UninitedUpwards& uninitUps)
{
...
//: -- 關(guān)鍵代碼
//: -- 通知objc腋腮,我們將要初始化此鏡像
context.notifySingle(dyld_image_state_dependents_initialized, this, &timingInfo);
//: -- 初始化鏡像
bool hasInitializers = this->doInitialization(context);
//: -- 通知所有的關(guān)聯(lián)庫,我們已完成此鏡像的初始化
context.notifySingle(dyld_image_state_initialized, this, NULL);
...
}
- 初始化鏡像之前壤蚜,我們需要調(diào)用
notifySingle
即寡,通知objc
我們即將初始化這個鏡像,猜想會在objc
中有回調(diào)方法
仍律,需要在初始化之前執(zhí)行
- 初始化鏡像嘿悬,調(diào)用
doInitialization
- 通知所有的關(guān)聯(lián)庫,我們已完成此鏡像的初始化
3.3.8.5 notifySingle源碼介紹
static void notifySingle(dyld_image_states state, const ImageLoader* image, ImageLoader::InitializerTimingList* timingInfo)
{
...
//: -- 關(guān)鍵代碼
(*sNotifyObjCInit)(image->getRealPath(), image->machHeader());
...
}
-
sNotifyObjCInit
沒有源碼實現(xiàn)水泉,只有一個賦值操作
-
registerObjCNotifiers
會在_dyld_objc_notify_register
中調(diào)用
- 但是
_dyld_objc_notify_register
并沒有在dyld
庫被調(diào)用善涨,它在objc
庫中的_objc_init
中被調(diào)用
3.3.8.6 _objc_init源碼介紹
void _objc_init(void)
{
static bool initialized = false;
if (initialized) return;
initialized = true;
// fixme defer initialization until an objc-using image is found?
environ_init();
tls_init();
static_init();
runtime_init();
exception_init();
cache_init();
_imp_implementationWithBlock_init();
//: -- 進(jìn)行_dyld_objc_notify_register調(diào)用
_dyld_objc_notify_register(&map_images, load_images, unmap_image);
#if __OBJC2__
didCallDyldNotifyRegister = true;
#endif
}
- 我們確實在
_objc_init
中找到了_dyld_objc_notify_register
函數(shù)的調(diào)用 -
_objc_init
位于objc
, objc源碼 自行下載 -
_objc_init
函數(shù)中草则,對_dyld_objc_notify_register
函數(shù)進(jìn)行了賦值钢拧,那我們可以判斷出sNotifyObjCInit
的值就是_dyld_objc_notify_register
函數(shù)傳值的load_images
,所以notifySingle
是一個回調(diào)函數(shù)
3.3.8.7 load函數(shù)加載流程
- 流程比較簡單炕横,請自行查找
- 在
objc
源碼中源内,我們從load_images
->call_load_methods
->call_class_loads
->(*load_method)(cls, @selector(load))
- 在
_objc_init
中,在類的加載過程中份殿,的確調(diào)用了load
方法 - 那么
_objc_init
又在什么時候調(diào)用的呢膜钓,進(jìn)入剛剛預(yù)留的一個函數(shù)doInitialization
中
3.3.8.8 doInitialization源碼介紹
bool ImageLoaderMachO::doInitialization(const LinkContext& context)
{
CRSetCrashLogMessage2(this->getPath());
// mach-o has -init and static initializers
//: -- 初始化Image
doImageInit(context);
//: -- 初始化C++函數(shù)
doModInitFunctions(context);
CRSetCrashLogMessage2(NULL);
return (fHasDashInit || fHasInitializers);
}
- 進(jìn)入
doInitialization
源碼后嗽交,找到了Image和C++函數(shù)的初始化方法 - 進(jìn)入
doImageInit
,doModInitFunctions
源碼
3.3.8.9 doImageInit源碼介紹(doModInitFunctions源碼類似,這里就不過多贅述)
- 進(jìn)入
doImageInit
后颂斜,是一個遞歸調(diào)用初始化image - 這里依然沒有找到
_objc_init
的調(diào)用夫壁,已經(jīng)走到路的盡頭 - 注意紅框處,有一個加了注釋的條件沃疮,
libSystem initializer must run first
盒让,必須先加載系統(tǒng)庫,柳暗花明又一村 - 那我們猜想司蔬,
_objc_init
的調(diào)用是否在libSystem
庫中呢 - 去蘋果開源庫中搜索發(fā)現(xiàn)邑茄,
libSystem
沒有開源,那怎么辦俊啼?跳到3.4_objc_init
調(diào)用流程查找
3.3.9 尋找主程序入口(main函數(shù))
//: -- 尋找主程序入口
result = (uintptr_t)sMainExecutable->getEntryFromLC_MAIN();
if ( result != 0 ) {
//: -- 主程序使用 LC_MAIN, 我們需要在libdyld中使用helper來調(diào)用main()
if ( (gLibSystemHelpers != NULL) && (gLibSystemHelpers->version >= 9) )
*startGlue = (uintptr_t)gLibSystemHelpers->startGlueToCallExit;
else
halt("libdyld.dylib support not present for LC_MAIN");
}
else {
//: -- 主可執(zhí)行文件使用LC_UNIXTHREAD肺缕,dyld需要在為main()設(shè)置的程序中讓“啟動”
result = (uintptr_t)sMainExecutable->getEntryFromLC_UNIXTHREAD();
*startGlue = 0;
//: -- 通知進(jìn)入主函數(shù)
notifyMonitoringDyldMain()
}
- 從
Load Command
讀取LC_MAIN
入口,如果沒有吨些,就讀取LC_UNIXTHREAD
搓谆,這樣就來到了日常開發(fā)中熟悉的main函數(shù)
了 -
回到匯編也可以看到注釋call main(),如下圖紅框
- 注意:main是寫定的函數(shù)豪墅,寫入內(nèi)存,讀取到dyld黔寇,如果修改了main函數(shù)的名稱偶器,會報錯
3.4 _objc_init
調(diào)用流程
libSystem
沒有開源,那怎么辦缝裤?既然是探究的_objc_init
屏轰,那我們索性就下個_objc_init
的符號斷點,一探究竟
- 經(jīng)過符號斷點發(fā)現(xiàn)憋飞,
libSystem
會調(diào)用libdispatch
庫中的libdispatch_init
- 下載libdispatch源碼
3.4.1 libdispatch_init源碼查看
libdispatch_init(void)
{
...省略無關(guān)代碼
_os_object_init();
...
}
-
libdispatch_init
中調(diào)用了_os_object_init()
3.4.2 _os_object_init源碼查看
-
_os_object_init
中調(diào)用了_objc_init
霎苗,形成了閉環(huán)
四、總結(jié)
dyld 流程總結(jié):
_dyld_start
->dyldbootstrap::start
->dyld::_main
->dyld::initializeMainExecutable
->ImageLoader::runInitializers
->ImageLoader::processInitializers
->ImageLoader::recursiveInitialization
->doInitialization
->libSystem_initializer(libSystem.B.dylib)
->libdispatch_init(libdispatch.dylib)
->_os_object_init(libdispatch.dylib)
->_objc_init(libobjc.A.dylib)
dyld流程圖:
五榛做、拓展知識
靜態(tài)庫和動態(tài)庫
庫:是資源文件和代碼編譯的集合
靜態(tài)庫:在編譯時唁盏,完整的拷貝至可執(zhí)行文件中,被多次使用就有多次冗余拷貝
動態(tài)庫:程序運行時由系統(tǒng)動態(tài)加載到內(nèi)存检眯,而不是復(fù)制厘擂,供程序調(diào)用。系統(tǒng)只加載一次锰瘸,多個程序共用刽严,節(jié)省內(nèi)存。因此避凝,編譯內(nèi)容更小舞萄,而且因為動態(tài)庫是需要時才被引用眨补,所以更快。
動態(tài)庫靜態(tài)庫對比:
- 系統(tǒng)的庫基本上都是動態(tài)庫
- 使用場景:如果你有很多文件倒脓,靜態(tài)庫的多個副本意味著可執(zhí)行文件的大小增加撑螺,那就建議使用動態(tài)庫,可以節(jié)省時間把还。如果執(zhí)行時間的好處超過節(jié)省空間的需要实蓬,那么靜態(tài)庫就是最佳選擇。