Mach-O二進(jìn)制文件
Mach-O的文件頭包含的內(nèi)容:
- 魔數(shù)
- CPU類型及其子類型
- 文件類型
- 用于加載器的“加載命令”的條數(shù)和大小
- 動態(tài)鏈接器的標(biāo)志
Mach-O的加載命令
內(nèi)核加載器會在加載的過程中使用這些命令來對進(jìn)程進(jìn)行一些設(shè)置:包括分配虛擬內(nèi)存明吩、創(chuàng)建主線程棋傍、啟動動態(tài)鏈接器以及處理代碼簽名等工作。重要的命令有:
- LC_SEGMENT或者LC_SEGMENT_64(設(shè)置進(jìn)程的內(nèi)存空間)
- 代碼段(__TEXT)结胀、數(shù)據(jù)段(__DATA)辰如、用戶動態(tài)鏈接的樁(__stubs、__stub_helper)贵试、主程序代碼(__text)
- LC_LOAD_DYLINKER(內(nèi)核加載器在執(zhí)行該命令時啟動動態(tài)鏈接器)
- LC_MAIN(設(shè)置進(jìn)程的入口地址和棧大小琉兜,以及出程序計數(shù)器外的寄存器清零)
- LC_CODE_SIGNATURE(代碼簽名)
otool
可以用來可以用來分析加載命令和代碼段,如:otool -l /bin/ls
動態(tài)庫
動態(tài)鏈接
少量的進(jìn)程只需要內(nèi)核加載器
就能完成加載毙玻,OSX中幾乎所有的程序都是動態(tài)鏈接的--即填補對外部庫和符號的引用豌蟋。這個工作是由動態(tài)鏈接器
來完成。該過程也被稱為符號綁定
桑滩。這個過程大概是這樣的:
如果二進(jìn)制文件使用了外部定義的函數(shù)或符號梧疲,那么在他們的文本段中就會有一個名為__stubs的區(qū),在這個區(qū)中存放的是本地未定義符號的占位符运准。編譯器生成代碼時會創(chuàng)建對符號樁的調(diào)用幌氮,鏈接器在運行的時候會解決對樁的這些調(diào)用--即在被調(diào)用的地址處放置一條JMP指令,并將控制權(quán)交給真實的函數(shù)體胁澳。但不會修改棧该互。因此真實的函數(shù)可以正常返回,就像直接調(diào)用函數(shù)一樣韭畸。
鏈接一般都是遞歸的宇智,因為庫也有可能引用其他的庫。
共享庫緩存(shared library cache)
共享庫緩存是dyld支持的的另一種機制胰丁。是指:一些庫經(jīng)過預(yù)先鏈接随橘,然后保存在磁盤的一個文件中。
在OS X中dyld共享緩存保存在/private/var/db/dyld
目錄下锦庸。在iOS中則保存在/System/Library/Caches/com.apple.dyld
.
運行時加載
一般通過#include包含一些頭文件机蔗,這種方式構(gòu)建的可執(zhí)行文件只有在解決了所有依賴條件之后才能加載執(zhí)行。但是通過<dlfcn.h>
頭文件提供的函數(shù)就可以在運行時(runtime)加載庫。這樣函數(shù)有:
- dlopen(const char *path)
- dlopen_preflight(const char *path)
- dlsym(void *handle ,char *sym)
- dladdr(char *addr , DL_Info *info)
- dlerror()
Cocoa和Carbon為dl*系列提供了高層的封裝蜒车,以及CFBundle和NSBundle對象讳嘱,用于加載Mach-O bundle文件。
弱定義的符號
- 通常情況下符號都是被聲明為強定義的酿愧,即文件在執(zhí)行之前必須先解析這些符號沥潭,若發(fā)生解析失敗,則程序運行失敗嬉挡,通常也會觸發(fā)調(diào)試器陷阱钝鸽。
- 可以使用
__attribute__(weak_import)
將符號聲明為弱符號。這樣則在解析符號錯誤的時候庞钢,不會觸發(fā)鏈接錯誤拔恰,動態(tài)鏈接器會將這個符號設(shè)置為NULL,效果跟運行時加載動態(tài)庫類似(如dlopen)基括。
使用
nm -m xxx.dylib
可以顯示弱符號颜懊。
dyld的特性
兩級命名空間
- 通過將DYLD_FORCE_FLAT_NAMESPACE環(huán)境變量設(shè)置為非零即可禁用。
- 可執(zhí)行文件也可以在文件頭中設(shè)置MH_FORCE_FLAT標(biāo)志风皿,強制對其加載的所有庫使用平坦命名空間河爹。
函數(shù)攔截
- DYLD_INTERPOSE宏允許一個庫將其函數(shù)替換為另一個函數(shù)。(跟iOS的swizzle類似),例如:
DYLD_INTERPOSE(my_open ,open)
- dyld的函數(shù)攔截功能提供一個新的__DATA區(qū)桐款,名為__interpose,在這個區(qū)中依次列出了替換的函數(shù)和被替換的函數(shù)咸这,其他事情則交給dyld處理。例如:
static const interpose_t interposing_functions[] \\\\
__attribute__(section("__DATA,__interpose")) = {
{(void *)my_free , (void *)free },
{(void *)my_malloc , (void *) malloc },
};
完整代碼:
#include <stdio.h>
#include <unistd.h>
#include <fcntl.h>
#include <stdlib.h>
#include <malloc/malloc.h> // for malloc_printf()
// Note: Compile with GCC, not cc (important)
//
//
// This is the expected interpose structure
typedef struct interpose_s { void *new_func;
void *orig_func; } interpose_t;
// Our prototypes - requires since we are putting them in
// the interposing_functions, below
void *my_malloc(int size); // matches real malloc()
void my_free (void *); // matches real free()
// For clang, add attribute(used)
static const interpose_t interposing_functions[] \\\\
__attribute__ ((used, section("__DATA, __interpose"))) = {
{ (void *)my_free, (void *)free },
{ (void *)my_malloc, (void *)malloc }
};
void *
my_malloc (int size) {
// In our function we have access to the real malloc() -
// and since we don’t want to mess with the heap ourselves,
// just call it
//
void *returned = malloc(size);
// call malloc_printf() because the real printf() calls malloc()
// // internally - and would end up calling us, recursing ad infinitum
malloc_printf ( "+ %p %d\\\\n", returned, size); return (returned);
}
void
my_free (void *freed) {
// Free - just print the address, then call the real free()
malloc_printf ( "- %p\\\\n", freed); free(freed);
}
#if 0
From output 4-11:
morpheus@Ergo(~)$ gcc -dynamiclib l.c -o libMTrace.dylib -Wall // compile to dylib
morpheus@Ergo(~)$ DYLD_INSERT_LIBRARIES=libMTrace.dylib ls // force insert into ls
ls(24346) malloc: + 0x100100020 88
ls(24346) malloc: + 0x100800000 4096
ls(24346) malloc: + 0x100801000 2160
ls(24346) malloc: - 0x100800000
ls(24346) malloc: + 0x100801a00 3312 ... // etc.
#endif
使用
pagestuff
命令可以顯示文件邏輯頁中的符號魔眨。如:pagestuff /usr/lib/libgmalloc.dylib 6
,
進(jìn)程的地址空間
- 每一個進(jìn)程都有自己私有的虛擬地址空間媳维。
- 32位地址空間,用戶態(tài)可訪問整個4G的內(nèi)存空間遏暴。
- 64位的地址允許高達(dá)16EB(16GGB)
- 現(xiàn)代系統(tǒng)一般都會在每次啟動進(jìn)程的時候侄刽,將其地址空間隨機化(隨機的給每個段加上地址偏移)。
使用
vmmap
命令來查看內(nèi)存的空間布局朋凉,可以加上參數(shù)-interleaved
以清晰的方式導(dǎo)出地址空間唠梨。