前言:
最近蛙粘,小編在看戴銘老師的技術分享,感覺收獲很多父丰「翁罚基于最近的學習掘宪,小編總結了一些App啟動優(yōu)化上的知識點,并計劃落地一系列App啟動優(yōu)化的文章攘烛。
目錄如下:
iOS App啟動優(yōu)化(一)—— 了解App的啟動流程
iOS App啟動優(yōu)化(二)—— 使用“Time Profiler”工具監(jiān)控App的啟動耗時
iOS App啟動優(yōu)化(三)—— 自己做一個工具監(jiān)控App的啟動耗時
前兩篇介紹了《iOS App的啟動流程》魏滚、《Time Profiler工具的使用》。
本篇將介紹通過hook
底層objc_msgSend
來掌握所有Objective-C
方法的執(zhí)行耗時坟漱。
一鼠次、什么是hook?
定義:hook
是指在原有方法開始執(zhí)行時芋齿,換成你指定的方法腥寇。或在原有方法的執(zhí)行前后觅捆,添加執(zhí)行你指定的方法赦役。從而達到改變指定方法的目的。
例如:
- 使用
runtime
的Method Swizzle
栅炒。 - 使用
Facebook
所開源的fishhook框架掂摔。
前者是ObjC
運行時提供的“方法交換”能力。
后者是對Mach-O
二進制文件的符號進行動態(tài)的“重新綁定”赢赊,已達到方法交換的目的乙漓。
問題1: fishhook的大致實現思路是什么?
在《iOS App啟動優(yōu)化(一)—— 了解App的啟動流程》中我們提到释移,動態(tài)鏈接器dyld會根據Mach-O二進制可執(zhí)行文件的符號表來綁定符號簇秒。而通過符號表及符號名就可以知道指針訪問的地址,再通過更改指針訪問的地址就能替換指定的方法實現了秀鞭。
問題2:為什么hook了objc_msgSend就可以掌握所有objc方法的耗時?
因為objc_msgSend
是所有Objective-C
方法調用的必經之路扛禽,所有的Objective-C
方法都會調用到運行時底層的objc_msgSend
方法锋边。所以只要我們可以hook objc_msgSend
,我們就可以掌握所有objc
方法的耗時编曼。(更多詳情可看我之前寫的《iOS 編寫高質量Objective-C代碼(二)》的第六點 —— 理解objc_msgSend(對象的消息傳遞機制))
另外豆巨,objc_msgSend
本身是用匯編語言寫的,蘋果已經開源了objc_msgSend
的源碼掐场⊥樱可在官網上下載查看:objc_msgSend源碼。
二熊户、如何hook底層objc_msgSend萍膛?
第一階段:與fishhook框架類似,我們先要擁有hook的能力嚷堡。
- 首先蝗罗,設計兩個結構體:
一個是用來記錄符號的結構體,一個是用來記錄符號表的鏈表。
struct rebinding {
const char *name;
void *replacement;
void **replaced;
};
struct rebindings_entry {
struct rebinding *rebindings;
size_t rebindings_nel;
struct rebindings_entry *next;
};
- 其次串塑,遍歷動態(tài)鏈接器
dyld
內所有的image
沼琉,取出其中的header
和slide
。
以便我們接下來拿到符號表桩匪。
static int fish_rebind_symbols(struct rebinding rebindings[], size_t rebindings_nel) {
int retval = prepend_rebindings(&_rebindings_head, rebindings, rebindings_nel);
if (retval < 0) {
return retval;
}
// If this was the first call, register callback for image additions (which is also invoked for
// existing images, otherwise, just run on existing images
//首先是遍歷 dyld 里的所有的 image打瘪,取出 image header 和 slide。注意第一次調用時主要注冊 callback
if (!_rebindings_head->next) {
_dyld_register_func_for_add_image(_rebind_symbols_for_image);
} else {
uint32_t c = _dyld_image_count();
// 遍歷所有dyld的image
for (uint32_t i = 0; i < c; i++) {
_rebind_symbols_for_image(_dyld_get_image_header(i), _dyld_get_image_vmaddr_slide(i)); // 讀取image內的header和slider
}
}
return retval;
}
- 上一步傻昙,我們在
dyld
內拿到了所有image
闺骚。
接下來,我們從image
內找到符號表內相關的segment_command_t
屋匕,遍歷符號表找到所要替換的segname
葛碧,再進行下一步方法替換。方法實現如下:
static void rebind_symbols_for_image(struct rebindings_entry *rebindings,
const struct mach_header *header,
intptr_t slide) {
Dl_info info;
if (dladdr(header, &info) == 0) {
return;
}
// 找到符號表相關的command过吻,包括 linkedit_segment command进泼、symtab command 和 dysymtab command。
segment_command_t *cur_seg_cmd;
segment_command_t *linkedit_segment = NULL;
struct symtab_command* symtab_cmd = NULL;
struct dysymtab_command* dysymtab_cmd = NULL;
uintptr_t cur = (uintptr_t)header + sizeof(mach_header_t);
for (uint i = 0; i < header->ncmds; i++, cur += cur_seg_cmd->cmdsize) {
cur_seg_cmd = (segment_command_t *)cur;
if (cur_seg_cmd->cmd == LC_SEGMENT_ARCH_DEPENDENT) {
if (strcmp(cur_seg_cmd->segname, SEG_LINKEDIT) == 0) {
linkedit_segment = cur_seg_cmd;
}
} else if (cur_seg_cmd->cmd == LC_SYMTAB) {
symtab_cmd = (struct symtab_command*)cur_seg_cmd;
} else if (cur_seg_cmd->cmd == LC_DYSYMTAB) {
dysymtab_cmd = (struct dysymtab_command*)cur_seg_cmd;
}
}
if (!symtab_cmd || !dysymtab_cmd || !linkedit_segment ||
!dysymtab_cmd->nindirectsyms) {
return;
}
// 獲得base符號表以及對應地址
uintptr_t linkedit_base = (uintptr_t)slide + linkedit_segment->vmaddr - linkedit_segment->fileoff;
nlist_t *symtab = (nlist_t *)(linkedit_base + symtab_cmd->symoff);
char *strtab = (char *)(linkedit_base + symtab_cmd->stroff);
// 獲得indirect符號表
uint32_t *indirect_symtab = (uint32_t *)(linkedit_base + dysymtab_cmd->indirectsymoff);
cur = (uintptr_t)header + sizeof(mach_header_t);
for (uint i = 0; i < header->ncmds; i++, cur += cur_seg_cmd->cmdsize) {
cur_seg_cmd = (segment_command_t *)cur;
if (cur_seg_cmd->cmd == LC_SEGMENT_ARCH_DEPENDENT) {
if (strcmp(cur_seg_cmd->segname, SEG_DATA) != 0 &&
strcmp(cur_seg_cmd->segname, SEG_DATA_CONST) != 0) {
continue;
}
for (uint j = 0; j < cur_seg_cmd->nsects; j++) {
section_t *sect =
(section_t *)(cur + sizeof(segment_command_t)) + j;
if ((sect->flags & SECTION_TYPE) == S_LAZY_SYMBOL_POINTERS) {
perform_rebinding_with_section(rebindings, sect, slide, symtab, strtab, indirect_symtab);
}
if ((sect->flags & SECTION_TYPE) == S_NON_LAZY_SYMBOL_POINTERS) {
perform_rebinding_with_section(rebindings, sect, slide, symtab, strtab, indirect_symtab);
}
}
}
}
}
- 最后纤虽,通過符號表以及我們所要替換的方法的實現乳绕,進行指針地址替換。
這是相關方法實現:
static void perform_rebinding_with_section(struct rebindings_entry *rebindings,
section_t *section,
intptr_t slide,
nlist_t *symtab,
char *strtab,
uint32_t *indirect_symtab) {
uint32_t *indirect_symbol_indices = indirect_symtab + section->reserved1;
void **indirect_symbol_bindings = (void **)((uintptr_t)slide + section->addr);
for (uint i = 0; i < section->size / sizeof(void *); i++) {
uint32_t symtab_index = indirect_symbol_indices[i];
if (symtab_index == INDIRECT_SYMBOL_ABS || symtab_index == INDIRECT_SYMBOL_LOCAL ||
symtab_index == (INDIRECT_SYMBOL_LOCAL | INDIRECT_SYMBOL_ABS)) {
continue;
}
uint32_t strtab_offset = symtab[symtab_index].n_un.n_strx;
char *symbol_name = strtab + strtab_offset;
if (strnlen(symbol_name, 2) < 2) {
continue;
}
struct rebindings_entry *cur = rebindings;
while (cur) {
for (uint j = 0; j < cur->rebindings_nel; j++) {
if (strcmp(&symbol_name[1], cur->rebindings[j].name) == 0) {
if (cur->rebindings[j].replaced != NULL &&
indirect_symbol_bindings[i] != cur->rebindings[j].replacement) {
*(cur->rebindings[j].replaced) = indirect_symbol_bindings[i];
}
indirect_symbol_bindings[i] = cur->rebindings[j].replacement;
goto symbol_loop;
}
}
cur = cur->next;
}
symbol_loop:;
}
}
到這里逼纸,通過調用下面的方法洋措,我們就擁有了hook
的基本能力。
static int fish_rebind_symbols(struct rebinding rebindings[], size_t rebindings_nel);
第二階段:通過匯編語言編寫出我們的hook_objc_msgSend
方法
因為objc_msgSend
是通過匯編語言寫的杰刽,我們想要替換objc_msgSend
方法還需要從匯編語言下手菠发。
既然我們要做一個監(jiān)控方法耗時的工具。這時想想我們的目的是什么贺嫂?
我們的目的是:通過hook
原objc_msgSend
方法滓鸠,在objc_msgSend
方法前調用打點計時操作,在objc_msgSend
方法調用后結束打點和計時操作第喳。通過計算時間差糜俗,我們就能精準的拿到方法調用的時長。
因此曲饱,我們要在原有的objc_msgSend
方法的調用前后需要加上before_objc_msgSend
和after_objc_msgSend
方法悠抹,以便我們后期的打點計時操作。
arm64 有 31 個 64 bit 的整數型寄存器扩淀,分別用 x0 到 x30 表示楔敌。主要的實現思路是:
- 入棧參數,參數寄存器是 x0~ x7引矩。對于 objc_msgSend 方法來說梁丘,x0 第一個參數是傳入對象侵浸,x1 第二個參數是選擇器 _cmd。syscall 的 number 會放到 x8 里氛谜。
- 交換寄存器中保存的參數掏觉,將用于返回的寄存器 lr 中的數據移到 x1 里。
- 使用 bl label 語法調用 pushCallRecord 函數值漫。
- 執(zhí)行原始的 objc_msgSend澳腹,保存返回值。
- 使用 bl label 語法調用 popCallRecord 函數杨何。
- 返回
里面涉及到的一些匯編指令:
指令 | 含義 |
---|---|
stp | 同時寫入兩個寄存器酱塔。 |
mov | 將值賦值到一個寄存器。 |
ldp | 同時讀取兩個寄存器危虱。 |
sub | 將兩個寄存器的值相減 |
add | 將兩個寄存器的值相加 |
ret | 從子程序返回主程序 |
詳細代碼如下:
#define call(b, value) \
__asm volatile ("stp x8, x9, [sp, #-16]!\n"); \
__asm volatile ("mov x12, %0\n" :: "r"(value)); \
__asm volatile ("ldp x8, x9, [sp], #16\n"); \
__asm volatile (#b " x12\n");
#define save() \
__asm volatile ( \
"stp x8, x9, [sp, #-16]!\n" \
"stp x6, x7, [sp, #-16]!\n" \
"stp x4, x5, [sp, #-16]!\n" \
"stp x2, x3, [sp, #-16]!\n" \
"stp x0, x1, [sp, #-16]!\n");
#define load() \
__asm volatile ( \
"ldp x0, x1, [sp], #16\n" \
"ldp x2, x3, [sp], #16\n" \
"ldp x4, x5, [sp], #16\n" \
"ldp x6, x7, [sp], #16\n" \
"ldp x8, x9, [sp], #16\n" );
#define link(b, value) \
__asm volatile ("stp x8, lr, [sp, #-16]!\n"); \
__asm volatile ("sub sp, sp, #16\n"); \
call(b, value); \
__asm volatile ("add sp, sp, #16\n"); \
__asm volatile ("ldp x8, lr, [sp], #16\n");
#define ret() __asm volatile ("ret\n");
__attribute__((__naked__))
static void hook_objc_msgSend() {
// Save parameters.
save() // stp入棧指令 入棧參數羊娃,參數寄存器是 x0~ x7。對于 objc_msgSend 方法來說埃跷,x0 第一個參數是傳入對象蕊玷,x1 第二個參數是選擇器 _cmd。syscall 的 number 會放到 x8 里弥雹。
__asm volatile ("mov x2, lr\n");
__asm volatile ("mov x3, x4\n");
// Call our before_objc_msgSend.
call(blr, &before_objc_msgSend)
// Load parameters.
load()
// Call through to the original objc_msgSend.
call(blr, orig_objc_msgSend)
// Save original objc_msgSend return value.
save()
// Call our after_objc_msgSend.
call(blr, &after_objc_msgSend)
// restore lr
__asm volatile ("mov lr, x0\n");
// Load original objc_msgSend return value.
load()
// return
ret()
}
這時候垃帅,每當底層調用hook_objc_msgSend
方法時,會先調用before_objc_msgSend
方法剪勿,再調用hook_objc_msgSend
方法贸诚,最后調用after_objc_msgSend
方法。
單個方法調用厕吉,流程如下圖:
舉一反“三”酱固,然后多層方法調用的流程,就變成了下圖:
這樣头朱,我們就能拿到每一層方法調用的耗時了媒怯。
三、如何使用這個工具髓窜?
第一步,在項目中欺殿,導入QiLagMonitor類庫寄纵。
第二步,在所需要監(jiān)控的控制器中脖苏,導入QiCallTrace.h
頭文件程拭。
[QiCallTrace start]; // 1. 開始
// your codes(你所要測試的代碼區(qū)間)
[QiCallTrace stop]; // 2. 停止
[QiCallTrace save]; // 3. 保存并打印方法調用棧以及具體方法耗時。
PS:目前該工具只能hook
所有objc
方法棍潘,并計算出區(qū)間內的所有方法耗時恃鞋。暫不支持swift方法的監(jiān)聽崖媚。
本文源碼:Demo
最后,我是站在iOS業(yè)界巨人的肩膀上完成了App啟動優(yōu)化(一)恤浪、(二)畅哑、(三),感謝戴銘老師精彩的技術分享水由。
另附上荠呐,戴銘老師課程鏈接:《iOS開發(fā)高手課》