0檀夹、iOS 包的構(gòu)成
在 iPhone 上的應(yīng)用包稱為 ipa熏挎,即 iPhone Application。將 ipa 包解壓后主要由以下三部分構(gòu)成:
1)同名的可執(zhí)行文件截珍;
2)Asset.car、.nib箩朴、.bundle岗喉、Localizable.strings 等資源文件;
3)其他:_CodeSignature 文件夾隧饼,簽名信息沈堡。
在iOS(和Mac OS X)上,主要的可執(zhí)行文件格式是 Mach-O 格式燕雁。在 Windows 上的可直接執(zhí)行的文件擴(kuò)展名是 .exe诞丽,而在Linux(以及很多版本的Unix)系統(tǒng)上 ELF 是可直接執(zhí)行的文件格式。
Mach-O 簡(jiǎn)介
Mach 內(nèi)核被 NeXT 公司的 NeXTSTEP 操作系統(tǒng)使用拐格。在 Mach 上僧免,一種可執(zhí)行的文件格是就是 Mach-O(Mach Object file format)。1996 年捏浊,喬布斯將 NeXTSTEP 帶回蘋果懂衩,成為了 OS X 的內(nèi)核基礎(chǔ)。所以雖然 Mac OS X 是 Unix 的“后代”金踪,但所主要支持的可執(zhí)行文件格式是Mach-O浊洞。
iOS 是從 OS X 演變而來(lái),所以同樣是支持 Mach-O 格式的可執(zhí)行文件胡岔。
Mach-O 的組成
Mach-O 文件由三部分組成:
1)頭部 (Header): Mach-O 文件的架構(gòu) 比如 Mac 的 PPC, PPC64, IA-32, x86-64法希,iOS 的 arm系列。
2)加載命令(Load commands): 在虛擬內(nèi)存中指定文件的邏輯結(jié)構(gòu)和布局靶瘸。
3)原始段數(shù)據(jù)(Raw segment data):可以擁有多個(gè)段(segment)苫亦,每個(gè)段可以擁有零個(gè)或多個(gè)區(qū)域(section)。每一個(gè)段(segment)都擁有一段虛擬地址映射到進(jìn)程的地址空間怨咪。
1屋剑、段表
段表,描述各個(gè)段在最后編譯成的可執(zhí)行文件中的偏移位置及大小诗眨,包括了
代碼段(__TEXT唉匾,保存程序代碼段編譯后的機(jī)器碼)和
數(shù)據(jù)段(__DATA,保存變量值)
第二行 __symbol_stub 的地址 0x00275FD0 = 第一行 __text 的地址 0x00002740 + 大小0x00273890
段名稱的含義:
__text:編譯后的程序執(zhí)行語(yǔ)句
__data:已初始化的全局變量和局部靜態(tài)變量
__bss:未初始化的全局變量和局部靜態(tài)變量
__cstring:代碼里的字符串常量
優(yōu)化方案
1匠楚、無(wú)用代碼
在項(xiàng)目里新建一個(gè)類肄鸽,給它添加幾個(gè)方法卫病,但不要在任何地方 import 它,build 完項(xiàng)目后觀察linkmap典徘,你會(huì)發(fā)現(xiàn)這個(gè)類還是被編譯進(jìn)可執(zhí)行文件了蟀苛。
按 C++ 的經(jīng)驗(yàn),沒有被使用到的類和方法編譯器都會(huì)優(yōu)化掉逮诲,不會(huì)編進(jìn)最終的可執(zhí)行文件帜平,但OC 不一樣,因?yàn)?OC 的動(dòng)態(tài)特性梅鹦,它可以通過類和方法名反射獲得這個(gè)類和方法進(jìn)行調(diào)用(KVC)裆甩,所以就算在代碼里某個(gè)類沒被使用到,編譯器也沒法保證這個(gè)類不會(huì)在運(yùn)行時(shí)通過反射去調(diào)用齐唆,所以只要是在項(xiàng)目里的文件嗤栓,無(wú)論是否又被使用到都會(huì)被編譯進(jìn)可執(zhí)行文件。
對(duì)此我們可以通過腳本箍邮,遍歷整個(gè)項(xiàng)目的文件茉帅,找出所有沒有被引用的類文件和沒有被調(diào)用的方法,在保證沒有其他地方動(dòng)態(tài)調(diào)用的情況下把它們?nèi)サ舳П住H绻麄€(gè)項(xiàng)目歷時(shí)很長(zhǎng)堪澎,歷時(shí)代碼遺留較多,這個(gè)清理對(duì)可執(zhí)行文件省出的空間還是挺可觀的味滞。
2樱蛤、類/方法名長(zhǎng)度
觀察 linkmap 可以發(fā)現(xiàn)每個(gè)類和方法名都在 __cstring 段里都存了相應(yīng)的字符串值,所以類和方法名的長(zhǎng)短也是對(duì)可執(zhí)行文件大小是有影響的剑鞍,原因還是 OC 的動(dòng)態(tài)特性昨凡,因?yàn)樾枰ㄟ^類/方法名反射找到這個(gè)類/方法進(jìn)行調(diào)用(KVC 機(jī)制),OC 對(duì)象模型會(huì)把類/方法名字符串都保存下來(lái)蚁署。
對(duì)此我們可以考慮在編譯前把所有類和方法名進(jìn)行混淆便脊,跟壓縮 js 一樣,把長(zhǎng)名字替換成短名字形用,這樣做的好處除了縮小體積外就轧,還對(duì)安全性有很大提升证杭,別人拿到可執(zhí)行文件對(duì)它 class-dump 出來(lái)的結(jié)果都是混淆后的類和方法名田度,就無(wú)法從類和方法名中猜出某個(gè)方法是做什么的,就難以掛鉤子進(jìn)行 hack解愤。不過這樣做有個(gè)缺點(diǎn)镇饺,就是 crash 堆棧反解出來(lái)的堆棧方法名會(huì)是混淆后的,需要再加一層混淆->原名的轉(zhuǎn)換送讲,實(shí)現(xiàn)和使用成本有點(diǎn)高奸笤。
實(shí)際上這部分占用的長(zhǎng)度比較小惋啃,中型項(xiàng)目也就幾百K,對(duì)安全性要求高的情況可以試試监右。
3边灭、靜態(tài)字符串抽離形成靜態(tài)文件
代碼上定義的所有靜態(tài)字符串都會(huì)記錄在在可執(zhí)行文件的 __cstring 段,如果項(xiàng)目里 Log 非常多健盒,這個(gè)空間占用也是可觀的绒瘦,也有幾百K的大小,可以考慮清理所有冗余的字符串扣癣。另外如果有特別長(zhǎng)的字符串惰帽,建議抽離保存成靜態(tài)文件,因?yàn)?AppStore 對(duì)可執(zhí)行文件加密導(dǎo)致壓縮率低父虑,特別長(zhǎng)的字符串抽離成靜態(tài)資源文件后壓縮率會(huì)比在可執(zhí)行文件里高很多该酗。
參考文檔:http://www.reibang.com/p/4bd6d1315104