1.概要
? ? ? ? ? 對于Runtime系統(tǒng),相信大部分iOS開發(fā)工程師都有著或多或少的了解腹躁。對于Objective-C,Runtime系統(tǒng)是至關(guān)重要的,可以說是Runtime系統(tǒng)讓Objective-C成為了區(qū)分于C語言姚垃,C++之外的一門獨立開發(fā)語言,讓OC在擁有了自己的面向?qū)ο蟮奶匦砸约跋l(fā)送機制盼忌。并且因為其強大的消息發(fā)送機制积糯,也讓很多人認為Objective-C是一門動態(tài)語言(實際上每種語言都具有一定的動態(tài)性,只是OC的Runtime更加強大谦纱,但它仍比不上Python,Lua等動態(tài)語言)看成。
? ? ? ? ? 而Runtime系統(tǒng)的核心就是一個用C,C++,以及在最核心的消息發(fā)送部分甚至使用匯編語言而編寫的一套底層API庫服协。它是OC面向?qū)ο蠛蛣討B(tài)發(fā)送消息的基石绍昂,它把很多編譯時做的決定推遲到運行時。而且研究Runtime源碼能知道很多底層知識偿荷,比如類是什么窘游,分類是怎么實現(xiàn)的,方法是什么等跳纳。所以準備寫一系列文章忍饰,詳細分析一下Runtime的源碼以及設(shè)計機制。
2.面向?qū)ο筇匦?—— 類與對象的實現(xiàn)
(一)類的實現(xiàn)
? ? ? ? ? 在C++中寺庄,類和結(jié)構(gòu)體就已經(jīng)非常相似了艾蓝。只是屬性的默認訪問權(quán)限有些區(qū)別力崇。而OC中的Class究竟是什么呢?很幸運赢织,蘋果已經(jīng)把Runtime庫開源,可以去蘋果的openSource上下載亮靴。打開Runtime工程,OC中的Class定義即可在Object.mm源碼中初見端倪:
typedef struct objc_class *Class;
? ? ? ? ? 我們使用的Class其實就是一個指向objc_class結(jié)構(gòu)體的指針于置,那么探尋類的構(gòu)成其實就是弄清楚objc_class結(jié)構(gòu)體的組成茧吊。在objc-runtime-new.h中,可以找到objc_class的定義八毯,源碼過長搓侄,我截取了關(guān)鍵部分,代碼如下:
struct objc_class : objc_object {
// Class ISA;
Class superclass;
cache_t cache;? ? ? ? ? ? // formerly cache pointer and vtable
class_data_bits_t bits;? ? // class_rw_t * plus custom rr/alloc flags
class_rw_t *data() {
return bits.data();
}
}
在分析結(jié)構(gòu)體內(nèi)的屬性之前话速,還能發(fā)現(xiàn)objc_class繼承于objc_object結(jié)構(gòu)體讶踪。從名字上就能看出來,objc_object是對象的結(jié)構(gòu)體泊交。這也說明了類本身其實也是一個對象乳讥。關(guān)于objc_object的問題留到后面再談,回到類結(jié)構(gòu)體。
類結(jié)構(gòu)體有三個屬性廓俭,superclass雏婶,cache,以及bit屬性。
(1)superclass白指,從名字上就能看出來留晚,它保存了自己的父類。如果本身已經(jīng)是根類NSObject告嘲,則為空错维。
(2) cache,從名字上也能看出來橄唬,它跟緩存相關(guān)赋焕。但是它究竟緩存了什么東西,還需要進入cache_t結(jié)構(gòu)體一探究竟仰楚,代碼如下:
struct cache_t {
struct bucket_t *_buckets;
mask_t _mask; //在find方法中可知
mask_t _occupied; //occupied:一個整數(shù)隆判,指定實際占用的緩存bucket的總數(shù)。
public:
struct bucket_t *buckets();
mask_t mask();
mask_t occupied();
void incrementOccupied();
void setBucketsAndMask(struct bucket_t *newBuckets, mask_t newMask);
void initializeToEmpty();
mask_t capacity();
bool isConstantEmptyCache();
bool canBeFreed();
static size_t bytesForCapacity(uint32_t cap);
static struct bucket_t * endMarker(struct bucket_t *b, uint32_t cap);
void expand();
void reallocate(mask_t oldCapacity, mask_t newCapacity);
struct bucket_t * find(cache_key_t key, id receiver);
static void bad_cache(id receiver, SEL sel, Class isa) __attribute__((noreturn));
};
有幾個需要重點關(guān)注的點:bucket_t結(jié)構(gòu)體的數(shù)組*_buckets僧界,mask_t結(jié)構(gòu)體的_mask和_occupied屬性侨嘀,以及返回類型為bucket_t類型的find(cache_key_t,id receiver)方法。
看起來有好幾處都指向了bucket_t結(jié)構(gòu)體捂襟,那我們先來看看這個結(jié)構(gòu)體的組成內(nèi)容:
struct bucket_t {
private:
cache_key_t _key;
IMP _imp;
public:
inline cache_key_t key() const { return _key; }
inline IMP imp() const { return (IMP)_imp; }
inline void setKey(cache_key_t newKey) { _key = newKey; }
inline void setImp(IMP newImp) { _imp = newImp; }
void set(cache_key_t newKey, IMP newImp);
};
bucket_t結(jié)構(gòu)體有兩個屬性咬腕,cache_key_t(unsighed long)型的key,以及方法指針I(yè)MP葬荷。大概知道了這個結(jié)構(gòu)體存了一個key與方法指針的對應關(guān)系涨共,再結(jié)合cache_t結(jié)構(gòu)體里的find()方法(在消息發(fā)送的章節(jié)中會重點介紹)纽帖,不難推測出cache_t緩存的是一個bucket鏈表,即近期調(diào)用過的方法的緩存區(qū)举反,目的是加快方法調(diào)用的速度懊直。不過究竟是如何加快,查找的規(guī)則又是如何火鼻,將在消息發(fā)送的章節(jié)中進行詳解吹截。
(3)class_data_bits_t結(jié)構(gòu)體的bits,這是類結(jié)構(gòu)中最重要的一環(huán)凝危,它存儲了類最基本的信息,如方法,成員變量晨逝,遵循的protocal列表等等蛾默。而我們要的數(shù)據(jù)都存在class_rw_t結(jié)構(gòu)體中,這點在objc_class中的注釋也能看出來:
class_data_bits_t bits;? ? // class_rw_t * plus custom rr/alloc flags
class_data_bits_t其實就是class_rw_t加上了自定義的rr/alloc標志位捉貌。而最核心的數(shù)據(jù)都在class_rw_t中支鸡。所以這個結(jié)構(gòu)體的源碼是我們重點關(guān)注的,做了一些精簡之后如下:
struct class_rw_t {
uint32_t flags;
uint32_t version;
const class_ro_t *ro;
method_array_t methods;
property_array_t properties;
protocol_array_t protocols;
}
首先映入眼簾趁窃,幾個令人興奮的關(guān)鍵字:method!property!protocals!
看來終于找到重點了牧挣,從名字就能看出來它保存了Method,Property,protocol列表。不過需要注意的是醒陆,因為在新版的Xcode提供了property自動合成成員變量的功能瀑构,很多人對property和Ivar的認知出現(xiàn)了混淆,需知道property本身不包括成員變量刨摩。而另外的methods和protocols寺晌,一目了然,就是我們要找的方法和遵循的協(xié)議列表澡刹。而flags與version標志位則是標志了該類是否是metaClass(下文會講解)呻征,是否被實現(xiàn)等等。
但是新的問題隨之產(chǎn)生罢浇,這些array是怎么被生成的陆赋,又是按照什么規(guī)則生成的,category里的方法是什么時候添進去的呢嚷闭?而且還有一個class_ro_t常量指針攒岛,它有什么作用,又指向了什么內(nèi)容呢胞锰?讓我們刨根問底吧阵子!首先先解答第二個問題,class_ro_t結(jié)構(gòu)體的內(nèi)容如下:
struct class_ro_t {
uint32_t flags;
uint32_t instanceStart;
uint32_t instanceSize;
#ifdef __LP64__
uint32_t reserved;
#endif
const uint8_t * ivarLayout;
const char * name;
method_list_t * baseMethodList;
protocol_list_t * baseProtocols;
const ivar_list_t * ivars;
const uint8_t * weakIvarLayout;
property_list_t *baseProperties;
method_list_t *baseMethods() const {
return baseMethodList;
}
};
事實上胜蛉,class_ro_t保存了類在編譯期就確定的method list挠进,Ivar list等色乾。關(guān)于這點我們可以在_read_images方法中的readClass方法中求證,Runtime系統(tǒng)從image文件中拿到類的定義领突,然后將這個類的data()數(shù)據(jù)暖璧,賦給了新生成的類的rw數(shù)據(jù)中的ro,這里說的比較晦澀君旦,因為它更底層澎办,以后會專門用一篇文章來講這部分的內(nèi)容。
最后把這一個個根據(jù)image文件中類定義生成出來的新類進行實現(xiàn)金砍,即realizeClass方法局蚀。我們現(xiàn)在就來看看類的方法,協(xié)議和分類的方法恕稠,協(xié)議是如何串起來的琅绅。
進入realizeClass()方法,會發(fā)現(xiàn)它會先realize自己的superClass鹅巍,metaClass千扶,以及設(shè)置標志位。在方法快結(jié)束的時候骆捧,有一句代碼:
// Attach categories
methodizeClass(cls);
看注釋就能明白澎羞,在這個地方會把類和分類串起來,生成最終的類敛苇。那跳進去看看具體做了什么事情妆绞。首先它將ro中保存的baseMethod,baseProperty,baseProtocols等添加進class_rw_t中的methods,propertys,protocols枫攀。然后再開始加載category摆碉,關(guān)鍵代碼:
// Attach categories.
category_list *cats = unattachedCategoriesForClass(cls, true /*realizing*/);
attachCategories(cls, cats, false /*don't flush caches*/);
首先拿到尚未attach到class的category列表,然后進入attachCategories方法脓豪,這里面就做了真正添加分類屬性的工作巷帝。這部分代碼不是很難,就是把方法數(shù)組等的第一個元素地址添加進Array扫夜。唯一需要注意的是楞泼,添加category的順序是按照category的load順序,最先被load的category首先被加載笤闯。
(二)對象的實現(xiàn)
? ? ? ? ? 相比于類的實現(xiàn)堕阔,對象的實現(xiàn)要簡單的多。在上文中颗味,我們能看到類結(jié)構(gòu)體是繼承于對象結(jié)構(gòu)體objc_object的超陆。可知類其實也是個對象,那我們順著追進去时呀,看看對象結(jié)構(gòu)體里究竟存了些啥张漂。
struct objc_object {
private:
isa_t isa;
public:
........
}
截取了部分代碼,發(fā)現(xiàn)objc_object有一個唯一的私有變量:isa谨娜。相信很多有研究過Runtime的同學都知道航攒,isa是一個指向自己類的指針。而實際上趴梢,在ISA()方法中漠畜,我們可以知道在64位CPU上,isa已經(jīng)不再是一個指針坞靶,而是non-pointer isa憔狞。
那什么是non-pointer isa?我們都知道在64位的機器上,一個指針會占8個字節(jié)彰阴,即64位瘾敢。但是我們的地址空間并不需要那么多位數(shù)來表示,如果把這64位的一部分用來存儲實際地址硝枉,而另外一部分存一些標志位,如這個對象是不是有弱引用的對象倦微,它有沒有關(guān)聯(lián)對象妻味,這個對象是否正在被銷毀等等。那么我們就可以更好的利用起來這64位空間欣福。那么基于這個思想责球,isa就步入了non-pointer isa時代,它提升了內(nèi)存的使用效率拓劝,降低了64位系統(tǒng)上的內(nèi)存消耗雏逾。
那么non-pointer isa的每一位究竟表示什么呢?這個跟處理器指令集有關(guān)郑临。越靠近底層就關(guān)注機器本身的特性栖博,一般在iOS開發(fā)中能接觸到的指令集有四種:arm架構(gòu)的v7和64,inter架構(gòu)上的i386和x86_64厢洞,一般在手機上我們會用到前兩種架構(gòu)仇让,而在PC模擬器上會用到后兩種。手機型號與CPU架構(gòu)對應關(guān)系如下:
以arm64架構(gòu)為例躺翻,定義如下:
# if __arm64__
#? define ISA_MASK? ? ? ? 0x0000000ffffffff8ULL
#? define ISA_MAGIC_MASK? 0x000003f000000001ULL
#? define ISA_MAGIC_VALUE 0x000001a000000001ULL
struct {
uintptr_t indexed? ? ? ? ? : 1;
uintptr_t has_assoc? ? ? ? : 1;
uintptr_t has_cxx_dtor? ? ? : 1;
uintptr_t shiftcls? ? ? ? ? : 33; // MACH_VM_MAX_ADDRESS 0x1000000000
uintptr_t magic? ? ? ? ? ? : 6;
uintptr_t weakly_referenced : 1;
uintptr_t deallocating? ? ? : 1;
uintptr_t has_sidetable_rc? : 1;
uintptr_t extra_rc? ? ? ? ? : 19;
#? ? ? define RC_ONE? (1ULL<<45)
#? ? ? define RC_HALF? (1ULL<<18)
};
它的non-pointer isa中包括第4位往后的33位是表示真實的isa地址丧叽,而其它都是一些相關(guān)標志位。有些一目了然就能知道是什么意思公你,比如has_assoc踊淳,weakly_referenced,deallocating,但是其余的標志位相對就比較晦澀陕靠,這部分將在以后的文章中進行詳解迂尝。
有了前面的講解脱茉,那么我們也就知道了,如果是為了拿到一個對象的類雹舀,直接訪問它的isa是很危險的芦劣,因為它并不是一個真實的地址,所以要使用[obj class]或者是objc_getClass的方式说榆,Runtime會幫我們做這一層轉(zhuǎn)換虚吟。
3.NSTaggedPointer
在看isa部分的源碼時,發(fā)現(xiàn)了很奇怪的一點,附源碼:
inline Class
objc_object::getIsa()
{
if (isTaggedPointer()) {
uintptr_t slot = ((uintptr_t)this >> TAG_SLOT_SHIFT) & TAG_SLOT_MASK;
return objc_tag_classes[slot];
}
return ISA();
}
在獲得isa的過程中签财,會先進行isTaggedPointer的判斷串慰,若不是TaggedPointer才會返回ISA。而判斷是不是TaggedPointer則是很簡單的用non-pointer isa與TAG_MASK做一個按位與的操作唱蒸,事實上上文中的indexed標志位邦鲫,即isa第一位就標志了該對象是不是一個NSTaggedPointer,若為0則是普通的isa神汹,若為1則表示是支持NSTaggedPointer的isa庆捺。
那什么情況下支持NSTaggedPointer,它又有什么作用呢屁魏?在objc_config.h中滔以,找到了以下定義:
// Define SUPPORT_NONPOINTER_ISA=1 to enable extra data in the isa field.
#if !__LP64__? ||? TARGET_OS_WIN32? ||? TARGET_IPHONE_SIMULATOR
#? define SUPPORT_NONPOINTER_ISA 0
#else
#? define SUPPORT_NONPOINTER_ISA 1
#endif
可以看出在蘋果是在64位平臺上開始支持NSTaggedPointer,那我們就可以合理猜測NSTaggedPointer的設(shè)計原理以及功效與non-pointer isa是差不多的氓拼。
在WWDC2013中你画,蘋果介紹了NSTaggedPointer,在32位時代桃漾,一個指針占4個字節(jié)坏匪,即32位。到了64位時代撬统,一個指針被擴大到了8個字節(jié)适滓,即64位。也就是說就算什么都不干恋追,僅僅是把以前的代碼放到64位系統(tǒng)上運行粒竖,內(nèi)存占用也會擴大一倍。而在絕大多數(shù)情況下几于,我們并不需要64位去存儲指針的地址蕊苗,我們完全可以像non-pointer isa一樣,去存點別的東西沿彭,比如說小對象本身的值朽砰,即對象的"指針"本身就已經(jīng)帶了值,不僅充分利用了內(nèi)存空間,而且更美妙的是還不用去二次查找瞧柔,這也加快了值的訪問速度漆弄,還減去了開辟內(nèi)存,銷毀的開銷造锅,這就是NSTaggedPointer的設(shè)計思想撼唾。
大家可以去WWDC2013的官方pdf中找到詳細的定義,在此就要點做一下簡單翻譯:
(1)NSTaggedPointer是在64位系統(tǒng)中被加入的,它專門用于存儲一些小的對象哥蔚,如NSNumber,NSDate倒谷。
(2)NSTaggedPointer把對象的值本身存在了pointer里面,沒有malloc和free的消耗(也不會存在堆中)糙箍。
(3)在性能上渤愁,它有三倍的內(nèi)存使用效率,以及106倍的生成和銷毀效率深夯。
(附原文地址:http://devstreaming.apple.com/videos/wwdc/2013/404xbx2xvp1eaaqonr8zokm/404/404.pdf)
現(xiàn)在我們也可以理解抖格,為什么在獲取isa的時候會先去判斷一下是不是NSTaggedPointer,因為它根本不是一個真正的對象咕晋,它的pointer本身就已經(jīng)存儲了它的值雹拄,當然它也就不會有isa指針了。不過由此也可以得出一個結(jié)論掌呜,對內(nèi)存的優(yōu)化滓玖,性能的追求是無止境的!
4.小結(jié)
本章講述了類和對象的實現(xiàn)站辉,以及蘋果在64位系統(tǒng)上針對對象指針做的優(yōu)化細節(jié)呢撞。下章將會繼續(xù)從源碼的角度去分析消息發(fā)送以及轉(zhuǎn)發(fā)的流程究竟是怎么實現(xiàn)的损姜,蘋果為此又做了什么關(guān)鍵的優(yōu)化饰剥。