之前在別人博客下面看到了一個問題辛块,覺得挺有意思的畔派。但是自己想回答的時候又發(fā)現(xiàn)好像有一些知識點還不是很熟悉,覺得有點迷糊润绵,所以準(zhǔn)備再研究一下底層再來回答問題∠咭現(xiàn)在把這個坑填上吧。
OC對象的指針類型
Objective-C
是一門動態(tài)語言授药,而動態(tài)語言是在運行時確定數(shù)據(jù)類型士嚎,變量使用之前不需要類型聲明。但是我們在寫代碼的時候還是要給對象一個類型或者使用id
的悔叽,我自己覺得這么做是為了通過編譯(例如聲明了類型為NSObject的實例sark莱衩,卻調(diào)用了方法foo,那么編譯就通不過了)娇澎。
實際上動態(tài)語言的一個特性多態(tài)
就是這么實現(xiàn)的笨蚁,即用父類的指針指向子類的實例。
對象的內(nèi)存分布
還是舉個例子會明白一點趟庄。需要注意的是需要在模擬器
上調(diào)試括细,在真機
調(diào)試會有問題的。
@interface Father : NSObject
@property (nonatomic, copy) NSString *name;
@end
@implementation ViewController
- (void)foo {
Father *father1 = [Father new];
father1.name = @"001";
id father2 = [Father new];
}
@end
調(diào)試之前戚啥,我們要明白幾點常識奋单。在計算機中每個字節(jié)都是有一個地址的,每個字節(jié)有8個bit猫十,每個bit可以存儲1或者0览濒,這8個bit就是這個字節(jié)的值呆盖。在小端系統(tǒng)中,低位的值存儲在低地址上贷笛。
使用 x 命令調(diào)試应又。格式:x/<n/f/u> <addr>
- x 顯示內(nèi)存
- n 正整數(shù),表示需要顯示的內(nèi)存單元的個數(shù)
- f 表示addr指向的內(nèi)存內(nèi)容的輸出格式
- s: 對應(yīng)輸出字符串
- x: 按十六進制格式顯示變量
- d: 按十進制格式顯示變量
- c: 按字符格式顯示變量
- u 以多少個字節(jié)作為一個內(nèi)存單元
- b: 1 byte
- h: 2 bytes
- w: 4 bytes
- g: 8 bytes
打斷點乏苦,然后輸入命令: x/8xg father1
, 即:以8個字節(jié)為一個單元株扛,從 father1 指針的地址開始起8個單元的值
(lldb) x/8xg father1
0x6000000128f0: 0x000000010be34050 0x000000010bdcc058
Class name
0x600000012900: 0x00006000000128a0 0x0000000100000002
0x600000012910: 0x000000010f8f8e58 0x0000000000000000
0x600000012920: 0x0000000000000000 0x0000000000000000
(lldb) x/8xg father2
0x600000012490: 0x000000010be34050 0x0000000000000000
Class name
0x6000000124a0: 0xbadd2dcdc19dbead 0x00006000000124f0
0x6000000124b0: 0x0000000000000000 0x0000000000000000
0x6000000124c0: 0x00007f8ae3c140c0 0x00006080000092b0
這里我提前將這些地址代表的意思標(biāo)注好了。
father2
雖然是id
類型的汇荐,但是它跟father1
第一個8字節(jié)所存儲的地址是相同的洞就,都是0x000000010be34050
。其實這個地址就是 Father
類的地址拢驾。我們可以使用下面的方法驗證:
(lldb) po (Class)0x000000010be34050
Father
所以一個實例對象第一個8字節(jié)存儲的是這個類的指針奖磁,那么后面的字節(jié)存儲的是什么呢?答案是這個實例的成員變量繁疤,在上面的例子中我們給實例father1
的成員變量name
賦值了001
, 現(xiàn)在讓我們驗證一下:
(lldb) po (id)0x000000010bdcc058
001
因為我們沒有對father2
的成員變量 name 賦值咖为,所以這8個字節(jié)的值是空的。
打開 runtime 750版本源碼稠腊,查看 id 和 Class 的定義
typedef struct objc_class *Class;
typedef struct objc_object *id;
struct objc_object {
private:
isa_t isa;
}
union isa_t {
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
#endif
};
struct objc_class : objc_object {
// Class ISA;
Class superclass;
cache_t cache; // formerly cache pointer and vtable
class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags
class_rw_t *data() {
return bits.data();
}
}
- id的定義很簡單躁染,是一個指向 objc_object 的指針,而 objc_object 只有一個私有成員變量 isa架忌。objc_class 繼承于 objc_object吞彤,所以你也可以用 id 來聲明 Class 的變量,例如
id foo = [NSObject class];
叹放。 - isa是一個聯(lián)合體饰恕,里面的 struct 在不同架構(gòu)的CPU中定義是不同的。在 64 位CPU中井仰,isa 可以用來存儲更多的信息埋嵌,例如引用計數(shù),是否有關(guān)聯(lián)對象等俱恶,可以看我的這篇博客Objective-C引用計數(shù)原理
使用clang rewrite-objc ViewController.m
將代碼轉(zhuǎn)化成C++實現(xiàn)雹嗦,可以看到 Father 這個類變成了如下的結(jié)構(gòu)體
struct Father_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString *_name;
};
struct NSObject_IMPL {
Class isa;
};
看到這個結(jié)構(gòu)體你是不是就明白了為什么對象的內(nèi)存分布是下圖這個樣子的?
需要注意
的是合是,NSObject 的實例雖然理論上只有8個字節(jié)了罪,但是它的實例實際上有 16 個字節(jié),后面8個字節(jié)是空的聪全。
研究到這里泊藕,我們就可以回答開頭的那個問題了。
- 指針的類型是id類型难礼,而指針指向的類型可以是別的類娃圆。因為 OC 是動態(tài)語言汽久,變量的類型需要在運行時才能夠確定。
- 指針保存的是對象內(nèi)存的首地址
- 64位平臺中踊餐,對象首地址開始的8個字節(jié)存儲的是類的指針。也就是通過這個才能確定該類的類型
是不是很簡單臀稚!下面繼續(xù)讓我們研究下 Class 的內(nèi)存分布問題
Class的內(nèi)存分布
讓我們繼續(xù)回到之前的代碼調(diào)試吝岭。上一節(jié)中我們已經(jīng)知道了Father
類的地址了
(lldb) x/16xg 0x000000010be34050
0x10be34050: 0x000000010be34028 0x000000010f8f8e58
meta-class superClass
0x10be34060: 0x00006000000972f0 0x0000000200000003
bucket_t *_buckets _mask _occupied
0x10be34070: 0x0000600000074302 0x000000010f8f8e08
0x10be34080: 0x000000010f8f8e08 0x000000010f548520
0x10be34090: 0x0000000000000000 0x000000010bdd7df0
0x10be340a0: 0x000000010be34078 0x000000010f8f8e58
0x10be340b0: 0x000000010f548520 0x0000000000000000
0x10be340c0: 0x000000010bdd7e38 0x000000010f8f8e08
PS: 注意不要使用真機
來調(diào)試,因為我調(diào)試的時候發(fā)現(xiàn)跳不到那個內(nèi)存地址中吧寺,但在模擬器
中沒這個問題...
配套的我們把 objc_class 的定義放到下面窜管。
struct objc_class : objc_object {
// Class ISA;
Class superclass;
cache_t cache; // formerly cache pointer and vtable
class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags
class_rw_t *data() {
return bits.data();
}
}
因為 objc_class 繼承于 objc_object,所以 Class 的第一個8字節(jié)還是 isa 指針稚机,也就是一個指向元類(meta-Class)的指針幕帆。如果你不知道元類是什么意思的話就去百度,我也懶得講了赖条。第2個8字節(jié)儲存的是指向父類的指針失乾。先讓我們驗證一下
lldb) po (Class)0x000000010be34028
Father
(lldb) po (Class)0x000000010f8f8e58
NSObject
結(jié)論正確。讓我們接著看cache_t
的定義:
struct cache_t {
struct bucket_t *_buckets;
mask_t _mask;
mask_t _occupied;
}
struct bucket_t {
private:
// IMP-first is better for arm64e ptrauth and no worse for arm64.
// SEL-first is better for armv7* and i386 and x86_64.
#if __arm64__
MethodCacheIMP _imp;
cache_key_t _key;
#else
cache_key_t _key;
MethodCacheIMP _imp;
#endif
}
cache_t
關(guān)系到方法查找的緩存纬乍。當(dāng)對實例發(fā)送消息后碱茁,會先到Class的緩存中查找有沒有該方法的緩存,如果有則直接調(diào)用方法的實現(xiàn)仿贬,提高效率纽竣。
大致可以看出,bucket_t
是一個哈希表茧泪,根據(jù)_key
找到其映射的方法實現(xiàn)_imp
蜓氨,而_key
就是 SEL(方法的名字 const char *)。cache_t
是中的_mask
和_occupied
是兩個4字節(jié)的變量队伟,應(yīng)該代表的是緩存的數(shù)量穴吹。所以,Class 第三個8字節(jié)存儲的是bucket_t *
類型的指針缰泡,第4個8字節(jié)保存的是 _mask 和 _occupied刀荒。因為是小端,低位地址存儲低位的數(shù)據(jù)棘钞,所以 _mask 的值是0x00000003
缠借,而 _occupied 的值是0x00000002
接下來看 Class 的第3個成員變量class_data_bits_t bits;
struct class_data_bits_t {
// Values are the FAST_ flags above.
uintptr_t bits;
public:
class_rw_t* data() {
return (class_rw_t *)(bits & FAST_DATA_MASK);
}
}
在64位下,uintptr_t 為8個字節(jié)宜猜。class_data_bits_t 的公共方法有很多泼返,主要是配合掩碼進行一些讀寫操作。
繼續(xù)看class_rw_t
的定義
struct class_rw_t {
// Be warned that Symbolication knows the layout of this structure.
uint32_t flags;
uint32_t version;
const class_ro_t *ro;
method_array_t methods;
property_array_t properties;
protocol_array_t protocols;
Class firstSubclass;
Class nextSiblingClass;
char *demangledName;
#if SUPPORT_INDEXED_ISA
uint32_t index;
#endif
};
在結(jié)構(gòu)體中姨拥,你可以看到有一個成員變量的類型是class_ro_t
绅喉,是不是很像class_rw_t
渠鸽。從字面意思上可以猜測,一個是readwriite柴罐,一個是readonly徽缚。因為 OC 是動態(tài)語言,可以在運行時添加方法和成員變量革屠,運行時添加的方法或者成員變量就是添加到class_rw_t
上的凿试,而class_ro_t
存儲的是一些編譯后Class的信息。
在class_data_bits_t
的定義中似芝,我們知道了需要掩碼FAST_DATA_MASK
才能得到 class_rw_t 的地址那婉。下面是 class_rw_t
的內(nèi)存分布
// 得到class_rw_t的內(nèi)存地址
0x0000600000074302 & 0x00007ffffffffff8 = 0x600000074300;
(lldb) x/16xg 0x600000074300
0x600000074300: 0x00000000800a0000 0x000000010bdd7da8
flags version ro
0x600000074310: 0x000000010bdd7d18 0x000000010bdd7d90
methods properties
0x600000074320: 0x0000000000000000 0x000000010be33f60
protocols firstSubclass
0x600000074330: 0x000000010ee88c68 0x0000000000000000
nextSiblingClass demangledName
0x600000074340: 0xbadd2dcdc19dbead 0x0000600000074240
因為在代碼中我還聲明了一個 Father 的子類 Son,沒想到在這里出現(xiàn)党瓮,沒錯详炬,就是這個 firstSubclass。至于如果有多個子類寞奸,確定哪個是 firstSubclass 我就不清楚了呛谜。。枪萄。
(lldb) po (Class)0x000000010be33f60
Son
再來看一下class_ro_t
的定義:
struct class_ro_t {
uint32_t flags;
uint32_t instanceStart;
uint32_t instanceSize;
#ifdef __LP64__
uint32_t reserved;
#endif
const uint8_t * ivarLayout;
const char * name;
method_list_t * baseMethodList;
protocol_list_t * baseProtocols;
const ivar_list_t * ivars;
const uint8_t * weakIvarLayout;
property_list_t *baseProperties;
}
然后是它的內(nèi)存分布:
(lldb) x/16xg 0x000000010bdd7da8
0x10bdd7da8: 0x0000000800000184 0x0000000000000010
flags instanceStart instanceSize reserved
0x10bdd7db8: 0x000000010bd3ea79 0x000000010bd3eafc
ivarLayout name
0x10bdd7dc8: 0x000000010bdd7d18 0x0000000000000000
baseMethodList baseProtocols
0x10bdd7dd8: 0x000000010bdd7d68 0x0000000000000000
ivars weakIvarLayout
0x10bdd7de8: 0x000000010bdd7d90 0x0000002800000081
baseProperties
- 可以看到 ro 的成員變量中有
instanceStart
和instanceSize
呻率。這兩個值的作用是非脆弱成員變量
。即如果基類如果增加了成員變量呻引,不需要重新編譯礼仗,只需要在初始化系統(tǒng)自動修改instanceStart
和instanceSize
的值,就能夠繼續(xù)使用子類逻悠。具體你可以看我的這篇博客 談Objective-C類成員變量 - ivarLayout 記錄了那些是 storng 的ivar
- name 存儲的是這個類的名字元践,你可以使用
po (char *)0x000000010bd3eafc
打印該名字 - ivars 存儲的是該類的成員變量(不包括關(guān)聯(lián)對象)
- weakIvarLayout 記錄了哪一些是 weak 的ivar
還可以看到 ro 的baseMethodList
和rw的methods
的地址都是0x000000010bdd7d18
,ro 的baseProperties
和rw的properties
的地址都是0x000000010bdd7d90
實際上 rw 的三個成員變量童谒,
methods
,properties
,protocols
的類型都繼承于list_array_tt
单旁,這個列表可能有以下3中值:1. 空值 2. 指向列表的指針 3. 指向列表的指針的數(shù)組。所以這就是為什么Class可以在類目中添加方法和協(xié)議饥伊,只需要在這個列表數(shù)組中再添加一個指向類目中方法和協(xié)議列表的指針就好了象浑。
因為在這個實例中沒有使用類目添加方法,所以rw中methods數(shù)組僅有一個值琅豆,這個值等于ro的baseMethodList愉豺。
先來研究methods
。
struct method_t {
SEL name;
const char *types;
MethodListIMP imp;
}
struct method_list_t {
uint32_t entsizeAndFlags;
uint32_t count;
method_t first;
}
(lldb) x/16xg 0x000000010bdd7d18
0x10bdd7d18: 0x000000030000001a 0x000000010f547965
entsizeAndFlags count name
0x10bdd7d28: 0x000000010bd41271 0x000000010b7e01e0
types imp
0x10bdd7d38: 0x000000010fd3a28e 0x000000010bd41284
name types
0x10bdd7d48: 0x000000010b7e0180 0x0000000112f11912
imp name
0x10bdd7d58: 0x000000010bd4128c 0x000000010b7e01a0
types imp
0x10bdd7d68: 0x0000000100000020 0x000000010be30c50
0x10bdd7d78: 0x000000010bd19fc8 0x000000010bd4130b
0x10bdd7d88: 0x0000000800000003 0x0000000100000010
entsizeAndFlags
第一個4字節(jié)保存的是 entsize 和標(biāo)記, entsize 我的理解好像是method_t的長度茫因。第二個4字節(jié)保存的是方法的數(shù)量蚪拦,在上面的例子中我們可以知道一共保存了3個方法。后面保存了3個method_t的實例,每個實例占用了24個字節(jié)驰贷。每個 method_t 實例盛嘿,第一個8字節(jié)為 sel,即方法名字括袒;第二個8自己保存了方法的參數(shù)類型次兆;第3個8字節(jié)是方法的函數(shù)指針。我們把上面保存的3個方法的信息按順序打印出來
- .cxx_destruct v16@0:8
- name @16@0:8
- setName: v24@0:8@16
第2和第3個方法比較好理解锹锰,系統(tǒng)為我們自動生成了屬性 name 的 getter 和 setter 方法类垦。
第1個方法cxx_destruct
的作用是在delloc時釋放該類的成員變量的,具體你可以看這篇博客 探究ARC下dealloc實現(xiàn)
properties 與 methods 類似城须,因為繼承與同一個結(jié)構(gòu)體。這里簡單分析一下米苹,內(nèi)存分布為 entsizeAndFlags
(4字節(jié)), count(4字節(jié))糕伐,property_t數(shù)組。property_t里面有兩個成員變量蘸嘶,一個是屬性的名字良瞧,一個是屬性的屬性。训唱。褥蚯。
大致上這就是 Class 的內(nèi)存分布了,下面這張圖能夠簡要的概括了: