PS:在跟著看今年的WWDC2020
所有的session
析藕,發(fā)現(xiàn)了很多更新颊亮,例如 objc_setHook_setAssociatedObject
的set
入口函數(shù)做了一層下沉,以及等等等等丢习,最大的一個(gè)更新就是出現(xiàn)了 class_rw_ext_t
奸绷, 以前只有 ro rw,現(xiàn)在多了一個(gè)rwe丘跌。
寫runtime
的代碼,一點(diǎn)只用 API唁桩,不要寫這些底層結(jié)構(gòu),但是一定要了解耸棒,因?yàn)槟愕腁PI是隨時(shí)可用的荒澡,如果你從 ro 里面讀取 protocols
、properties
与殃、methods
单山,那樣一旦底層結(jié)構(gòu)變了,代碼就得更新了幅疼。
再次梳理了目前最新的 OC 類結(jié)構(gòu)米奸。以便同事們參考。
整體代碼基于目前官方最近開源的OC底層源碼版本objc4_781爽篷,主要研究 objc-runtime-new.h
文件悴晰,runtime 這部分包:
- OC 的聲明后的實(shí)現(xiàn)部分開源。
- 底層調(diào)用的 C 和 C++ 開源逐工。
- 匯編語言
.mm
铡溪,Apple 對(duì)于一部分CC++無法實(shí)現(xiàn)的功能使用,例如msgSend
整個(gè)邏輯關(guān)系圖如下
1. objc_object 「萬物之源」
連類的結(jié)構(gòu)都是基于 objc_object
的泪喊,所以說 OC 里面一切皆對(duì)象呢棕硫。
objc_object
/// Represents an instance of a class.
struct objc_object {
Class _Nonnull isa OBJC_ISA_AVAILABILITY;
};
1.1 id 和 isa
id
的本質(zhì)其實(shí)就是一個(gè) objc_object *
的結(jié)構(gòu)體指針
/// A pointer to an instance of a class.
typedef struct objc_object *id;
在結(jié)構(gòu)體內(nèi)部只有一個(gè) Class
結(jié)構(gòu)的 isa
isa
是什么?isa 的本質(zhì)是 isa_t
袒啼,在另外一個(gè)文件 objc-private.h
中有 isa_t
的定義哈扮,是一個(gè)聯(lián)合體纬纪,也叫共用體,可以參考這篇文章講解共用體滑肉。
union isa_t {
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
#endif
};
這個(gè)里面存儲(chǔ)兩個(gè)育八,Class cls
和 uintptr_t bits
。因?yàn)槭锹?lián)合體赦邻,所有實(shí)際只能有一個(gè)出現(xiàn)髓棋,ISA_BITFIELD是真正存儲(chǔ)值的東西,它存儲(chǔ)于文件 isa.h
惶洲,根據(jù)平臺(tái)不同而不同按声,下面是 arm64
版本的:
ISA_BITFIELD
# if __arm64__
# define ISA_MASK 0x0000000ffffffff8ULL
# define ISA_MAGIC_MASK 0x000003f000000001ULL
# define ISA_MAGIC_VALUE 0x000001a000000001ULL
# define ISA_BITFIELD\
uintptr_t nonpointer : 1; /*0:代表普通指針,1:表示優(yōu)化過的恬吕,可以存儲(chǔ)更多信息签则。*/\
uintptr_t has_assoc : 1; /*是否設(shè)置過關(guān)聯(lián)對(duì)象。如果沒設(shè)置過铐料,釋放會(huì)更快*/\
uintptr_t has_cxx_dtor : 1; /*是否有C++的析構(gòu)函數(shù)*/\
uintptr_t shiftcls : 33; /* MACH_VM_MAX_ADDRESS 0x1000000000 內(nèi)存地址值*/ \
uintptr_t magic : 6; /*用于在調(diào)試時(shí)分辨對(duì)象是否未完成初始化*/\
uintptr_t weakly_referenced : 1; /*是否有被弱引用指向過*/\
uintptr_t deallocating : 1; /*是否正在釋放*/\
uintptr_t has_sidetable_rc : 1; /*引用計(jì)數(shù)器是否過大無法存儲(chǔ)在ISA中渐裂。如果為1,那么引用計(jì)數(shù)會(huì)存儲(chǔ)在一個(gè)叫做SideTable的類的屬性中*/\
uintptr_t extra_rc : 19; /*里面存儲(chǔ)的值是引用計(jì)數(shù)器減1*/\
# define RC_ONE (1ULL<<45)
# define RC_HALF (1ULL<<18)
這個(gè) ISA_MASK 這種的就是一個(gè)蒙版钠惩,isa 完整的值通過跟他進(jìn)行與操作柒凉,就只留下了class的地址,(Class)(isa.bits & ISA_MASK)
話外一提篓跛,objc_object
的結(jié)構(gòu)除了上面這個(gè)結(jié)構(gòu)膝捞,根據(jù)這個(gè)結(jié)構(gòu)存的值,提供了一整套的API方法愧沟,存儲(chǔ)于 objc_private.h
文件中蔬咬。
那么 Class 是什么呢?看2.0
2. class 結(jié)構(gòu)體:objc_class
Class
是 objc_class *
結(jié)構(gòu)體指針沐寺。
objc_class
struct objc_class : objc_object {
// Class ISA;
Class superclass;
cache_t cache; // formerly cache pointer and vtable
class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags
class_rw_t *data() const {
return bits.data();
}
}
這里先后存儲(chǔ)的東西分四個(gè):
- 繼承來的
isa
結(jié)構(gòu)的指針林艘,占8字節(jié) - superClass 的 Class 指針,占8字節(jié)
- cache類型混坞,本篇跳過狐援。
- class_data_bits_t類型的bits,下段落展開拔第。
3. 類中數(shù)據(jù) class_data_bits_t
class_data_bits_t
里存儲(chǔ)著當(dāng)前類的很多信息咕村,通過 class_data_bits_t 進(jìn)行蒙版運(yùn)算 (bits & FAST_DATA_MASK)
可以算出 class_rw_t
,簡(jiǎn)稱就是 rw
蚊俺。
下一段落重點(diǎn)講解 class_rw_t
懈涛。
class_data_bits_t ==> class_rw_t ==> class_ro_t
class_data_bits_t ==> class_rw_t ==> class_rwe_t
這個(gè)關(guān)系是 2020 年新的變動(dòng),作為OC Swift的開發(fā)者一點(diǎn)要了解泳猬,具體看這段 WWDC Session
class_data_bits_t
struct class_data_bits_t {
friend objc_class;
// Values are the FAST_ flags above.
uintptr_t bits;
public:
class_rw_t* data() const {
return (class_rw_t *)(bits & FAST_DATA_MASK);
}
void setData(class_rw_t *newData)
{
ASSERT(!data() || (newData->flags & (RW_REALIZING | RW_FUTURE)));
//這個(gè)過程不需要加鎖處理批钠,因?yàn)閮H在實(shí)現(xiàn)或構(gòu)造期間進(jìn)行 Set 操作
//使用 store-release fence 操作宇植,類似一種輕量級(jí)的資源鎖,
//如下面的`atomic_thread_fence `埋心,因?yàn)榭赡軙?huì)同時(shí)存在數(shù)據(jù)的讀寫
uintptr_t newBits = (bits & ~FAST_DATA_MASK) | (uintptr_t)newData;
atomic_thread_fence(memory_order_release);
bits = newBits;
}
//獲取類的ro數(shù)據(jù)指郁,即使在構(gòu)建過程中。
//這個(gè)需要修復(fù)拷呆,至少在沒有編譯器屏障的情況下闲坎,并不是真正安全的。
//在 實(shí)現(xiàn)類 更改數(shù)據(jù)字段的時(shí)候茬斧,可能沒有內(nèi)存屏障的腰懂。
const class_ro_t *safe_ro() {
class_rw_t *maybe_rw = data();
if (maybe_rw->flags & RW_REALIZED) {
// maybe_rw is rw
return maybe_rw->ro();
} else {
// maybe_rw is actually ro
return (class_ro_t *)maybe_rw;
}
}
}
上面代碼提到了內(nèi)存屏障,那么什么是內(nèi)存屏障项秉,這個(gè)概念涉及到代碼的亂序執(zhí)行绣溜,擴(kuò)展里面單獨(dú)說。這個(gè)注釋的意思是說娄蔼,imageLoader的時(shí)候怖喻,還在實(shí)現(xiàn)這個(gè)類的過程中,不要讀取ro數(shù)據(jù)岁诉,因?yàn)檫€沒有構(gòu)建完成锚沸。
ro rw rwe 是相互依存的表述類結(jié)構(gòu)的結(jié)構(gòu),ro 是在內(nèi)存中直接讀取出來的唉侄,只讀readonly的咒吐,其中包括了我們熟悉的ivar,所以說ivar是不可以動(dòng)態(tài)添加的属划,就是這個(gè)原因。
3.1 類數(shù)據(jù)演變出:class_ro_t
class_ro_t
struct class_ro_t {
uint32_t flags;
uint32_t instanceStart;
uint32_t instanceSize;
#ifdef __LP64__
uint32_t reserved;
#endif
const uint8_t * ivarLayout;
const char * name;
method_list_t * baseMethodList;
protocol_list_t * baseProtocols;
const ivar_list_t * ivars;
const uint8_t * weakIvarLayout;
property_list_t *baseProperties;
// This field exists only when RO_HAS_SWIFT_INITIALIZER is set.
_objc_swiftMetadataInitializer __ptrauth_objc_method_list_imp _swiftMetadataInitializer_NEVER_USE[0];
_objc_swiftMetadataInitializer swiftMetadataInitializer() const {
if (flags & RO_HAS_SWIFT_INITIALIZER) {
return _swiftMetadataInitializer_NEVER_USE[0];
} else {
return nil;
}
}
method_list_t *baseMethods() const {
return baseMethodList;
}
class_ro_t *duplicate() const {
if (flags & RO_HAS_SWIFT_INITIALIZER) {
size_t size = sizeof(*this) + sizeof(_swiftMetadataInitializer_NEVER_USE[0]);
class_ro_t *ro = (class_ro_t *)memdup(this, size);
ro->_swiftMetadataInitializer_NEVER_USE[0] = this->_swiftMetadataInitializer_NEVER_USE[0];
return ro;
} else {
size_t size = sizeof(*this);
class_ro_t *ro = (class_ro_t *)memdup(this, size);
return ro;
}
}
};
其中包含 const ivar_list_t * ivars
用來表示 ivar_list_t
和 ivar_t
候生。
3.1.1ivar_list_t
和 ivar_t
ivar_list_t
通過 entsize_list_tt
存儲(chǔ)了 ivar_t
同眯。
entsize_list_tt
是提供遍歷器的通用容器,詳細(xì)見我博客的另一篇文章唯鸭,Apple源碼用到的一些數(shù)據(jù)結(jié)構(gòu)须蜗。
ivar_list_t
struct ivar_list_t : entsize_list_tt<ivar_t, ivar_list_t, 0> {
bool containsIvar(Ivar ivar) const {
return (ivar >= (Ivar)&*begin() && ivar < (Ivar)&*end());
}
};
ivar_t
struct ivar_t {
#if __x86_64__
// *offset was originally 64-bit on some x86_64 platforms.
// We read and write only 32 bits of it.
// Some metadata provides all 64 bits. This is harmless for unsigned
// little-endian values.
// Some code uses all 64 bits. class_addIvar() over-allocates the
// offset for their benefit.
#endif
int32_t *offset;
const char *name;
const char *type;
// alignment is sometimes -1; use alignment() instead
uint32_t alignment_raw;
uint32_t size;
uint32_t alignment() const {
if (alignment_raw == ~(uint32_t)0) return 1U << WORD_SHIFT;
return 1 << alignment_raw;
}
};
3.2 類數(shù)據(jù)演變出:class_rw_t
rw 是可讀可寫的意思,runtime 動(dòng)態(tài)增加方法等就是通過對(duì) rw 進(jìn)行修改寫的操作完成的目溉。
這里先看他的結(jié)構(gòu)定義明肮,對(duì)全局有了解。這里后續(xù)章節(jié)「缭付。柿估。∠菝ǎ」詳細(xì)展開更細(xì)致的研究秫舌。
class_rw_t
struct class_rw_t {
uint32_t flags;
uint16_t witness;
#if SUPPORT_INDEXED_ISA
uint16_t index;
#endif
Class firstSubclass;
Class nextSiblingClass;
public:
class_rw_ext_t *deepCopy(const class_ro_t *ro);
const method_array_t methods();
const property_array_t properties();
const protocol_array_t protocols();
};
3.3 類數(shù)據(jù)演變出:class_rw_ext_t
三者的演變關(guān)系的妖,我粘貼一段類構(gòu)造過程的源碼:如下:
// at file `objc-runtime-new.mm` static void methodizeClass(Class cls, Class previously)
auto rw = cls->data();
auto ro = rw->ro();
auto rwe = rw->ext();
但是 ro 其實(shí)才是一直不變的,也叫 clean memory足陨,RW 是跟隨runtime去操作變化的嫂粟,叫做 Dirty Memory。
rwe 是什么其實(shí)很簡(jiǎn)單墨缘,2020年蘋果出了iOS14星虹,其SDK里面把rw中不常用的一部分砍了出去,變成了RWE镊讼,官方說宽涌,用 Mac 的 MailApp 做測(cè)試,Dirty Memory從80MB節(jié)約到了40MB狠毯。
class_rw_ext_t
struct class_rw_ext_t {
const class_ro_t *ro;
method_array_t methods;
property_array_t properties;
protocol_array_t protocols;
char *demangledName;
uint32_t version;
};
4. method_array_t护糖、 method_list_t、 method_t
接下來三部分是:
- 類的
rw
rwe
中的method_array_t
- 類的
rw
rwe
中的property_array_t
- 類的
rw
rwe
中的protocol_array_t
這三個(gè)的繼承數(shù)據(jù)結(jié)構(gòu)都是:list_array_tt
嚼松,詳情可見我博客的另一篇文章嫡良,Apple源碼用到的一些數(shù)據(jù)結(jié)構(gòu)。
通過 rw
rwe
中的 method_array_t 獲取 methods献酗,它的類型定義如下:
method_array_t
class method_array_t :
public list_array_tt<method_t, method_list_t>
{
typedef list_array_tt<method_t, method_list_t> Super;
public:
method_array_t() : Super() { }
method_array_t(method_list_t *l) : Super(l) { }
method_list_t * const *beginCategoryMethodLists() const {
return beginLists();
}
method_list_t * const *endCategoryMethodLists(Class cls) const;
method_array_t duplicate() {
return Super::duplicate<method_array_t>();
}
};
其中獲取到的一個(gè)或多個(gè) method_list_t
寝受,具體原理移步到上面文章中。
method_list_t
// entsize 中的2個(gè)字符位用來做 fixup 標(biāo)記罕偎。
struct method_list_t : entsize_list_tt<method_t, method_list_t, 0x3> {
bool isUniqued() const;
bool isFixedUp() const;
void setFixedUp();
uint32_t indexOfMethod(const method_t *meth) const {
uint32_t I =
(uint32_t)(((uintptr_t)meth - (uintptr_t)this) / entsize());
ASSERT(i < count);
return I;
}
};
通過遍歷器遍歷 method_t
method_t 就是表示一個(gè)方法或者函數(shù)(包含:函數(shù)名很澄、返回值、參數(shù)颜及、函數(shù)體)
method_t
struct method_t {
SEL name; // 方法名稱
const char *types; // 編碼(返回值類型甩苛、參數(shù)類型)
MethodListIMP imp; // 方法的地址/實(shí)現(xiàn)
struct SortBySELAddress :
public std::binary_function<const method_t&,
const method_t&, bool>
{
bool operator() (const method_t& lhs,
const method_t& rhs)
{ return lhs.name < rhs.name; }
};
};
SortBySELAddress()
方法是方便函數(shù)進(jìn)行排序,其實(shí)在 methodList中 函數(shù)是根據(jù)SEL name這個(gè)對(duì)象的內(nèi)存地址進(jìn)行排序的俏站,后續(xù)尋找方法的時(shí)候讯蒲,會(huì)用二分查找增加查找效率。
這里也是今年的一個(gè)變動(dòng)肄扎,獲取方法的 MethodListIMP 直接從sel里面內(nèi)存平移8個(gè)字節(jié)就可以得到墨林。
4.1 method_t 方法的數(shù)據(jù)結(jié)構(gòu)
SEL是一個(gè)指向objc_selector 結(jié)構(gòu)體的指針:
typedef struct objc_selector *SEL;
獲取一個(gè)SEL的方法
SEL sel1 = @selector(selector);
SEL sel2 = sel_registerName("selector");
SEL sel3 = NSSelectorFromString(@"selector");
// SEL 轉(zhuǎn)換成字符串
char *string1 = sel_getName(sel1);
NSString *string2 = NSStringFromSelector(sel1);
IMP 是指向方法實(shí)現(xiàn)提的函數(shù)指針,調(diào)用一個(gè)方法犯祠,本質(zhì)上就是一個(gè)方法尋址的過程旭等,通過SEL尋找IMP。
method_t衡载,就是在兩者之間做映射關(guān)系
#if !OBJC_OLD_DISPATCH_PROTOTYPES
typedef void (*IMP)(void /* id, SEL, ... */ );
#else
typedef id _Nullable (*IMP)(id _Nonnull, SEL _Nonnull, ...);
#endif
4.2 Type Encodings
Type Encodings
就是一個(gè)編碼搔耕,runtime 中對(duì)于 method_t 的返回值和參數(shù),使用了Type Encodings 字符串來進(jìn)行描述:
@encode()
指令可以將類型轉(zhuǎn)換為 Type Encodings
字符串編碼:
char *buf1 = @encode(int **);
char *buf2 = @encode(struct key);
char *buf3 = @encode(Rectangle);
OC 方法都有兩個(gè)隱式參數(shù)月劈,方法調(diào)用者 (id)self
和方法名 (SEL) _cmd
度迂,所以我們才能在方法中使用 self
和 _cmd
藤乙;
如 -(void)test
,它的編碼為 “v16@0:8”
惭墓,可以簡(jiǎn)寫為 “v@:”
v
:代表返回值類型為 void
16
:代表所有參數(shù)所占的總字節(jié)數(shù)
@
:代表參數(shù) 1 類型為 id
0
:代表參數(shù) 1 從第幾個(gè)字節(jié)開始存儲(chǔ)
:
:代表參數(shù) 2 類型為 SEL
8
:代表參數(shù) 2 從第幾個(gè)字節(jié)開始存儲(chǔ)
具體這里在官網(wǎng)上有詳細(xì)解釋坛梁,See Type Encodings in Objective-C Runtime Programming Guide。
5. property_array_t腊凶、 property_list_t划咐、 property_t
property_array_t
class property_array_t :
public list_array_tt<property_t, property_list_t>
{
typedef list_array_tt<property_t, property_list_t> Super;
public:
property_array_t() : Super() { }
property_array_t(property_list_t *l) : Super(l) { }
property_array_t duplicate() {
return Super::duplicate<property_array_t>();
}
};
property_list_t
struct property_list_t : entsize_list_tt<property_t, property_list_t, 0> {
};
property_t
struct property_t {
const char *name;
const char *attributes;
};
6. protocol_array_t、 protocol_list_t钧萍、 protocol_t
protocol_array_t
class protocol_array_t :
public list_array_tt<protocol_ref_t, protocol_list_t>
{
typedef list_array_tt<protocol_ref_t, protocol_list_t> Super;
public:
protocol_array_t() : Super() { }
protocol_array_t(protocol_list_t *l) : Super(l) { }
protocol_array_t duplicate() {
return Super::duplicate<protocol_array_t>();
}
};
protocol_list_t
struct protocol_list_t {
// count is pointer-sized by accident.
uintptr_t count;
protocol_ref_t list[0]; // variable-size
size_t byteSize() const {
return sizeof(*this) + count*sizeof(list[0]);
}
protocol_list_t *duplicate() const {
return (protocol_list_t *)memdup(this, this->byteSize());
}
typedef protocol_ref_t* iterator;
typedef const protocol_ref_t* const_iterator;
const_iterator begin() const {
return list;
}
iterator begin() {
return list;
}
const_iterator end() const {
return list + count;
}
iterator end() {
return list + count;
}
};
protocol_t
struct protocol_t : objc_object {
const char *mangledName;
struct protocol_list_t *protocols;
method_list_t *instanceMethods;
method_list_t *classMethods;
method_list_t *optionalInstanceMethods;
method_list_t *optionalClassMethods;
property_list_t *instanceProperties;
uint32_t size; // sizeof(protocol_t)
uint32_t flags;
// Fields below this point are not always present on disk.
const char **_extendedMethodTypes;
const char *_demangledName;
property_list_t *_classProperties;
const char *demangledName();
const char *nameForLogging() {
return demangledName();
}
bool isFixedUp() const;
void setFixedUp();
bool isCanonical() const;
void clearIsCanonical();
# define HAS_FIELD(f) (size >= offsetof(protocol_t, f) + sizeof(f))
bool hasExtendedMethodTypesField() const {
return HAS_FIELD(_extendedMethodTypes);
}
bool hasDemangledNameField() const {
return HAS_FIELD(_demangledName);
}
bool hasClassPropertiesField() const {
return HAS_FIELD(_classProperties);
}
# undef HAS_FIELD
const char **extendedMethodTypes() const {
return hasExtendedMethodTypesField() ? _extendedMethodTypes : nil;
}
property_list_t *classProperties() const {
return hasClassPropertiesField() ? _classProperties : nil;
}
};
6.isa 走位圖
這個(gè)圖解釋網(wǎng)上太多了褐缠,沒什么好說的,放這里风瘦,跳過不講了队魏。
拓展研究
內(nèi)存屏障 memory barrier
上面源碼中 class_ro_t *safe_ro()
的注釋里提到了一個(gè)的 compiler barrier
,編譯器屏障万搔,這個(gè)是為了解決代碼執(zhí)行問題的胡桨。
指令重排是指:導(dǎo)致的代碼亂序執(zhí)行。舉例來說:如果第一個(gè)語句涉及內(nèi)存讀取瞬雹,第二個(gè)語句只是簡(jiǎn)單的指令計(jì)算昧谊,那么CPU為了提高效率,完全可能在第一個(gè)語句的內(nèi)存讀取完成之前酗捌,先執(zhí)行完了第二個(gè)語句呢诬。
上下兩條指令沒有相關(guān)性,就可能發(fā)生胖缤。如果涉及一個(gè)值尚镰,就有可能發(fā)現(xiàn)。
另外一個(gè)概念叫做 as if serial
哪廓,重排序的原則是看上去像是順序執(zhí)行的钓猬,不影響單線程的最終一致性。
但是多線程是不保證一致性的撩独。所以重排序是CPU的公共特性。
然后就出現(xiàn)了账月,內(nèi)存屏障 memory barrier
屏障上下的指令不會(huì)發(fā)生重排序综膀,在匯編層面,通過 lock 匯編指令完成局齿,lock是鎖總線剧劝,CPU訪問內(nèi)存的總線,等指令訪問完了抓歼,其他CPU才能去訪問讥此。
lock 本身的前面的所有指令全部不能越過 lock 重排序拢锹。
拓展閱讀:Linux內(nèi)核同步機(jī)制之(三):memory barrier
GCD 里面的 barrier 柵欄函數(shù),等待所有位于柵欄函數(shù)之前的操作執(zhí)行完畢后執(zhí)行
萄喳,跟這個(gè)命名類似卒稳,有相同也有不同,相同就是都是為了保證因?yàn)槎嗑€程和并發(fā)導(dǎo)致的前后指令/任務(wù)的亂序他巨。
內(nèi)存屏障是指令級(jí)別的充坑,在CPU匯編指令級(jí)別上的。柵欄函數(shù)是GCD級(jí)別的染突,GCD又是iOS系統(tǒng)級(jí)別的機(jī)制捻爷。
References
- objc4_781 官方源碼
- 簡(jiǎn)圖記錄-android fence機(jī)制
- Fence和非原子操作的ordering
- C語言共用體(C語言u(píng)nion用法)詳解。
-
「注意這個(gè)已經(jīng)過時(shí)了份企,新版本不是這樣的」補(bǔ)充git上找到的一個(gè) o_t c_t ro rw 的連通圖也榄,缺點(diǎn)是沒有rwe,名字我自己瞎起的司志,我后面畫圖會(huì)參考這個(gè)甜紫。