復(fù)制粘貼文: 原文鏈接:http://www.cocoachina.com/articles/18211
iOS多線程安全的概念在很多地方都會(huì)遇到瓶蚂,為什么不安全宣吱,不安全又該怎么去定義,其實(shí)是個(gè)值得深究的話題征候。
共享狀態(tài)祟敛,多線程共同訪問某個(gè)對(duì)象的property兆解,在iOS編程里是很普遍的使用場(chǎng)景,我們就從Property的多線程安全說起锅睛。
Property
當(dāng)我們討論property多線程安全的時(shí)候,很多人都知道給property加上atomic attribute之后辣垒,可以一定程度的保障多線程安全,類似:
@property (atomic, strong) NSString* userName;
事情并沒有看上去這么簡(jiǎn)單勋桶,要分析property在多線程場(chǎng)景下的表現(xiàn)侥猬,需要先對(duì)property的類型做區(qū)分。
我們可以簡(jiǎn)單的將property分為值類型和對(duì)象類型陵究,值類型是指primitive type,包括int, long, bool等非對(duì)象類型仪召,另一種是對(duì)象類型,聲明為指針扔茅,可以指向某個(gè)符合類型定義的內(nèi)存區(qū)域秸苗。
上述代碼中userName明顯是個(gè)對(duì)象類型,當(dāng)我們?cè)L問userName的時(shí)候惊楼,訪問的有可能是userName本身,也有可能是userName所指向的內(nèi)存區(qū)域雅倒。
比如:
self.userName = @"peak";
是在對(duì)指針本身進(jìn)行賦值。而
[self.userName rangeOfString:@"peak"];
是在訪問指針指向的字符串所在的內(nèi)存區(qū)域蔑匣,這二者并不一樣。
所以我們可以大致上將property分為三類:
[圖片上傳失敗...(image-630b1a-1604474980222)]
分完類之后凿将,我們需要明白這三類property的內(nèi)存模型。
Memory Layout
當(dāng)我們討論多線程安全的時(shí)候丸相,其實(shí)是在討論多個(gè)線程同時(shí)訪問一個(gè)內(nèi)存區(qū)域的安全問題彼棍。針對(duì)同一塊區(qū)域膳算,我們有兩種操作,讀(load)和寫(store)华匾,讀和寫同時(shí)發(fā)生在同一塊區(qū)域的時(shí)候,就有可能出現(xiàn)多線程不安全蜘拉。所以展開討論之前有鹿,先要明白上述三種property的內(nèi)存模型,可用如下圖示:
[圖片上傳失敗...(image-a7a2aa-1604474980222)]
以64位系統(tǒng)為例葱跋,指針NSString*是8個(gè)字節(jié)的內(nèi)存區(qū)域,int count是個(gè)4字節(jié)的區(qū)域娱俺,而@“Peak”是一塊根據(jù)字符串長(zhǎng)度而定的內(nèi)存區(qū)域。
當(dāng)我們?cè)L問property的時(shí)候模庐,實(shí)際上是訪問上圖中三塊內(nèi)存區(qū)域油宜。
self.userName = @"peak";
是修改第一塊區(qū)域。
self.count = 10;
是在修改第二塊區(qū)域慎冤。
[self.userName rangeOfString:@"peak"];
是在讀取第三塊區(qū)域。
不安全的定義
明白了property的類型以及他們對(duì)應(yīng)的內(nèi)存模型粪薛,我們?cè)賮砜纯床话踩亩x。Wikipedia如是說:
A piece of code is thread-safe if it manipulates shared data structures only in a manner that guarantees safe execution by multiple threads at the same time
這段定義看起來還是有點(diǎn)抽象湃交,我們可以將多線程不安全解釋為:多線程訪問時(shí)出現(xiàn)意料之外的結(jié)果。這個(gè)意料之外的結(jié)果包含幾種場(chǎng)景搞莺,不一定是指crash,后面再一一分析迈喉。
先來看下多線程是如何同時(shí)訪問內(nèi)存的。不考慮CPU cache對(duì)變量的緩存挨摸,內(nèi)存訪問可以用下圖表示:
[圖片上傳失敗...(image-b2de2b-1604474980222)]
從上圖中可以看出岁歉,我們只有一個(gè)地址總線,一個(gè)內(nèi)存锅移。即使是在多線程的環(huán)境下,也不可能存在兩個(gè)線程同時(shí)訪問同一塊內(nèi)存區(qū)域的場(chǎng)景置逻,內(nèi)存的訪問一定是通過一個(gè)地址總線串行排隊(duì)訪問的,所以在繼續(xù)后續(xù)之前诽偷,我們先要明確幾個(gè)結(jié)論:
結(jié)論一:內(nèi)存的訪問時(shí)串行的疯坤,并不會(huì)導(dǎo)致內(nèi)存數(shù)據(jù)的錯(cuò)亂或者應(yīng)用的crash。
結(jié)論二:如果讀寫(load or store)的內(nèi)存長(zhǎng)度小于等于地址總線的長(zhǎng)度压怠,那么讀寫的操作是原子的,一次完成菌瘫。比如bool,int雇盖,long在64位系統(tǒng)下的單次讀寫都是原子操作。
接下來我們根據(jù)上面三種property的分類逐一看下多線程的不安全場(chǎng)景崔挖。
值類型Property
先以BOOL值類型為例,當(dāng)我們有兩個(gè)線程訪問如下property的時(shí)候:
@property (nonatomic, assgin) BOOL isDeleted;
//thread 1
bool isDeleted = self.isDeleted;
//thread 2
self.isDeleted = false;
線程1和線程2狸相,一個(gè)讀(load),一個(gè)寫(store)脓鹃,對(duì)于BOOL isDeleted的訪問可能有先后之分,但一定是串行排隊(duì)的瘸右。而且由于BOOL大小只有1個(gè)字節(jié),64位系統(tǒng)的地址總線對(duì)于讀寫指令可以支持8個(gè)字節(jié)的長(zhǎng)度苞俘,所以對(duì)于BOOL的讀和寫操作我們可以認(rèn)為是原子的,所以當(dāng)我們聲明BOOL類型的property的時(shí)候,從原子性的角度看襟诸,使用atomic和nonatomic并沒有實(shí)際上的區(qū)別(當(dāng)然如果重載了getter方法就另當(dāng)別論了)。
如果是int類型呢歌亲?
@property (nonatomic, assgin) int count;
//thread 1
int curCount = self.count;
//thread 2
self.count = 1;
同理int類型長(zhǎng)度為4字節(jié),讀和寫都可以通過一個(gè)指令完成惋鸥,所以理論上讀和寫操作都是原子的。從訪問內(nèi)存的角度看nonatomic和atomic也并沒有什么區(qū)別卦绣。
atomic到底有什么用呢飞蚓?據(jù)我所知,用處有二:
- 用處一: 生成原子操作的getter和setter趴拧。
設(shè)置atomic之后,默認(rèn)生成的getter和setter方法執(zhí)行是原子的著榴。也就是說,當(dāng)我們?cè)诰€程1執(zhí)行g(shù)etter方法的時(shí)候(創(chuàng)建調(diào)用棧暮胧,返回地址锐借,出棧)瞎饲,線程B如果想執(zhí)行setter方法,必須先等getter方法完成才能執(zhí)行嗅战。舉個(gè)例子俺亮,在32位系統(tǒng)里,如果通過getter返回64位的double脚曾,地址總線寬度為32位,從內(nèi)存當(dāng)中讀取double的時(shí)候無法通過原子操作完成本讥,如果不通過atomic加鎖,有可能會(huì)在讀取的中途在其他線程發(fā)生setter操作色查,從而出現(xiàn)異常值。如果出現(xiàn)這種異常值秧了,就發(fā)生了多線程不安全。
- 用處二:設(shè)置Memory Barrier
對(duì)于Objective C的實(shí)現(xiàn)來說验毡,幾乎所有的加鎖操作最后都會(huì)設(shè)置memory barrier帝嗡,atomic本質(zhì)上是對(duì)getter,setter加了鎖哟玷,所以也會(huì)設(shè)置memory barrier。官方文檔表述如下:
Note: Most types of locks also incorporate a memory barrier to ensure that any preceding load and store instructions are completed before entering the critical section.
memory barrier有什么用處呢碗降?
memory barrier能夠保證內(nèi)存操作的順序,按照我們代碼的書寫順序來动看。聽起來有點(diǎn)不可思議,事實(shí)是編譯器會(huì)對(duì)我們的代碼做優(yōu)化菱皆,在它認(rèn)為合理的場(chǎng)景改變我們代碼最終翻譯成的機(jī)器指令順序。也就是說如下代碼:
self.intA = 0; //line 1
self.intB = 1; //line 2
編譯器可能在一些場(chǎng)景下先執(zhí)行l(wèi)ine2仇轻,再執(zhí)行l(wèi)ine1,因?yàn)樗J(rèn)為A和B之間并不存在依賴關(guān)系篷店,雖然在代碼執(zhí)行的時(shí)候,在另一個(gè)線程intA和intB存在某種依賴疲陕,必須要求line1先于line2執(zhí)行。
如果設(shè)置property為atomic携茂,也就是設(shè)置了memory barrier之后,就能夠保證line1的執(zhí)行一定是先于line2的讳苦,當(dāng)然這種場(chǎng)景非常罕見,一則是出現(xiàn)變量跨線程訪問依賴鸳谜,二是遇上編譯器的優(yōu)化逮京,兩個(gè)條件缺一不可束莫。這種極端的場(chǎng)景下,atomic確實(shí)可以讓我們的代碼更加多線程安全一點(diǎn)览绿,但我寫iOS代碼至今,還未遇到過這種場(chǎng)景饿敲,較大的可能性是編譯器已經(jīng)足夠聰明,在我們需要的地方設(shè)置memory barrier了怀各。
是不是使用了atomic就一定多線程安全呢?我們可以看看如下代碼:
@property (atomic, assign) int intA;
//thread A
for (int i = 0; i < 10000; i ++) {
self.intA = self.intA + 1;
NSLog(@"Thread A: %d
", self.intA);
}
//thread B
for (int i = 0; i < 10000; i ++) {
self.intA = self.intA + 1;
NSLog(@"Thread B: %d
", self.intA);
}
即使我將intA聲明為atomic寿酌,最后的結(jié)果也不一定會(huì)是20000。原因就是因?yàn)閟elf.intA = self.intA + 1;不是原子操作醇疼,雖然intA的getter和setter是原子操作,但當(dāng)我們使用intA的時(shí)候秧荆,整個(gè)語句并不是原子的,這行賦值的代碼至少包含讀取(load)乙濒,+1(add),賦值(store)三步操作琉兜,當(dāng)前線程store的時(shí)候可能其他線程已經(jīng)執(zhí)行了若干次store了,導(dǎo)致最后的值小于預(yù)期值豌蟋。這種場(chǎng)景我們也可以稱之為多線程不安全。
指針Property
指針Property一般指向一個(gè)對(duì)象允睹,比如:
@property (atomic, strong) NSString* userName;
無論iOS系統(tǒng)是32位系統(tǒng)還是64位,一個(gè)指針的值都能通過一個(gè)指令完成load或者store缭受。但和primitive type不同的是该互,對(duì)象類型還有內(nèi)存管理的相關(guān)操作。在MRC時(shí)代宇智,系統(tǒng)默認(rèn)生成的setter類似如下:
- (void)setUserName:(NSString *)userName {
if(_uesrName != userName) {
[userName retain];
[_userName release];
_userName = userName;
}
}
不僅僅是賦值操作,還會(huì)有retain随橘,release調(diào)用。如果property為nonatomic机蔗,上述的setter方法就不是原子操作,我們可以假設(shè)一種場(chǎng)景梆掸,線程1先通過getter獲取當(dāng)前_userName,之后線程2通過setter調(diào)用[_userName release];酸钦,線程1所持有的_userName就變成無效的地址空間了,如果再給這個(gè)地址空間發(fā)消息就會(huì)導(dǎo)致crash钝鸽,出現(xiàn)多線程不安全的場(chǎng)景汇恤。
到了ARC時(shí)代因谎,Xcode已經(jīng)替我們處理了retain和release,絕大部分時(shí)候我們都不需要去關(guān)心內(nèi)存的管理财岔,但retain河爹,release其實(shí)還是存在于最后運(yùn)行的代碼當(dāng)中,atomic和nonatomic對(duì)于對(duì)象類的property聲明理論上還是存在差異咸这,不過我在實(shí)際使用當(dāng)中,將NSString*設(shè)置為nonatomic也從未遇到過上述多線程不安全的場(chǎng)景媳维,極有可能ARC在內(nèi)存管理上的優(yōu)化已經(jīng)將上述場(chǎng)景處理過了,所以我個(gè)人覺得指黎,如果只是對(duì)對(duì)象類property做read,write醋安,atomic和nonatomic在多線程安全上并沒有實(shí)際差別。
指針Property指向的內(nèi)存區(qū)域
這一類多線程的訪問場(chǎng)景是我們很容易出錯(cuò)的地方吓揪,即使我們聲明property為atomic蚁鳖,依然會(huì)出錯(cuò)赁炎。因?yàn)槲覀冊(cè)L問的不是property的指針區(qū)域,而是property所指向的內(nèi)存區(qū)域徙垫。可以看如下代碼:
@property (atomic, strong) NSString* stringA;
//thread A
for (int i = 0; i < 100000; i ++) {
if (i % 2 == 0) {
self.stringA = @"a very long string";
}
else {
self.stringA = @"string";
}
NSLog(@"Thread A: %@
", self.stringA);
}
//thread B
for (int i = 0; i < 100000; i ++) {
if (self.stringA.length >= 10) {
NSString* subStr = [self.stringA substringWithRange:NSMakeRange(0, 10)];
}
NSLog(@"Thread B: %@
", self.stringA);
}
雖然stringA是atomic的property姻报,而且在取substring的時(shí)候做了length判斷,線程B還是很容易crash吴旋,因?yàn)樵谇耙豢套xlength的時(shí)候self.stringA = @"a very long string";厢破,下一刻取substring的時(shí)候線程A已經(jīng)將self.stringA = @"string";治拿,立即出現(xiàn)out of bounds的Exception,crash见坑,多線程不安全。
同樣的場(chǎng)景還存在對(duì)集合類操作的時(shí)候荞驴,比如:
@property (atomic, strong) NSArray* arr;
//thread A
for (int i = 0; i < 100000; i ++) {
if (i % 2 == 0) {
self.arr = @[@"1", @"2", @"3"];
}
else {
self.arr = @[@"1"];
}
NSLog(@"Thread A: %@
", self.arr);
}
//thread B
for (int i = 0; i < 100000; i ++) {
if (self.arr.count >= 2) {
NSString* str = [self.arr objectAtIndex:1];
}
NSLog(@"Thread B: %@
", self.arr);
}
同理贯城,即使我們?cè)谠L問objectAtIndex之前做了count的判斷,線程B依舊很容易crash能犯,原因也是由于前后兩行代碼之間arr所指向的內(nèi)存區(qū)域被其他線程修改了。
所以你看悲雳,真正需要操心的是這一類內(nèi)存區(qū)域的訪問,即使聲明為atomic也沒有用坦胶,我們平常App出現(xiàn)莫名其妙難以重現(xiàn)的多線程crash多是屬于這一類,一旦在多線程的場(chǎng)景下訪問這類內(nèi)存區(qū)域的時(shí)候顿苇,要提起十二分的小心。如何避免這類crash后面會(huì)談到纪岁。
Property多線程安全小結(jié):
簡(jiǎn)而言之则果,atomic的作用只是給getter和setter加了個(gè)鎖,atomic只能保證代碼進(jìn)入getter或者setter函數(shù)內(nèi)部時(shí)是安全的西壮,一旦出了getter和setter,多線程安全只能靠程序員自己保障了款青。所以atomic屬性和使用property的多線程安全并沒什么直接的聯(lián)系。另外,atomic由于加鎖也會(huì)帶來一些性能損耗蔗坯,所以我們?cè)诰帉慽OS代碼的時(shí)候燎含,一般聲明property為nonatomic,在需要做多線程安全的場(chǎng)景瘫镇,自己去額外加鎖做同步。
如何做到多線程安全铣除?
討論到這里,其實(shí)怎么做到多線程安全也比較明朗了尚粘,關(guān)鍵字是atomicity(原子性),只要做到原子性秉继,小到一個(gè)primitive type變量的訪問,大到一長(zhǎng)段代碼邏輯的執(zhí)行尚辑,原子性能保證代碼串行的執(zhí)行,能保證代碼執(zhí)行到一半的時(shí)候杠茬,不會(huì)有另一個(gè)線程介入弛随。
原子性是個(gè)相對(duì)的概念,它所針對(duì)的對(duì)象舀透,粒度可大可小。
比如下段代碼:
if (self.stringA.length >= 10) {
NSString* subStr = [self.stringA substringWithRange:NSMakeRange(0, 10)];
}
是非原子性的愕够。
但加鎖以后:
//thread A
[_lock lock];
for (int i = 0; i < 100000; i ++) {
if (i % 2 == 0) {
self.stringA = @"a very long string";
}
else {
self.stringA = @"string";
}
NSLog(@"Thread A: %@
", self.stringA);
}
[_lock unlock];
//thread B
[_lock lock];
if (self.stringA.length >= 10) {
NSString* subStr = [self.stringA substringWithRange:NSMakeRange(0, 10)];
}
[_lock unlock];
整段代碼就具有原子性了,就可以認(rèn)為是多線程安全了厉斟。
再比如:
if (self.arr.count >= 2) {
NSString* str = [self.arr objectAtIndex:1];
}
是非原子性的挚躯。
而
//thread A
[_lock lock];
for (int i = 0; i < 100000; i ++) {
if (i % 2 == 0) {
self.arr = @[@"1", @"2", @"3"];
}
else {
self.arr = @[@"1"];
}
NSLog(@"Thread A: %@
", self.arr);
}
[_lock unlock];
//thread B
[_lock lock];
if (self.arr.count >= 2) {
NSString* str = [self.arr objectAtIndex:1];
}
[_lock unlock];
是具有原子性的。注意漩勤,讀和寫都需要加鎖感挥。
這也是為什么我們?cè)谧龆嗑€程安全的時(shí)候触幼,并不是通過給property加atomic關(guān)鍵字來保障安全,而是將property聲明為nonatomic(nonatomic沒有g(shù)etter置谦,setter的鎖開銷),然后自己加鎖媒峡。
如何使用哪種鎖?
iOS給代碼加鎖的方式有很多種谅阿,常用的有:
@synchronized(token)
NSLock
dispatch_semaphore_t
OSSpinLock
這幾種鎖都可以帶來原子性酬滤,性能的損耗從上至下依次更小。
我個(gè)人建議是盯串,在編寫應(yīng)用層代碼的時(shí)候,除了OSSpinLock之外体捏,哪個(gè)順手用哪個(gè)。相較于這幾個(gè)鎖的性能差異译打,代碼邏輯的正確性更為重要。而且這幾者之間的性能差異對(duì)用戶來說奏司,絕大部分時(shí)候都感知不到。
當(dāng)然我們也會(huì)遇到少數(shù)場(chǎng)景需要追求代碼的性能竿刁,比如編寫framework,或者在多線程讀寫共享數(shù)據(jù)頻繁的場(chǎng)景食拜,我們需要大致了解鎖帶來的損耗到底有多少。
官方文檔有個(gè)數(shù)據(jù)负甸,使用Intel-based iMac with a 2 GHz Core Duo processor and 1 GB of RAM running OS X v10.5測(cè)試,獲取mutex有大概0.2ms的損耗呻待,我們可以認(rèn)為鎖帶來的損耗大致在ms級(jí)別。
Atomic Operations
其實(shí)除了各種鎖之外奏篙,iOS上還有另一種辦法來獲取原子性,使用Atomic Operations秘通,相比鎖的損耗要小一個(gè)數(shù)量級(jí)左右,在一些追求高性能的第三方Framework代碼里可以看到這些Atomic Operations的使用充易。這些atomic operation可以在/usr/include/libkern/OSAtomic.h中查到:
[圖片上傳失敗...(image-4176fd-1604474980222)]
比如
_intA ++;
是非原子性的荸型。
而
OSAtomicIncrement32(&(_intA));
是原子性的,多線程安全的瑞妇。
Atomic Operation只能應(yīng)用于32位或者64位的數(shù)據(jù)類型,在多線程使用NSString或者NSArray這類對(duì)象的場(chǎng)景辕狰,還是得使用鎖。
大部分的Atomic Operation都有OSAtomicXXX蔓倍,OSAtomicXXXBarrier兩個(gè)版本,Barrier就是前面提到的memory barrier偶翅,在多線程多個(gè)變量之間存在依賴的時(shí)候使用Barrier的版本,能夠保證正確的依賴順序母剥。
對(duì)于平時(shí)編寫應(yīng)用層多線程安全代碼,我還是建議大家多使用@synchronized环疼,NSLock,或者dispatch_semaphore_t炫隶,多線程安全比多線程性能更重要,應(yīng)該在前者得到充分保證伪阶,猶有余力的時(shí)候再去追求后者煞檩。
盡量避免多線程的設(shè)計(jì)
無論我們寫過多少代碼望门,都必須要承認(rèn)多線程安全是個(gè)復(fù)雜的問題锰霜,作為程序員我們應(yīng)該盡可能的避免多線程的設(shè)計(jì),而不是去追求高明的使用鎖的技能癣缅。
后面我會(huì)寫一篇文章,介紹函數(shù)式編程及其核心思想友存,即使我們使用非函數(shù)式的編程語言,比如Objective C屡立,也能極大的幫助我們避免多線程安全的問題。
總結(jié)
iOS下多線程不安全的分析至此結(jié)束了膨俐,如何編寫多線程安全的代碼,說到底還是在于對(duì)memory layout和原子性的理解敛摘,也希望這篇文章將atomic和nonatomic的真正區(qū)別解釋清楚了:)。
歡迎關(guān)注公眾號(hào):MrPeakTech