一: 首先介紹一些樂觀鎖與悲觀鎖:
悲觀鎖:總是假設(shè)最壞的情況,每次去拿數(shù)據(jù)的時(shí)候都認(rèn)為別人會(huì)修改卢肃,所以每次在拿數(shù)據(jù)的時(shí)候都會(huì)上鎖糙臼,這樣別人想拿這個(gè)數(shù)據(jù)就會(huì)阻塞直到它拿到鎖。傳統(tǒng)的關(guān)系型數(shù)據(jù)庫里邊就用到了很多這種鎖機(jī)制禾怠,比如行鎖返奉,表鎖等,讀鎖吗氏,寫鎖等芽偏,都是在做操作之前先上鎖。再比如Java里面的同步原語synchronized關(guān)鍵字的實(shí)現(xiàn)也是悲觀鎖弦讽。
樂觀鎖:顧名思義污尉,就是很樂觀膀哲,每次去拿數(shù)據(jù)的時(shí)候都認(rèn)為別人不會(huì)修改,所以不會(huì)上鎖被碗,但是在更新的時(shí)候會(huì)判斷一下在此期間別人有沒有去更新這個(gè)數(shù)據(jù)某宪,可以使用版本號(hào)等機(jī)制。樂觀鎖適用于多讀的應(yīng)用類型锐朴,這樣可以提高吞吐量兴喂,像數(shù)據(jù)庫提供的類似于write_condition機(jī)制,其實(shí)都是提供的樂觀鎖焚志。在Java中java.util.concurrent.atomic包下面的原子變量類就是使用了樂觀鎖的一種實(shí)現(xiàn)方式CAS實(shí)現(xiàn)的衣迷。
二: 樂觀鎖的一種實(shí)現(xiàn)方式-CAS(Compare and Swap 比較并交換):
鎖存在的問題:
Java在JDK1.5之前都是靠 synchronized關(guān)鍵字保證同步的,這種通過使用一致的鎖定協(xié)議來協(xié)調(diào)對(duì)共享狀態(tài)的訪問酱酬,可以確保無論哪個(gè)線程持有共享變量的鎖壶谒,都采用獨(dú)占的方式來訪問這些變量。這就是一種獨(dú)占鎖膳沽,獨(dú)占鎖其實(shí)就是一種悲觀鎖汗菜,所以可以說 synchronized 是悲觀鎖。
悲觀鎖機(jī)制存在以下問題:
1. 在多線程競爭下贵少,加鎖呵俏、釋放鎖會(huì)導(dǎo)致比較多的上下文切換和調(diào)度延時(shí),引起性能問題滔灶。
2. 一個(gè)線程持有鎖會(huì)導(dǎo)致其它所有需要此鎖的線程掛起普碎。
3. 如果一個(gè)優(yōu)先級(jí)高的線程等待一個(gè)優(yōu)先級(jí)低的線程釋放鎖會(huì)導(dǎo)致優(yōu)先級(jí)倒置,引起性能風(fēng)險(xiǎn)录平。
對(duì)比于悲觀鎖的這些問題麻车,另一個(gè)更加有效的鎖就是樂觀鎖。其實(shí)樂觀鎖就是:每次不加鎖而是假設(shè)沒有并發(fā)沖突而去完成某項(xiàng)操作斗这,如果因?yàn)椴l(fā)沖突失敗就重試动猬,直到成功為止。
樂觀鎖:
樂觀鎖( Optimistic Locking )在上文已經(jīng)說過了表箭,其實(shí)就是一種思想赁咙。相對(duì)悲觀鎖而言,樂觀鎖假設(shè)認(rèn)為數(shù)據(jù)一般情況下不會(huì)產(chǎn)生并發(fā)沖突免钻,所以在數(shù)據(jù)進(jìn)行提交更新的時(shí)候彼水,才會(huì)正式對(duì)數(shù)據(jù)是否產(chǎn)生并發(fā)沖突進(jìn)行檢測(cè),如果發(fā)現(xiàn)并發(fā)沖突了极舔,則讓返回用戶錯(cuò)誤的信息凤覆,讓用戶決定如何去做。
上面提到的樂觀鎖的概念中其實(shí)已經(jīng)闡述了它的具體實(shí)現(xiàn)細(xì)節(jié):主要就是兩個(gè)步驟:沖突檢測(cè)和數(shù)據(jù)更新拆魏。其實(shí)現(xiàn)方式有一種比較典型的就是 Compare and Swap ( CAS )盯桦。
CAS:
CAS是樂觀鎖技術(shù)慈俯,當(dāng)多個(gè)線程嘗試使用CAS同時(shí)更新同一個(gè)變量時(shí),只有其中一個(gè)線程能更新變量的值拥峦,而其它線程都失敗贴膘,失敗的線程并不會(huì)被掛起,而是被告知這次競爭中失敗事镣,并可以再次嘗試步鉴。
CAS 操作中包含三個(gè)操作數(shù) —— 需要讀寫的內(nèi)存位置(V)、進(jìn)行比較的預(yù)期原值(A)和擬寫入的新值(B)璃哟。如果內(nèi)存位置V的值與預(yù)期原值A(chǔ)相匹配,那么處理器會(huì)自動(dòng)將該位置值更新為新值B喊递。否則處理器不做任何操作随闪。無論哪種情況,它都會(huì)在 CAS 指令之前返回該位置的值骚勘。(在 CAS 的一些特殊情況下將僅返回 CAS 是否成功铐伴,而不提取當(dāng)前值。)CAS 有效地說明了“ 我認(rèn)為位置 V 應(yīng)該包含值 A俏讹;如果包含該值当宴,則將 B 放到這個(gè)位置;否則泽疆,不要更改該位置户矢,只告訴我這個(gè)位置現(xiàn)在的值即可。 ”這其實(shí)和樂觀鎖的沖突檢查+數(shù)據(jù)更新的原理是一樣的殉疼。
這里再強(qiáng)調(diào)一下梯浪,樂觀鎖是一種思想。CAS是這種思想的一種實(shí)現(xiàn)方式瓢娜。
JAVA對(duì)CAS的支持:
在JDK1.5 中新增 java.util.concurrent (J.U.C)就是建立在CAS之上的挂洛。相對(duì)于對(duì)于 synchronized 這種阻塞算法,CAS是非阻塞算法的一種常見實(shí)現(xiàn)眠砾。所以J.U.C在性能上有了很大的提升虏劲。
以 java.util.concurrent 中的 AtomicInteger 為例,看一下在不使用鎖的情況下是如何保證線程安全的褒颈。主要理解 getAndIncrement 方法柒巫,該方法的作用相當(dāng)于 ++i 操作。
public class AtomicInteger extends Number implements java.io.Serializable {
private volatile int value;
public final int get() {
return value;
}
public final int getAndIncrement() {
for (;;) {
int current = get();
int next = current + 1;
if (compareAndSet(current, next))
return current;
}
}
public final boolean compareAndSet(int expect, int update) {
return unsafe.compareAndSwapInt(this, valueOffset, expect, update);
}
}
在沒有鎖的機(jī)制下,字段value要借助volatile原語哈肖,保證線程間的數(shù)據(jù)是可見性吻育。這樣在獲取變量的值的時(shí)候才能直接讀取。然后來看看 ++i 是怎么做到的淤井。
getAndIncrement 采用了CAS操作布疼,每次從內(nèi)存中讀取數(shù)據(jù)然后將此數(shù)據(jù)和 +1 后的結(jié)果進(jìn)行CAS操作摊趾,如果成功就返回結(jié)果,否則重試直到成功為止游两。
而 compareAndSet 利用JNI(Java Native Interface)來完成CPU指令的操作:
public final boolean compareAndSet(int expect, int update) {
return unsafe.compareAndSwapInt(this, valueOffset, expect, update);
}
其中unsafe.compareAndSwapInt(this, valueOffset, expect, update);類似如下邏輯:
1 if (this == expect) {
2 this = update
3 return true;
4 } else {
5 return false;
6 }
那么比較this == expect砾层,替換this = update,compareAndSwapInt實(shí)現(xiàn)這兩個(gè)步驟的原子性呢贱案? 參考CAS的原理
CAS原理:
CAS通過調(diào)用JNI的代碼實(shí)現(xiàn)的肛炮。而compareAndSwapInt就是借助C來調(diào)用CPU底層指令實(shí)現(xiàn)的。
下面從分析比較常用的CPU(intel x86)來解釋CAS的實(shí)現(xiàn)原理宝踪。
下面是sun.misc.Unsafe類的compareAndSwapInt()方法的源代碼:
public final native boolean compareAndSwapInt(Object o, long offset,
2 int expected,
3 int x);
可以看到這是個(gè)本地方法調(diào)用侨糟。這個(gè)本地方法在JDK中依次調(diào)用的C++代碼為:
#define LOCK_IF_MP(mp) __asm cmp mp, 0 \
__asm je L0 \
__asm _emit 0xF0 \
__asm L0:
inline jint Atomic::cmpxchg (jint exchange_value, volatile jint* dest, jint compare_value) {
// alternative for InterlockedCompareExchange
int mp = os::is_MP();
__asm {
mov edx, dest
mov ecx, exchange_value
mov eax, compare_value
LOCK_IF_MP(mp)
cmpxchg dword ptr [edx], ecx
}
}
如上面源代碼所示,程序會(huì)根據(jù)當(dāng)前處理器的類型來決定是否為cmpxchg指令添加lock前綴瘩燥。如果程序是在多處理器上運(yùn)行秕重,就為cmpxchg指令加上lock前綴(lock cmpxchg)。反之厉膀,如果程序是在單處理器上運(yùn)行溶耘,就省略lock前綴(單處理器自身會(huì)維護(hù)單處理器內(nèi)的順序一致性,不需要lock前綴提供的內(nèi)存屏障效果)服鹅。
CAS缺點(diǎn):
1. ABA問題:
比如說一個(gè)線程one從內(nèi)存位置V中取出A凳兵,這時(shí)候另一個(gè)線程two也從內(nèi)存中取出A,并且two進(jìn)行了一些操作變成了B企软,然后two又將V位置的數(shù)據(jù)變成A庐扫,這時(shí)候線程one進(jìn)行CAS操作發(fā)現(xiàn)內(nèi)存中仍然是A,然后one操作成功澜倦。盡管線程one的CAS操作成功聚蝶,但可能存在潛藏的問題。如下所示:
現(xiàn)有一個(gè)用單向鏈表實(shí)現(xiàn)的堆棧藻治,棧頂為A碘勉,這時(shí)線程T1已經(jīng)知道A.next為B,然后希望用CAS將棧頂替換為B:
head.compareAndSet(A,B);
在T1執(zhí)行上面這條指令之前桩卵,線程T2介入验靡,將A、B出棧雏节,再pushD胜嗓、C、A钩乍,此時(shí)堆棧結(jié)構(gòu)如下圖辞州,而對(duì)象B此時(shí)處于游離狀態(tài):
此時(shí)輪到線程T1執(zhí)行CAS操作,檢測(cè)發(fā)現(xiàn)棧頂仍為A寥粹,所以CAS成功变过,棧頂變?yōu)锽埃元,但實(shí)際上B.next為null,所以此時(shí)的情況變?yōu)椋?/p>
其中堆棧中只有B一個(gè)元素媚狰,C和D組成的鏈表不再存在于堆棧中岛杀,平白無故就把C、D丟掉了崭孤。
從Java1.5開始JDK的atomic包里提供了一個(gè)類AtomicStampedReference來解決ABA問題类嗤。這個(gè)類的compareAndSet方法作用是首先檢查當(dāng)前引用是否等于預(yù)期引用,并且當(dāng)前標(biāo)志是否等于預(yù)期標(biāo)志辨宠,如果全部相等遗锣,則以原子方式將該引用和該標(biāo)志的值設(shè)置為給定的更新值。
public boolean compareAndSet(
V expectedReference,//預(yù)期引用
V newReference,//更新后的引用
int expectedStamp, //預(yù)期標(biāo)志
int newStamp //更新后的標(biāo)志
)
實(shí)際應(yīng)用代碼:
1 private static AtomicStampedReference<Integer> atomicStampedRef = new AtomicStampedReference<Integer>(100, 0);
2
3 ........
4
5 atomicStampedRef.compareAndSet(100, 101, stamp, stamp + 1);
- 循環(huán)時(shí)間長開銷大:
自旋CAS(不成功彭羹,就一直循環(huán)執(zhí)行黄伊,直到成功)如果長時(shí)間不成功,會(huì)給CPU帶來非常大的執(zhí)行開銷派殷。如果JVM能支持處理器提供的pause指令那么效率會(huì)有一定的提升,pause指令有兩個(gè)作用墓阀,第一它可以延遲流水線執(zhí)行指令(de-pipeline),使CPU不會(huì)消耗過多的執(zhí)行資源毡惜,延遲的時(shí)間取決于具體實(shí)現(xiàn)的版本,在一些處理器上延遲時(shí)間是零斯撮。第二它可以避免在退出循環(huán)的時(shí)候因內(nèi)存順序沖突(memory order violation)而引起CPU流水線被清空(CPU pipeline flush)经伙,從而提高CPU的執(zhí)行效率。
3. 只能保證一個(gè)共享變量的原子操作:
當(dāng)對(duì)一個(gè)共享變量執(zhí)行操作時(shí)勿锅,我們可以使用循環(huán)CAS的方式來保證原子操作帕膜,但是對(duì)多個(gè)共享變量操作時(shí),循環(huán)CAS就無法保證操作的原子性溢十,這個(gè)時(shí)候就可以用鎖垮刹,或者有一個(gè)取巧的辦法,就是把多個(gè)共享變量合并成一個(gè)共享變量來操作张弛。比如有兩個(gè)共享變量i=2,j=a荒典,合并一下ij=2a,然后用CAS來操作ij吞鸭。從Java1.5開始JDK提供了AtomicReference類來保證引用對(duì)象之間的原子性寺董,你可以把多個(gè)變量放在一個(gè)對(duì)象里來進(jìn)行CAS操作。
CAS與Synchronized的使用情景:
1刻剥、對(duì)于資源競爭較少(線程沖突較輕)的情況遮咖,使用synchronized同步鎖進(jìn)行線程阻塞和喚醒切換以及用戶態(tài)內(nèi)核態(tài)間的切換操作額外浪費(fèi)消耗cpu資源;而CAS基于硬件實(shí)現(xiàn)造虏,不需要進(jìn)入內(nèi)核御吞,不需要切換線程麦箍,操作自旋幾率較少,因此可以獲得更高的性能魄藕。
2内列、對(duì)于資源競爭嚴(yán)重(線程沖突嚴(yán)重)的情況,CAS自旋的概率會(huì)比較大背率,從而浪費(fèi)更多的CPU資源话瞧,效率低于synchronized。
補(bǔ)充: synchronized在jdk1.6之后寝姿,已經(jīng)改進(jìn)優(yōu)化交排。synchronized的底層實(shí)現(xiàn)主要依靠Lock-Free的隊(duì)列,基本思路是自旋后阻塞饵筑,競爭切換后繼續(xù)競爭鎖埃篓,稍微犧牲了公平性,但獲得了高吞吐量根资。在線程沖突較少的情況下架专,可以獲得和CAS類似的性能;而線程沖突嚴(yán)重的情況下玄帕,性能遠(yuǎn)高于CAS部脚。
concurrent包的實(shí)現(xiàn):
由于java的CAS同時(shí)具有 volatile 讀和volatile寫的內(nèi)存語義,因此Java線程之間的通信現(xiàn)在有了下面四種方式:
1. A線程寫volatile變量裤纹,隨后B線程讀這個(gè)volatile變量委刘。
2. A線程寫volatile變量,隨后B線程用CAS更新這個(gè)volatile變量鹰椒。
3. A線程用CAS更新一個(gè)volatile變量锡移,隨后B線程用CAS更新這個(gè)volatile變量。
4. A線程用CAS更新一個(gè)volatile變量漆际,隨后B線程讀這個(gè)volatile變量淆珊。
Java的CAS會(huì)使用現(xiàn)代處理器上提供的高效機(jī)器級(jí)別原子指令,這些原子指令以原子方式對(duì)內(nèi)存執(zhí)行讀-改-寫操作灿椅,這是在多處理器中實(shí)現(xiàn)同步的關(guān)鍵(從本質(zhì)上來說套蒂,能夠支持原子性讀-改-寫指令的計(jì)算機(jī)器,是順序計(jì)算圖靈機(jī)的異步等價(jià)機(jī)器茫蛹,因此任何現(xiàn)代的多處理器都會(huì)去支持某種能對(duì)內(nèi)存執(zhí)行原子性讀-改-寫操作的原子指令)操刀。同時(shí),volatile變量的讀/寫和CAS可以實(shí)現(xiàn)線程之間的通信婴洼。把這些特性整合在一起骨坑,就形成了整個(gè)concurrent包得以實(shí)現(xiàn)的基石。如果我們仔細(xì)分析concurrent包的源代碼實(shí)現(xiàn),會(huì)發(fā)現(xiàn)一個(gè)通用化的實(shí)現(xiàn)模式:
1. 首先欢唾,聲明共享變量為volatile且警;
2. 然后,使用CAS的原子條件更新來實(shí)現(xiàn)線程之間的同步礁遣;
3. 同時(shí)斑芜,配合以volatile的讀/寫和CAS所具有的volatile讀和寫的內(nèi)存語義來實(shí)現(xiàn)線程之間的通信。
AQS祟霍,非阻塞數(shù)據(jù)結(jié)構(gòu)和原子變量類(java.util.concurrent.atomic包中的類)杏头,這些concurrent包中的基礎(chǔ)類都是使用這種模式來實(shí)現(xiàn)的,而concurrent包中的高層類又是依賴于這些基礎(chǔ)類來實(shí)現(xiàn)的沸呐。從整體來看醇王,concurrent包的實(shí)現(xiàn)示意圖如下:
JVM中的CAS(堆中對(duì)象的分配):
Java調(diào)用new object()會(huì)創(chuàng)建一個(gè)對(duì)象,這個(gè)對(duì)象會(huì)被分配到JVM的堆中崭添。那么這個(gè)對(duì)象到底是怎么在堆中保存的呢寓娩?
首先,new object()執(zhí)行的時(shí)候呼渣,這個(gè)對(duì)象需要多大的空間棘伴,其實(shí)是已經(jīng)確定的,因?yàn)閖ava中的各種數(shù)據(jù)類型屁置,占用多大的空間都是固定的(對(duì)其原理不清楚的請(qǐng)自行Google)排嫌。那么接下來的工作就是在堆中找出那么一塊空間用于存放這個(gè)對(duì)象。
在單線程的情況下缰犁,一般有兩種分配策略:
1. 指針碰撞:這種一般適用于內(nèi)存是絕對(duì)規(guī)整的(內(nèi)存是否規(guī)整取決于內(nèi)存回收策略),分配空間的工作只是將指針像空閑內(nèi)存一側(cè)移動(dòng)對(duì)象大小的距離即可怖糊。
2. 空閑列表:這種適用于內(nèi)存非規(guī)整的情況帅容,這種情況下JVM會(huì)維護(hù)一個(gè)內(nèi)存列表,記錄哪些內(nèi)存區(qū)域是空閑的伍伤,大小是多少并徘。給對(duì)象分配空間的時(shí)候去空閑列表里查詢到合適的區(qū)域然后進(jìn)行分配即可。
但是JVM不可能一直在單線程狀態(tài)下運(yùn)行扰魂,那樣效率太差了麦乞。由于再給一個(gè)對(duì)象分配內(nèi)存的時(shí)候不是原子性的操作,至少需要以下幾步:查找空閑列表劝评、分配內(nèi)存姐直、修改空閑列表等等,這是不安全的蒋畜。解決并發(fā)時(shí)的安全問題也有兩種策略:
1. CAS:實(shí)際上虛擬機(jī)采用CAS配合上失敗重試的方式保證更新操作的原子性声畏,原理和上面講的一樣。
2. TLAB:如果使用CAS其實(shí)對(duì)性能還是會(huì)有影響的,所以JVM又提出了一種更高級(jí)的優(yōu)化策略:每個(gè)線程在Java堆中預(yù)先分配一小塊內(nèi)存插龄,稱為本地線程分配緩沖區(qū)(TLAB)愿棋,線程內(nèi)部需要分配內(nèi)存時(shí)直接在TLAB上分配就行,避免了線程沖突均牢。只有當(dāng)緩沖區(qū)的內(nèi)存用光需要重新分配內(nèi)存的時(shí)候才會(huì)進(jìn)行CAS操作分配更大的內(nèi)存空間糠雨。
虛擬機(jī)是否使用TLAB,可以通過-XX:+/-UseTLAB參數(shù)來進(jìn)行配置(jdk5及以后的版本默認(rèn)是啟用TLAB的)徘跪。