Java代碼在編譯后會(huì)變成Java字節(jié)碼票从,字節(jié)碼被類加載器加載到JVM里吹零,JVM執(zhí)行字節(jié)碼罩抗,最終需要轉(zhuǎn)化為匯編指令在CPU上執(zhí)行,Java中所使用的并發(fā)機(jī)制依賴于JVM的實(shí)現(xiàn)和CPU的指令灿椅。
原子操作的實(shí)現(xiàn)原理
原子(atomic)本意是“不能被進(jìn)一步分割的最小粒子”套蒂,而原子操作(atomic operation)意為“不可被中斷的一個(gè)或一系列操作”。在多處理器上實(shí)現(xiàn)原子操作就變得有點(diǎn)復(fù)雜茫蛹。
1.術(shù)語定義
術(shù)語名稱 | 英文 | 解釋 |
---|---|---|
緩存行 | Cache line | 緩存的最小操作單位 |
比較并交換 | Compare and Swap | CAS操作需要輸入兩個(gè)數(shù)值操刀,一個(gè)舊制(期望操作前的值)和一個(gè)新值,在操作期間先比較舊值沒有發(fā)生變化麻惶,入宮沒有發(fā)生變化馍刮,才交換新值,發(fā)生了則不交換 |
CPU流水線 | CPU pipeline | CPU流水線的工作方式就像工業(yè)生產(chǎn)上的裝配流水線窃蹋,在CPU中由5~6個(gè)不同功能的電路單元組成一條指令處理流水線,然后將一條X86指令5 ~ 6步后再由這些電路單元分別執(zhí)行静稻,這樣就能實(shí)現(xiàn)在一個(gè)CPU時(shí)鐘周期完成一條指令警没,因此提高CPU的運(yùn)算速度 |
內(nèi)存順序沖突 | Memory order violation | 內(nèi)存順序沖突一般是由假共享引起的,假共享是指多個(gè)CPU同時(shí)修改同一個(gè)緩存行的不同部分而引起其中一個(gè)CPU的操作無效振湾,當(dāng)出現(xiàn)這個(gè)內(nèi)存順序沖突時(shí)杀迹,CPU必須清空流水線 |
2.處理器如何實(shí)現(xiàn)原子操作
32位IA-32處理器使用基于對(duì)緩存加鎖或總線加鎖的方式來實(shí)現(xiàn)多處理器之間的原子操作。首先處理器會(huì)自動(dòng)保證基本的內(nèi)存操作的原子性押搪。處理器保證從系統(tǒng)內(nèi)存中讀取或?qū)懭胍粋€(gè)字節(jié)是原子的树酪,意思是當(dāng)一個(gè)處理器讀取一個(gè)字節(jié)時(shí),其他處理器不能訪問這個(gè)字節(jié)的內(nèi)存地址大州。Pentium 6和最新的處理器能自動(dòng)保證單處理器對(duì)同一個(gè)緩存行里進(jìn)行16/32/64位的操作是原子的续语,但是復(fù)雜的內(nèi)存操作處理器是不能自動(dòng)保證其原子性的,比如跨總線寬度厦画、跨多個(gè)緩存行和跨頁表的訪問疮茄。但是滥朱,處理器提供總線鎖定和緩存鎖定兩個(gè)機(jī)制來保證復(fù)雜內(nèi)存操作的原子性。
(1)使用總線鎖保證原子性
第一個(gè)機(jī)制是通過總線鎖保證原子性力试。如果多個(gè)處理器同時(shí)對(duì)共享變量進(jìn)行讀改寫操作(i++就是經(jīng)典的讀改寫操作)徙邻,那么共享變量就會(huì)被多個(gè)處理器同時(shí)進(jìn)行操作,這樣讀改寫操作就不是原子的畸裳,操作完之后共享變量的值會(huì)和期望的不一致缰犁。舉個(gè)例子,如果i=1怖糊,我們進(jìn)行兩次i++操作民鼓,我們期望的結(jié)果是3,但是有可能結(jié)果是2蓬抄,如果所示:
原因可能是多個(gè)處理器同時(shí)從各自的緩存中讀取變量i丰嘉,分別進(jìn)行加1操作,然后分別寫入系統(tǒng)內(nèi)存中嚷缭。那么饮亏,想要保證讀寫改共享變量的操作是原子的,就必須保證CPU1讀改寫共享變量的時(shí)候阅爽,CPU2不能操作緩存了該共享變量?jī)?nèi)存地址的緩存路幸。
處理器使用總線鎖就是來解決這個(gè)問題的。所謂總線鎖就是使用處理器提供的一個(gè)LOCK#信號(hào)付翁,當(dāng)一個(gè)處理器在總線上輸出此信號(hào)時(shí)简肴,其他處理器的請(qǐng)求將被阻塞住,那么該處理器可以獨(dú)占共享內(nèi)存百侧。
(2)使用緩存鎖保證原子性
第二個(gè)機(jī)制是通過緩存鎖定來保證原子性砰识。在同一時(shí)刻,我們只需保證對(duì)某個(gè)內(nèi)存地址的操作是原子性即可佣渴,但總線鎖定把CPU和內(nèi)存之間的通信鎖住了辫狼,這使得鎖定期間,其他處理器不能操作其他內(nèi)存地址的數(shù)據(jù)辛润,所以總線鎖定的開銷比較大膨处,目前處理器在某些場(chǎng)合下使用緩存鎖定代替總線鎖定來進(jìn)行優(yōu)化。
但是有兩種情況下處理器不會(huì)使用緩存鎖定
第一種情況是:當(dāng)操作的數(shù)據(jù)不能被緩存在處理器內(nèi)部砂竖,或操作的數(shù)據(jù)跨多個(gè)緩存行(cache line)時(shí)真椿,則處理器會(huì)調(diào)用總線鎖定。
第二種情況是:有些處理器不支持緩存鎖定乎澄。對(duì)于Inter 486和Pentium處理器突硝,就算鎖定的內(nèi)存區(qū)域在處理器的緩存行中也會(huì)調(diào)用總線鎖定。
3.Java如何實(shí)現(xiàn)原子操作
在Java中可以通過鎖和循環(huán)CAS的方式來實(shí)現(xiàn)原子操作三圆。
(1)使用循環(huán)CAS實(shí)現(xiàn)原子操作
JVM中的CAS操作正是利用了處理器提供的MPXCHG指令實(shí)現(xiàn)的狞换。自旋CAS實(shí)現(xiàn)的基本思路就是循環(huán)進(jìn)行CAS操作直到成功為止避咆,以下代碼實(shí)現(xiàn)了一個(gè)基于CAS線程安全的計(jì)數(shù)器方法safeCount和一個(gè)非線程安全的計(jì)數(shù)器count。
private AtomicInteger atomicI = new AtomicInteger(0);
private int i = 0;
public static void main(Stirng[] args){
final Counter cas = new Counter();
List<Thread> ts = new ArrayList<Thread>(600);
long start = System.currentTimeMillis();
for(int j = 0; j < 100; j++){
Thread t = new Thread(new Runnable(){
@Override
public void run(){
for(int i = 0; i < 1000; i++){
cas.count();
cas.safeCount();
}
}
});
ts.add(t);
}
for(Thread t : ts){
t.start();
}
//等待所有線程執(zhí)行完成
for(Thread t : ts){
try{
t.join();
}catch(InterruptedException e){
e.printStackTrace();
}
}
System.out.println(cas.i);
System.out.pritnln(cas.atomicI.get());
System.out.pritnln(System.currentTimeMillis() - start);
}
//使用CAS實(shí)現(xiàn)線程安全計(jì)數(shù)器
private void safeCount(){
for(;;){
int i = atomicI.get();
boolean suc = atomicI.compareAndSet(i, ++i);
if(suc){
break;
}
}
}
//非線程安全計(jì)數(shù)器
private void ocunt(){
i++;
}
}
(2)CAS實(shí)現(xiàn)原子操作的三大問題
在Java并發(fā)包中有一些并發(fā)框架也使用了自旋CAS的方式來實(shí)現(xiàn)原子操作修噪,比如LinkedTransferQueue類的Xfer方法查库。CAS雖然很高效地解決了原子操作,但是CAS仍然存在三大問題黄琼。
1)ABA問題樊销。因?yàn)镃AS需要在操作值地時(shí)候,檢查值有沒有發(fā)生變化脏款,如果沒有發(fā)生變化則更新围苫,但是如果一個(gè)值原來是A,變成了B撤师,又變成了A剂府,那么使用CAS進(jìn)行檢查時(shí)會(huì)發(fā)現(xiàn)它地值沒有發(fā)生變化,但是實(shí)際上卻變化了剃盾。ABA問題地解決思路就是使用版本號(hào)腺占。在變量前面追加上版本號(hào),每次變量更新地時(shí)候把版本號(hào)加1痒谴,那么A->B->A就會(huì)變成1A->2B->3A衰伯。從Java1.5開始,JDK地Atomic包里提供了一個(gè)類AtomicStampeReference來解決ABA問題积蔚。這個(gè)類地comareAndSet方法地作用是首先檢查當(dāng)前引用是否等于預(yù)期引用意鲸,并且檢查當(dāng)前標(biāo)志是否等于預(yù)期標(biāo)志,如果全部相等尽爆,則以源自方式將該引用和該標(biāo)志地值設(shè)置為給定的更新值怎顾。
2)循環(huán)時(shí)間長(zhǎng)開銷大。自旋CAS如果長(zhǎng)時(shí)間不成功教翩,會(huì)給CPU帶來非常大的執(zhí)行開銷杆勇。如果JVM能支持處理器提供的pause指令,那么效率會(huì)有一定的提示饱亿。
3)只能保證一個(gè)共享變量的原子操作。當(dāng)對(duì)一個(gè)共享變量執(zhí)行操作時(shí)闰靴,我們可以使用循環(huán)CAS的方式來保證原子操作彪笼,但是對(duì)多個(gè)共享變量操作時(shí),循環(huán)CAS就無法保證操作的原子性蚂且,這個(gè)時(shí)候就可以用鎖配猫。
(3)使用鎖機(jī)制實(shí)現(xiàn)原子操作
鎖機(jī)制保證了只有獲得鎖的線程才能夠操作鎖定的內(nèi)存區(qū)域。JVM內(nèi)部實(shí)現(xiàn)了很多種鎖機(jī)制杏死,有偏向鎖泵肄、輕量級(jí)鎖和互斥鎖捆交。除了偏向鎖,JVM實(shí)現(xiàn)鎖的方式都用了循環(huán)CAS腐巢,即當(dāng)一個(gè)線程想進(jìn)入同步塊的時(shí)候使用循環(huán)CAS的方式來獲取鎖品追,當(dāng)它退出同步塊的時(shí)候使用循環(huán)CAS釋放鎖。