計算機內存模型
計算機在執(zhí)行程序時综慎,每條指令都是在CPU中執(zhí)行的堰怨,而執(zhí)行指令過程中兔簇,勢必涉及到數(shù)據(jù)的讀取和寫入。由于程序運行過程中的臨時數(shù)據(jù)是存放在主存(物理內存)當中的锹淌,這時就存在一個問題匿值,由于CPU執(zhí)行速度很快,而從內存讀取數(shù)據(jù)和向內存寫入數(shù)據(jù)的過程跟CPU執(zhí)行指令的速度比起來要慢的多赂摆,因此如果任何時候對數(shù)據(jù)的操作都要通過和內存的交互來進行挟憔,會大大降低指令執(zhí)行的速度钟些。因此在CPU里面就有了高速緩存。當程序在運行過程中绊谭,會將運算需要的數(shù)據(jù)從主存復制一份到CPU的高速緩存當中厘唾,那么CPU進行計算時就可以直接從它的高速緩存讀取數(shù)據(jù)和向其中寫入數(shù)據(jù),當運算結束之后龙誊,再將高速緩存中的數(shù)據(jù)刷新到主存當中抚垃。舉個簡單的例子,比如下面的這段代碼:
i = i + 1;
當線程執(zhí)行這個語句時趟大,會先從主存當中讀取
i
的值鹤树,然后復制一份到高速緩存當中,然后 CPU 執(zhí)行指令對i
進行加1操作逊朽,然后將數(shù)據(jù)寫入高速緩存罕伯,最后將高速緩存中i
最新的值刷新到主存當中。
這個代碼在單線程中運行是沒有任何問題的叽讳,但是在多線程中運行就會有問題了追他。在多核 CPU 中,每條線程可能運行于不同的 CPU 中岛蚤,因此 每個線程運行時有自己的高速緩存(對單核CPU來說邑狸,其實也會出現(xiàn)這種問題,只不過是以線程調度的形式來分別執(zhí)行的)涤妒。比如同時有兩個線程執(zhí)行這段代碼单雾,假如初始時i
的值為0
,那么我們希望兩個線程執(zhí)行完之后i的值變?yōu)?她紫。但是事實會是這樣嗎硅堆?
可能出現(xiàn)這種情況:初始時,兩個線程分別讀取i
的值存入各自所在的 CPU 的高速緩存當中贿讹,然后 線程1 進行加1操作渐逃,然后把i
的最新值1寫入到內存。此時線程2的高速緩存當中i
的值還是0民褂,進行加1操作之后茄菊,i
的值為1,然后線程2把i的值寫入內存助赞。最終結果i
的值是1买羞,而不是2袁勺。這就是著名的緩存一致性問題雹食。通常稱這種被多個線程訪問的變量為共享變量鸵钝。
為了解決緩存不一致性問題茸习,通常來說有以下兩種解決方法:
- 通過在總線加
LOCK#
鎖的方式 - 通過 緩存一致性協(xié)議
這兩種方式都是硬件層面上提供的方式。
在早期的 CPU 當中储耐,是通過在總線上加LOCK#
鎖的形式來解決緩存不一致的問題。因為 CPU 和其他部件進行通信都是通過總線來進行的街立,如果對總線加LOCK#鎖的話舶衬,也就是說阻塞了其他 CPU 對其他部件訪問(如內存),從而使得只能有一個 CPU 能使用這個變量的內存赎离。比如上面例子中 如果一個線程在執(zhí)行 i = i +1
逛犹,如果在執(zhí)行這段代碼的過程中,在總線上發(fā)出了LCOK#
鎖的信號梁剔,那么只有等待這段代碼完全執(zhí)行完畢之后虽画,其他CPU才能從變量i所在的內存讀取變量,然后進行相應的操作荣病。這樣就解決了緩存不一致的問題码撰。但是上面的方式會有一個問題,由于在鎖住總線期間个盆,其他CPU無法訪問內存脖岛,導致效率低下。
所以就出現(xiàn)了緩存一致性協(xié)議颊亮。最出名的就是 Intel 的MESI協(xié)議
柴梆,MESI協(xié)議
保證了每個緩存中使用的共享變量的副本是一致的。它核心的思想是:當CPU寫數(shù)據(jù)時终惑,如果發(fā)現(xiàn)操作的變量是共享變量轩性,即在其他CPU中也存在該變量的副本,會發(fā)出信號通知其他CPU將該變量的緩存行置為無效狀態(tài)狠鸳,因此當其他CPU需要讀取這個變量時揣苏,發(fā)現(xiàn)自己緩存中緩存該變量的緩存行是無效的,那么它就會從內存重新讀取件舵。
java內存模型
在java虛擬機規(guī)范中試圖定義一種Java內存模型(Java Memory Model卸察,JMM
)來屏蔽各個硬件平臺和操作系統(tǒng)的內存訪問差異,以實現(xiàn)讓Java程序在各種平臺下都能達到一致的內存訪問效果铅祸。那么Java內存模型規(guī)定了程序中變量的訪問規(guī)則坑质,往大一點說是定義了程序執(zhí)行的次序。注意临梗,為了獲得較好的執(zhí)行性能涡扼,Java內存模型并沒有限制執(zhí)行引擎使用處理器的寄存器或者高速緩存來提升指令執(zhí)行速度,也沒有限制編譯器對指令進行重排序盟庞。也就是說吃沪,在java內存模型中,也會存在緩存一致性問題和指令重排序的問題什猖。
java內存模型規(guī)定所有的變量都是存在主存當中(類似于前面說的物理內存)票彪,每個線程都有自己的工作內存(類似于前面的高速緩存)红淡。線程對變量的所有操作都必須在工作內存中進行,而不能直接對主存進行操作降铸。并且每個線程不能訪問其他線程的工作內存在旱。
在java中,執(zhí)行下面這個語句:
i = 10;
執(zhí)行線程必須先在自己的工作線程中對變量i
所在的緩存行進行賦值操作推掸,然后再寫入主存當中桶蝎。而不是直接將數(shù)值10
寫入主存當中。那么java語言本身對 原子性谅畅、可見性以及有序性提供了哪些保證呢俊嗽?
原子性
即一個操作或者多個操作 要么全部執(zhí)行并且執(zhí)行的過程不會被任何因素打斷,要么就都不執(zhí)行铃彰。
在java中绍豁,對基本數(shù)據(jù)類型的變量的讀取和賦值操作是原子性操作,即這些操作是不可被中斷的牙捉,要么執(zhí)行竹揍,要么不執(zhí)行。上面一句話雖然看起來簡單邪铲,但是理解起來并不是那么容易芬位。看下面一個例子i
:請分析以下哪些操作是原子性操作:
x = 10; //語句1
y = x; //語句2
x++; //語句3
x = x + 1; //語句4
咋一看带到,有些朋友可能會說上面的4個語句中的操作都是原子性操作昧碉。其實只有語句1
是原子性操作,其他三個語句都不是原子性操作揽惹。
-
語句1
是直接將數(shù)值10
賦值給x
被饿,也就是說線程執(zhí)行這個語句的會直接將數(shù)值10
寫入到工作內存中。 -
語句2
實際上包含2個操作搪搏,它先要去讀取x
的值狭握,再將x
的值寫入工作內存,雖然讀取x的值以及 將x的值寫入工作內存 這2個操作都是原子性操作疯溺,但是合起來就不是原子性操作了论颅。 - 同樣的,
x++
和x = x+1
包括3個操作:讀取x
的值囱嫩,進行加1
操作恃疯,寫入新的值。
也就是說墨闲,只有簡單的讀取今妄、賦值(而且必須是將數(shù)字賦值給某個變量,變量之間的相互賦值不是原子操作)才是原子操作。不過這里有一點需要注意:在32位平臺下蛙奖,對64位數(shù)據(jù)的讀取和賦值是需要通過兩個操作來完成的潘酗,不能保證其原子性杆兵。但是好像在最新的JDK中雁仲,JVM已經保證對64位數(shù)據(jù)的讀取和賦值也是原子性操作了。
從上面可以看出琐脏,Java內存模型只保證了基本讀取和賦值是原子性操作攒砖,如果要實現(xiàn)更大范圍操作的原子性,可以通過synchronize
d和Lock
來實現(xiàn)日裙。由于synchronized
和Lock
能夠保證任一時刻只有一個線程執(zhí)行該代碼塊吹艇,那么自然就不存在原子性問題了,從而保證了原子性昂拂。
可見性
可見性是指當多個線程訪問同一個變量時受神,一個線程修改了這個變量的值,其他線程能夠立即看得到修改的值格侯。
對于可見性鼻听,java提供了volatile
關鍵字來保證可見性。當一個共享變量被volatile
修飾時联四,它會保證修改的值會立即被更新到主存撑碴,當有其他線程需要讀取時,它會去內存中讀取新值朝墩。而普通的共享變量不能保證可見性醉拓,因為普通共享變量被修改之后,什么時候被寫入主存是不確定的收苏,當其他線程去讀取時亿卤,此時內存中可能還是原來的舊值,因此無法保證可見性鹿霸。
另外怠噪,通過synchronized
和Lock
也能夠保證可見性,synchronized
和Lock
能保證同一時刻只有一個線程獲取鎖然后執(zhí)行同步代碼杜跷,并且在釋放鎖之前會將對變量的修改刷新到主存當中傍念。因此可以保證可見性。
有序性
即程序執(zhí)行的順序按照代碼的先后順序執(zhí)行葛闷。
指令重排序憋槐,一般來說,處理器為了提高程序運行效率淑趾,可能會對輸入代碼進行優(yōu)化阳仔,它不保證程序中各個語句的執(zhí)行先后順序同代碼中的順序一致,但是它會保證程序最終執(zhí)行結果和代碼順序執(zhí)行的結果是一致的。
處理器在進行重排序時是會考慮指令之間的數(shù)據(jù)依賴性近范,如果一個指令Instruction 2必須用到Instruction 1的結果嘶摊,那么處理器會保證Instruction 1會在Instruction 2之前執(zhí)行。
在java內存模型中评矩,允許編譯器和處理器對指令進行重排序叶堆,但是重排序過程不會影響到單線程程序的執(zhí)行,卻會影響到多線程并發(fā)執(zhí)行的正確性斥杜。
在java里面虱颗,可以通過volatile
關鍵字來保證一定的“有序性”(具體原理在下一節(jié)講述)。另外可以通過synchronized
和lock
來保證有序性蔗喂,很顯然忘渔,synchronized
和Lock
保證每個時刻是有一個線程執(zhí)行同步代碼,相當于是讓線程順序執(zhí)行同步代碼缰儿,自然就保證了有序性畦粮。
另外,Java內存模型具備一些先天的“有序性”乖阵,即不需要通過任何手段就能夠得到保證的有序性宣赔,這個通常也稱為 happens-before
原則。如果兩個操作的執(zhí)行次序無法從happens-before
原則推導出來义起,那么它們就不能保證它們的有序性拉背,虛擬機可以隨意地對它們進行重排序。
下面就來具體介紹下happens-before
原則(先行發(fā)生原則):
- 程序次序規(guī)則:一個線程內默终,按照代碼順序椅棺,書寫在前面的操作先行發(fā)生于書寫在后面的操作
- 鎖定規(guī)則:一個unLock操作先行發(fā)生于后面對同一個鎖額lock操作
- volatile變量規(guī)則:對一個變量的寫操作先行發(fā)生于后面對這個變量的讀操作
- 傳遞規(guī)則:如果操作A先行發(fā)生于操作B,而操作B又先行發(fā)生于操作C齐蔽,則可以得出操作A先行發(fā)生于操作C
- 線程啟動規(guī)則:Thread對象的start()方法先行發(fā)生于此線程的每個一個動作
- 線程中斷規(guī)則:對線程interrupt()方法的調用先行發(fā)生于被中斷線程的代碼檢測到中斷事件的發(fā)生
- 線程終結規(guī)則:線程中所有的操作都先行發(fā)生于線程的終止檢測两疚,我們可以通過Thread.join()方法結束、Thread.isAlive()的返回值手段檢測到線程已經終止執(zhí)行
- 對象終結規(guī)則:一個對象的初始化完成先行發(fā)生于他的finalize()方法的開始
對于程序次序規(guī)則來說含滴,我的理解就是一段程序代碼的執(zhí)行在單個線程中看起來是有序的诱渤。注意,雖然這條規(guī)則中提到“書寫在前面的操作先行發(fā)生于書寫在后面的操作”谈况,這個應該是程序看起來執(zhí)行的順序是按照代碼順序執(zhí)行的勺美,因為虛擬機可能會對程序代碼進行指令重排序。雖然進行重排序碑韵,但是最終執(zhí)行的結果是與程序順序執(zhí)行的結果一致的赡茸,它只會對不存在數(shù)據(jù)依賴性的指令進行重排序。因此祝闻,在單個線程中占卧,程序執(zhí)行看起來是有序執(zhí)行的,這一點要注意理解。事實上华蜒,這個規(guī)則是用來保證程序在單線程中執(zhí)行結果的正確性辙纬,但無法保證程序在多線程中執(zhí)行的正確性。
第二條規(guī)則也比較容易理解叭喜,也就是說無論在單線程中還是多線程中贺拣,同一個鎖如果出于被鎖定的狀態(tài),那么必須先對鎖進行了釋放操作域滥,后面才能繼續(xù)進行l(wèi)ock操作纵柿。
第三條規(guī)則是一條比較重要的規(guī)則蜈抓,也是后文將要重點講述的內容启绰。直觀地解釋就是,如果一個線程先去寫一個變量沟使,然后一個線程去進行讀取委可,那么寫入操作肯定會先行發(fā)生于讀操作。
第四條規(guī)則實際上就是體現(xiàn)happens-before
原則具備傳遞性腊嗡。
深入剖析volatile關鍵字
volatile的語義
一旦一個共享變量(類的成員變量着倾、類的靜態(tài)成員變量)被volatile
修飾之后,那么就具備了兩層語義:
- 保證了不同線程對這個變量進行操作時的可見性燕少,即一個線程修改了某個變量的值卡者,這新值對其他線程來說是立即可見的。
- 禁止進行指令重排序客们。
先看一段代碼崇决,假如線程1先執(zhí)行,線程2后執(zhí)行:
//線程1
boolean stop = false;
while(!stop){
doSomething();
}
//線程2
stop = true;
這段代碼是很典型的一段代碼底挫,很多人在中斷線程時可能都會采用這種標記辦法恒傻。但是事實上,這段代碼會完全運行正確么建邓?即一定會將線程中斷么盈厘?不一定,也許在大多數(shù)時候官边,這個代碼能夠把線程中斷沸手,但是也有可能會導致無法中斷線程(雖然這個可能性很小,但是只要一旦發(fā)生這種情況就會造成死循環(huán)了)注簿。
下面解釋一下這段代碼為何有可能導致無法中斷線程契吉。在前面已經解釋過,每個線程在運行過程中都有自己的工作內存滩援,那么線程1
在運行的時候栅隐,會將stop
變量的值拷貝一份放在自己的工作內存當中。
那么當線程2
更改了stop
變量的值之后,但是還沒來得及寫入主存當中租悄,線程2
轉去做其他事情了谨究,那么線程1
由于不知道線程2
對stop
變量的更改,因此還會一直循環(huán)下去泣棋。但是用volatile
修飾之后就變得不一樣了:
- 使用volatile
關鍵字會強制將修改的值立即寫入主存胶哲;
- 使用
volatile
關鍵字的話,當線程2
進行修改時潭辈,會導致線程1
的工作內存中緩存變量stop
的緩存行無效(反映到硬件層的話鸯屿,就是CPU的L1或者L2緩存中對應的緩存行無效); - 由于
線程1
的工作內存中緩存變量stop
的緩存行無效把敢,所以線程1
再次讀取變量stop
的值時會去主存讀取寄摆。 - 那么在
線程2
修改stop
值時(當然這里包括2個操作,修改線程2工作內存中的值修赞,然后將修改后的值寫入內存)婶恼,會使得線程1
的工作內存中緩存變量stop
的緩存行無效,然后線程1
讀取時柏副,發(fā)現(xiàn)自己的緩存行無效勾邦,它會等待緩存行對應的主存地址被更新之后,然后去對應的主存讀取最新的值割择。
那么線程1讀取到的就是最新的正確的值眷篇。
volatile與原子性
從上面知道volatile
關鍵字保證了操作的可見性,但是volatile
能保證對變量的操作是原子性嗎荔泳?
下面看一個例子:
public class Test {
public volatile int inc = 0;
public void increase() {
inc++;
}
public static void main(String[] args) {
final Test test = new Test();
for(int i=0;i<10;i++){
new Thread(){
public void run() {
for(int j=0;j<1000;j++)
test.increase();
};
}.start();
}
while(Thread.activeCount()>1) //保證前面的線程都執(zhí)行完
Thread.yield();
System.out.println(test.inc);
}
}
大家想一下這段程序的輸出結果是多少蕉饼?也許有些朋友認為是10000。但是事實上運行它會發(fā)現(xiàn)每次運行結果都不一致换可,都是一個小于10000的數(shù)字椎椰。可能有的朋友就會有疑問沾鳄,不對啊慨飘,上面是對變量inc
進行自增操作,由于volatile
保證了可見性译荞,那么在每個線程中對inc
自增完之后瓤的,在其他線程中都能看到修改后的值啊,所以有10個線程分別進行了1000次操作吞歼,那么最終inc
的值應該是1000*10=10000
圈膏。
這里面就有一個誤區(qū)了,volatile關鍵字能保證可見性沒有錯篙骡,但是上面的程序錯在沒能保證原子性稽坤≌傻椋可見性只能保證每次讀取的是最新的值,但是volatile沒辦法保證對變量的操作的原子性尿褪。
在前面已經提到過睦擂,自增操作是不具備原子性的,它包括讀取變量的原始值杖玲、進行加1操作顿仇、寫入工作內存。那么就是說自增操作的三個子操作可能會分割開執(zhí)行摆马,就有可能導致下面這種情況出現(xiàn):
假如某個時刻變量inc的值為10臼闻,
線程1對變量進行自增操作,線程1先讀取了變量inc的原始值囤采,然后線程1被阻塞了述呐;
然后線程2對變量進行自增操作,線程2也去讀取變量inc的原始值斑唬,由于線程1只是對變量inc進行讀取操作市埋,而沒有對變量進行修改操作黎泣,所以不會導致線程2的工作內存中緩存變量inc的緩存行無效恕刘,所以線程2會直接去主存讀取inc的值,發(fā)現(xiàn)inc的值時10抒倚,然后進行加1操作褐着,并把11寫入工作內存,最后寫入主存托呕。
然后線程1接著進行加1操作含蓉,由于已經讀取了inc的值,注意此時在線程1的工作內存中inc的值仍然為10项郊,所以線程1對inc進行加1操作后inc的值為11馅扣,然后將11寫入工作內存,最后寫入主存着降。
那么兩個線程分別進行了一次自增操作后差油,inc只增加了1。
解釋到這里任洞,可能有朋友會有疑問蓄喇,不對啊,前面不是保證一個變量在修改volatile變量時交掏,會讓緩存行無效嗎妆偏?然后其他線程去讀就會讀到新的值,對盅弛,這個沒錯钱骂。這個就是上面的happens-before
規(guī)則中的volatile
變量規(guī)則叔锐,但是要注意,線程1對變量進行讀取操作之后见秽,被阻塞了的話掌腰,并沒有對inc值進行修改。然后雖然volatile能保證線程2對變量inc的值讀取是從內存中讀取的张吉,但是線程1沒有進行修改齿梁,所以線程2根本就不會看到修改的值。
根源就在這里肮蛹,自增操作不是原子性操作勺择,而且volatile也無法保證對變量的任何操作都是原子性的。解決的方法也就是對提供原子性的自增操作即可伦忠。
在java 1.5
的java.util.concurrent.atomic
包下提供了一些原子操作類省核,即對基本數(shù)據(jù)類型的 自增(加1操作),自減(減1操作)昆码、以及加法操作(加一個數(shù))气忠,減法操作(減一個數(shù))進行了封裝,保證這些操作是原子性操作赋咽。atomic
是利用CAS來實現(xiàn)原子性操作的(Compare And Swap
)旧噪,CAS實際上是利用處理器提供的CMPXCHG指令實現(xiàn)的,而處理器執(zhí)行CMPXCHG指令是一個原子性操作脓匿。
volatile與有序性
在前面提到volatile
關鍵字能禁止指令重排序淘钟,所以volatile
能在一定程度上保證有序性。volatile
關鍵字禁止指令重排序有兩層意思:
- 當程序執(zhí)行到
volatile
變量的讀操作或者寫操作時陪毡,在其前面的操作的更改肯定全部已經進行米母,且結果已經對后面的操作可見,在其后面的操作肯定還沒有進行毡琉; -
在進行指令優(yōu)化時铁瞒,不能將在對
volatile
變量訪問的語句放在其后面執(zhí)行,也不能把volatile
變量后面的語句放到其前面執(zhí)行桅滋。
可能上面說的比較繞慧耍,舉個簡單的例子:
//x、y為非volatile變量
//flag為volatile變量
x = 2; //語句1
y = 0; //語句2
flag = true; //語句3
x = 4; //語句4
y = -1; //語句5
由于flag變量為volatile
變量虱歪,那么在進行指令重排序的過程的時候蜂绎,不會將語句3
放到語句1
、語句2
前面笋鄙,也不會講語句3
放到語句4
师枣、語句5
后面。但是要注意語句1
和語句2
的順序萧落、語句4
和語句5
的順序是不作任何保證的践美。
并且volatile
關鍵字能保證洗贰,執(zhí)行到語句3
時,語句1
和語句2
必定是執(zhí)行完畢了的陨倡,且語句1
和語句2
的執(zhí)行結果對語句3
敛滋、語句4
、語句5
是可見的兴革。
volatile的原理和實現(xiàn)機制
前面講述了源于volatile關鍵字的一些使用绎晃,下面我們來探討一下volatile到底如何保證可見性和禁止指令重排序的。下面這段話摘自《深入理解java虛擬機》:
觀察加入volatile關鍵字和沒有加入volatile關鍵字時所生成的匯編代碼發(fā)現(xiàn)杂曲,加入volatile關鍵字時庶艾,會多出一個lock前綴指令
lock前綴指令實際上相當于一個 內存屏障(也成內存柵欄),內存屏障會提供3個功能:
- 它 確保指令重排序時不會把其后面的指令排到內存屏障之前的位置擎勘,也不會把前面的指令排到內存屏障的后面咱揍;即在執(zhí)行到內存屏障這句指令時,在它前面的操作已經全部完成棚饵;
- 它會 強制將對緩存的修改操作立即寫入主存煤裙;
- 如果是寫操作,它會導致其他CPU中對應的緩存行無效噪漾。