1. 根節(jié)點(diǎn)枚舉
1.1 暫停用戶線程
迄今為止,所有收集器在根節(jié)點(diǎn)枚舉這一步驟都是必須暫停用戶線程的。即便是號(hào)稱停頓時(shí)間可控、或者(幾乎)不會(huì)發(fā)生停頓的 CMS乔妈、G1、ZGC 等收集器氓皱,枚舉根節(jié)點(diǎn)時(shí)也必須要停頓路召。
這也是導(dǎo)致垃圾收集過(guò)程必須停頓所有用戶線程的一個(gè)重要原因。
1.2 如何高效查找引用鏈
目前主流 JVM 使用的都是準(zhǔn)確式垃圾收集匀泊,因此虛擬機(jī)有辦法直接知道哪些地方存放著對(duì)象的引用优训。而 HotSpot 是使用一組稱為 OopMap 的數(shù)據(jù)結(jié)構(gòu)來(lái)實(shí)現(xiàn)的。
一旦類加載動(dòng)作完成各聘,HotSpot
就會(huì)把對(duì)象內(nèi)什么偏移量上是什么類型的數(shù)據(jù)計(jì)算出來(lái)(在即時(shí)編譯過(guò)程中揣非,也會(huì)在「特定的位置」記錄下棧和寄存器中哪些位置是引用),這樣收集器在掃描時(shí)就能直接得知這些信息躲因,不必挨個(gè)從方法區(qū)等
GC Roots 開(kāi)始查找了早敬。從而可以提高查找效率。
普通對(duì)象指針:Ordinary Object Pointer, OOP
2. 安全點(diǎn)
2.1 概述
前面「特定的位置」記錄了引用信息大脉,這些位置被稱為安全點(diǎn)(Safepoint)搞监。
用戶程序執(zhí)行時(shí),并非在代碼指令流的任意位置都能停下來(lái)開(kāi)始垃圾收集镰矿,而是強(qiáng)制要求必須執(zhí)行到安全點(diǎn)后才能暫停琐驴。
可以用高速公路上行駛的汽車做類比:高速公路上行駛的汽車(用戶線程)不是在任何地方都能停下來(lái)的,只有到了服務(wù)區(qū)(安全點(diǎn))才能停下秤标。
2.2 安全點(diǎn)選取
安全點(diǎn)的選取既不能太多绝淡,也不能太少:
若太少,收集器會(huì)等待過(guò)長(zhǎng)時(shí)間苍姜;
若太多牢酵,則會(huì)過(guò)分增加運(yùn)行時(shí)的內(nèi)存負(fù)荷。
安全點(diǎn)位置的選取標(biāo)準(zhǔn):是否具有讓程序長(zhǎng)時(shí)間執(zhí)行的特征衙猪。什么樣的程序會(huì)長(zhǎng)時(shí)間執(zhí)行呢馍乙?
最明顯的特征就是指令序列的復(fù)用布近,如方法調(diào)用、循環(huán)跳轉(zhuǎn)丝格、異常跳轉(zhuǎn)等撑瞧,只有具備這些功能的指令才會(huì)產(chǎn)生安全點(diǎn)。
2.3 如何讓線程跑到最近的安全點(diǎn)
垃圾收集發(fā)生時(shí)铁追,如何讓所有線程(不包括 JNI 調(diào)用的線程)都跑到最近的安全點(diǎn)季蚂、然后停頓下來(lái)呢?有如下兩種方案可以采用琅束。
2.3.1 搶先式中斷
思想:無(wú)需用戶線程代碼配合,垃圾收集時(shí)算谈,系統(tǒng)首先把所有用戶線程全部中斷涩禀;此時(shí)若有用戶線程不在安全點(diǎn),則恢復(fù)執(zhí)行然眼,直至它到達(dá)安全點(diǎn)再中斷艾船。
這種方案現(xiàn)在幾乎不用了。
2.3.2 主動(dòng)式中斷
思想:垃圾收集需要中斷線程時(shí)高每,不直接操作線程屿岂,只是設(shè)置一個(gè)標(biāo)志位,各個(gè)線程執(zhí)行過(guò)程中不停地主動(dòng)輪詢?cè)摌?biāo)志位鲸匿,若標(biāo)志位為真爷怀,則在自己最近的安全點(diǎn)主動(dòng)中斷掛起。
輪詢標(biāo)志的地方和安全點(diǎn)是重合的带欢。
如何高效輪詢呢运授?HotSpot 使用內(nèi)存保護(hù)陷阱的方式,通過(guò)一條匯編指令來(lái)完成安全點(diǎn)輪詢和觸發(fā)線程中斷乔煞。
2.4 優(yōu)缺點(diǎn)
安全點(diǎn)機(jī)制保證了程序執(zhí)行時(shí)吁朦,在不太長(zhǎng)的時(shí)間內(nèi)就會(huì)遇到可進(jìn)入垃圾收集過(guò)程的安全點(diǎn)。
但是渡贾,無(wú)法解決程序“不執(zhí)行”的情況(比如用戶線程處于 Sleep 或者 Blocked 狀態(tài))逗宜,由于此時(shí)線程無(wú)法響應(yīng)虛擬機(jī)的中斷請(qǐng)求,無(wú)法再走到安全點(diǎn)掛起自己空骚。
3. 安全區(qū)域
3.1 概述
為了解決安全點(diǎn)機(jī)制中程序“不執(zhí)行”的情況纺讲,從而引入了安全區(qū)域(Safe Region)。
安全區(qū)域是指能夠確保在某一段代碼片段中府怯,引用關(guān)系不會(huì)發(fā)生變化刻诊,因此在這個(gè)區(qū)域中任意地方開(kāi)始垃圾收集都是安全的∥可以理解擴(kuò)展拉伸的安全點(diǎn)则涯。
3.2 實(shí)現(xiàn)思路
當(dāng)用戶線程執(zhí)行到安全區(qū)域里的代碼時(shí)复局,會(huì)標(biāo)識(shí)自己已經(jīng)進(jìn)入了安全區(qū)域。
虛擬機(jī)發(fā)起垃圾收集時(shí)粟判,不必理會(huì)已聲明在安全區(qū)域的線程亿昏;而當(dāng)線程離開(kāi)安全區(qū)域時(shí),會(huì)檢查虛擬機(jī)是否已經(jīng)完成根節(jié)點(diǎn)枚舉(或者其他暫停用戶線程的階段):
若完成档礁,則繼續(xù)執(zhí)行角钩;
否則就必須等待,直至收到可以離開(kāi)安全區(qū)域的信號(hào)呻澜。
4. 記憶集與卡表
4.1 跨代引用問(wèn)題
分代收集理論中递礼,為了解決對(duì)象跨代引用所帶來(lái)的問(wèn)題,垃圾收集器在新生代建立了名為記憶集(Remembered Set)的數(shù)據(jù)結(jié)構(gòu)羹幸,以避免把整個(gè)老年代加入 GC Roots 的掃描范圍脊髓。
實(shí)際上,所有涉及部分區(qū)域收集(Partial GC)行為的垃圾收集器(例如 G1栅受、ZGC将硝、Shenandoah 等)都會(huì)面臨同樣的問(wèn)題。
4.2 記憶集
「記憶集」是一種抽象的數(shù)據(jù)結(jié)構(gòu)屏镊,用于記錄從「非收集區(qū)域」指向「收集區(qū)域」的指針集合依疼。
垃圾收集場(chǎng)景中,收集器只需通過(guò)記憶集判斷出某一塊非收集區(qū)域是否存在指向收集區(qū)域的指針即可而芥,無(wú)需了解跨代引用指針的全部細(xì)節(jié)律罢。
因此,在實(shí)現(xiàn)記憶集時(shí)蔚出,可以采用不同的記錄粒度弟翘,以節(jié)省記憶集的存儲(chǔ)和維護(hù)成本,幾種精度舉例如下:
字長(zhǎng)精度:每個(gè)記錄精確到一個(gè)機(jī)器字長(zhǎng)(處理器的尋址位數(shù)骄酗,如常見(jiàn)的 32 位或 64 位)稀余,該字包含跨代指針
對(duì)象精度:每個(gè)記錄精確到一個(gè)對(duì)象,該對(duì)象中有字段包含跨代指針
卡精度:每個(gè)記錄精確到一塊內(nèi)存區(qū)域趋翻,該區(qū)域中有對(duì)象包含跨代指針
4.3 卡表
4.3.1 記憶集&卡表
其中睛琳,上述第三種“卡精度”指的是用一種“卡表(Card Table)”的方式來(lái)實(shí)現(xiàn)記憶集,也是目前最常用的實(shí)現(xiàn)方式踏烙。
記憶集與卡表的關(guān)系:可類比 Java 語(yǔ)言中接口與實(shí)現(xiàn)類的關(guān)系(比如 Map 與 HashMap)师骗。
4.3.2 卡表&卡頁(yè)
卡表最簡(jiǎn)單的形式可以是一個(gè)字節(jié)數(shù)組,數(shù)組中的每個(gè)元素都對(duì)應(yīng)著其標(biāo)識(shí)的內(nèi)存區(qū)域中一塊特定大小的內(nèi)存塊讨惩,該內(nèi)存塊稱為“卡頁(yè)(Card Page)”辟癌,它們的關(guān)系如圖所示:
一個(gè)卡頁(yè)的內(nèi)存中通常包含不止一個(gè)對(duì)象,只要卡頁(yè)內(nèi)有一個(gè)(或更多)對(duì)象的字段存在跨代指針荐捻,就將對(duì)應(yīng)卡表的數(shù)組元素的值標(biāo)識(shí)為 1黍少,稱為該元素變臟(Dirty)寡夹,若無(wú)則標(biāo)識(shí)為 0.
4.4 卡表的維護(hù)
卡表什么時(shí)候變臟?誰(shuí)來(lái)把它變臟呢厂置?
何時(shí):當(dāng)有其他分代區(qū)域中的對(duì)象引用了本區(qū)域?qū)ο髸r(shí)菩掏,其對(duì)應(yīng)的卡表元素就應(yīng)該變臟。
如何變臟:HotSpot 虛擬機(jī)是通過(guò)寫(xiě)屏障實(shí)現(xiàn)的昵济。
下面介紹什么是寫(xiě)屏障智绸。
5. 寫(xiě)屏障
5.1 簡(jiǎn)述
寫(xiě)屏障(Write Barrier)可以看做在虛擬機(jī)層面對(duì)“引用類型字段賦值”動(dòng)作的 AOP 切面,賦值前的寫(xiě)屏障稱為“寫(xiě)前屏障(Pre-Write Barrier)”访忿,賦值后的寫(xiě)屏障稱為“寫(xiě)后屏障(Post-Write Barrier)”瞧栗。
應(yīng)用寫(xiě)屏障后,虛擬機(jī)會(huì)為所有賦值操作生成相應(yīng)的指令海铆,一旦收集器在寫(xiě)屏障中增加了更新卡表操作沼溜,無(wú)論更新的是不是老年代對(duì)新生代的引用,每次只要對(duì)引用進(jìn)行更新游添,就會(huì)產(chǎn)生額外的開(kāi)銷。
5.1 偽共享問(wèn)題
5.1.1 偽共享
除了寫(xiě)屏障的開(kāi)銷通熄,高并發(fā)場(chǎng)景下還存在“偽共享(False Sharing)”問(wèn)題:即唆涝,多線程修改互相獨(dú)立的變量時(shí),如果這些變量恰好共享一個(gè)緩存行唇辨,會(huì)彼此影響而導(dǎo)致性能降低廊酣。
該問(wèn)題是處理底層細(xì)節(jié)時(shí)經(jīng)常需要考慮的。
5.1.2 如何避免
如何避免“偽共享”問(wèn)題:不采用無(wú)條件寫(xiě)屏障赏枚,而是先檢查卡表標(biāo)記亡驰,僅當(dāng)該卡表元素未被標(biāo)記過(guò)時(shí)才將其標(biāo)記為變臟。
若以 SQL 的更新操作(UPDATE)進(jìn)行類比饿幅,則:
無(wú)條件寫(xiě)屏障:每次 UPDATE 不加判斷凡辱,直接更新;
開(kāi)啟判斷條件后:每次 UPDATE 前栗恩,先執(zhí)行 SELECT透乾,查詢結(jié)果滿足一定條件時(shí)再執(zhí)行 UPDATE。
若開(kāi)啟該判斷條件磕秤,能避免偽共享問(wèn)題乳乌;但同時(shí)也會(huì)增加一次額外判斷的開(kāi)銷。因此需要根據(jù)實(shí)際情況來(lái)權(quán)衡市咆。
JDK 7 之后汉操,HotSpot 虛擬機(jī)增加了如下參數(shù)來(lái)決定是否開(kāi)啟卡表更新的判斷條件:
# 是否開(kāi)啟卡表更新的判斷條件
-XX:+UseCondCardMark
6. 并發(fā)的可達(dá)性分析
6.1 并發(fā)標(biāo)記問(wèn)題
可達(dá)性分析算法理論上要求全過(guò)程都基于一個(gè)能保障一致性的快照中才能進(jìn)行分析,這意味著必須全程凍結(jié)用戶線程(Stop The World)蒙兰。
為什么必須在一個(gè)能保證一致性的快照上才能進(jìn)行對(duì)象圖的遍歷呢磷瘤?
如果用戶線程是凍結(jié)的芒篷,沒(méi)問(wèn)題。
若用戶線程沒(méi)凍結(jié)膀斋,也就是用戶線程與收集器并發(fā)工作呢梭伐?收集器在對(duì)象圖標(biāo)記,同時(shí)用戶線程在修改引用關(guān)系(修改對(duì)象圖的結(jié)構(gòu))仰担,這樣可能出現(xiàn)兩種后果:
把原本消亡的對(duì)象錯(cuò)誤標(biāo)記為存活糊识,這種情況雖不好(產(chǎn)生了浮動(dòng)垃圾),但還可以容忍摔蓝。
把原本存活的對(duì)象標(biāo)記為消亡赂苗,這就很嚴(yán)重了,程序肯定會(huì)因此報(bào)錯(cuò)贮尉。
下面用三色標(biāo)記(Tri-color Marking)演示這種情況是如何產(chǎn)生的拌滋。
6.2 垃圾收集器標(biāo)記過(guò)程
垃圾收集器從 GC Roots 開(kāi)始標(biāo)記的過(guò)程示意圖如下:
上圖三色含義:
白色:對(duì)象尚未被垃圾收集器訪問(wèn)過(guò)(若在分析結(jié)束后,對(duì)象仍為白色猜谚,則表示不可達(dá))
黑色:對(duì)象已被垃圾收集器訪問(wèn)過(guò)败砂,且該對(duì)象所有引用都已被掃描(安全存活的)
灰色:對(duì)象已被垃圾收集器訪問(wèn)過(guò),但未掃描完所有引用(即該對(duì)象正在被掃描魏铅,可理解為中間態(tài))
注意引用是有方向的昌犹。
但是,如果在標(biāo)記過(guò)程中览芳,用戶線程對(duì)引用關(guān)系做了修改斜姥,如下:
在上圖的(4)中:
原先對(duì)象 A 未引用 C,對(duì)象 B 引用了 C沧竟;
但標(biāo)記到 B 時(shí)铸敏,用戶線程斷開(kāi)了 B 到 C 的引用,而使 A 引用了 C悟泵;
則垃圾收集器標(biāo)記完成后杈笔,C 依然是白色(即會(huì)被回收掉);
對(duì)象 DEFG 同理魁袜。
這樣導(dǎo)致的后果就是:正在被對(duì)象 A 和 D 引用的對(duì)象 C 和 G桩撮,在垃圾收集器標(biāo)記的過(guò)程中,由于用戶線程的運(yùn)行峰弹,導(dǎo)致本應(yīng)存活的對(duì)象被垃圾收集器標(biāo)記為消亡店量、并回收了。程序會(huì)因此報(bào)錯(cuò)鞠呈,這是個(gè)嚴(yán)重的問(wèn)題融师。
6.3 如何解決對(duì)象消失
如何解決上述“對(duì)象消失”的問(wèn)題呢?理論證明蚁吝,當(dāng)且僅當(dāng)以下兩個(gè)條件同時(shí)滿足時(shí)旱爆,才會(huì)產(chǎn)生“對(duì)象消失”的問(wèn)題:
賦值器插入了一條或多條從黑色對(duì)象到白色對(duì)象的新引用舀射;
賦值器刪除了全部從灰色對(duì)象到該白色對(duì)象的直接或間接引用。
針對(duì)這兩個(gè)條件怀伦,在上圖中脆烟,以對(duì)象 A、B房待、C 為例解釋如下:
若只增加了 A 對(duì) C 的引用邢羔,則 C 在垃圾回收后依然是存活的,不會(huì)出錯(cuò)桑孩。
若只有 B 斷開(kāi)了對(duì) A 的引用拜鹤,則 C 在垃圾回收后是消亡的,但并沒(méi)有 A 對(duì) C 的引用流椒,因此也不會(huì)出錯(cuò)敏簿。
因此,要解決并發(fā)掃描時(shí)的對(duì)象消失問(wèn)題宣虾,只需破壞其中一個(gè)即可惯裕。由此產(chǎn)生了兩種解決方案:增量更新(Increment Update)和原始快照(Snapshot At The Begining, SATB)。
6.3.1 增量更新
思路:破壞第一個(gè)條件绣硝。
做法:黑色對(duì)象(A)插入新的指向白色對(duì)象(C)的引用關(guān)系(A→C)時(shí)轻猖,就將這個(gè)新插入的引用記錄下來(lái),待并發(fā)掃描結(jié)束之后域那,再以這些記錄過(guò)的引用關(guān)系中的黑色為根,重新掃描一次猜煮。
簡(jiǎn)化理解:黑色對(duì)象一旦新插入了指向白色對(duì)象的引用次员,它就變?yōu)榛疑ㄐ柚匦聮呙瑁┝恕?/p>
6.3.2 原始快照
思路:破壞第二個(gè)條件。
做法:當(dāng)灰色對(duì)象(B)要?jiǎng)h除指向白色對(duì)象(C)的引用關(guān)系(B→C)時(shí)王带,就將這個(gè)要?jiǎng)h除的引用記錄下來(lái)淑蔚,并發(fā)掃描結(jié)束后,再以這些記錄過(guò)的引用關(guān)系中的灰色對(duì)象為根愕撰,重新掃描一次刹衫。
簡(jiǎn)化理解:無(wú)論引用關(guān)系刪除與否,都會(huì)按照剛開(kāi)始掃描那一刻的對(duì)象圖快照來(lái)進(jìn)行搜索搞挣。
這兩種方案都有在用:在 HotSpot 虛擬機(jī)中带迟,CMS 是基于增量更新來(lái)做并發(fā)標(biāo)記的,G1囱桨、Shenandoah 則是用原始快照實(shí)現(xiàn)的仓犬。
6.3.3 舉例
以上圖為例:在并發(fā)掃描時(shí),增加了 A→C 引用舍肠,并且刪除了 B→C 引用搀继,若不采取任何措施窘面,則掃描結(jié)束后對(duì)象 C 會(huì)消失。
兩種解決方案的做法分別如下:
增量更新:將已標(biāo)記為黑色的對(duì)象 A 置為灰色叽躯,待并發(fā)掃描結(jié)束后财边,重新掃描對(duì)象 A。此時(shí)可以掃描到 A→C 引用点骑,對(duì)象 C 不會(huì)消失酣难。
原始快照:若要?jiǎng)h除 B→C 引用,則將原始的 B→C 引用記錄下來(lái)(原始的快照)畔况,待并發(fā)掃描結(jié)束后鲸鹦,重新掃描對(duì)象 B,由于記錄的是原始信息跷跪,其中包含 B→C 引用馋嗜。這樣,即便未掃描到 A→C 引用吵瞻,對(duì)象 C 也不會(huì)消失葛菇。
此外,無(wú)論引用關(guān)系記錄的插入還是刪除橡羞,虛擬機(jī)都是通過(guò)寫(xiě)屏障實(shí)現(xiàn)的眯停。
每天都會(huì)有更新看過(guò)的朋友可以點(diǎn)波關(guān)注,Java學(xué)習(xí)路線和優(yōu)質(zhì)資源評(píng)論或點(diǎn)擊“Java”獲取卿泽。