聲明:本文摘抄自《深入理解Java虛擬機(jī)》一書晾嘶,本文完全為自我學(xué)習(xí),請感興趣的同學(xué)購買正版娶吞,支持原創(chuàng)
SUN的JDK版本從1.3.1開始運(yùn)用HotSpot虛擬機(jī)垒迂, 2006年底開源,主要使用C++實(shí)現(xiàn)妒蛇,JNI接口部分用C實(shí)現(xiàn)娇斑。HotSpot是較新的Java虛擬機(jī)策添,用來代替JIT(Just in Time),可以大大提高Java運(yùn)行的性能毫缆。Java原先是把源代碼編譯為字節(jié)碼在虛擬機(jī)執(zhí)行,這樣執(zhí)行速度較慢乐导。而HotSpot將常用的部分代碼編譯為本地(原生苦丁,native)代碼,這樣顯著提高了性能物臂。
HotSpot算法實(shí)現(xiàn)
枚舉根節(jié)點(diǎn)
從可達(dá)性分析中從GC Roots節(jié)點(diǎn)找引用鏈這個(gè)操作為例旺拉,可作為GC Roots的節(jié)點(diǎn)主要在全局性的引用(例如常量和類靜態(tài)屬性)與執(zhí)行上下文(例如棧幀中的本地變量表)中。現(xiàn)在很多應(yīng)用僅僅方法區(qū)就有數(shù)百兆棵磷,如果要逐個(gè)檢查這里面的引用蛾狗,那么必然會(huì)消耗很多時(shí)間。
另外仪媒,可達(dá)性分析對執(zhí)行時(shí)間的敏感性還體現(xiàn)在GC停頓上沉桌,因?yàn)檫@項(xiàng)分析工作必須在一個(gè)確保一致性的快照中進(jìn)行--這里“一致性”意思是指整個(gè)分析期間整個(gè)執(zhí)行系統(tǒng)看起來像是被凍結(jié)在某個(gè)時(shí)間點(diǎn)上,不可以出現(xiàn)在分析過程中對象引用關(guān)系還在發(fā)生變化的情況算吩,這點(diǎn)不滿足的話分析結(jié)果準(zhǔn)確性就無法得到保證留凭。這是導(dǎo)致GC進(jìn)行時(shí)必須停頓所有Java執(zhí)行線程的其中一個(gè)重要原因(Sun將這件事稱為“Stop The World”),即使是號稱(幾乎)不會(huì)發(fā)生停頓的CMS收集器偎巢,在枚舉根節(jié)點(diǎn)時(shí)也是必須要停頓的蔼夜。
由于目前的主流Java虛擬機(jī)使用的都是準(zhǔn)確式GC,所以當(dāng)執(zhí)行系統(tǒng)停頓下來后压昼,并不需要一個(gè)不漏的檢查完所有上下文和全局的引用位置求冷,虛擬機(jī)應(yīng)當(dāng)有辦法直接得知哪些地方存放著對象引用。在HotSpot的實(shí)現(xiàn)中窍霞,是使用一組稱為OopMap的數(shù)據(jù)結(jié)構(gòu)來達(dá)到這個(gè)目的匠题,在類加載完成的時(shí)候,HotSpot就把對象內(nèi)什么偏移量上是什么類型的數(shù)據(jù)引用計(jì)算出來官撼,在JIT編譯過程中梧躺,也會(huì)在特殊位置記錄下棧和寄存器中哪些位置是引用。這樣傲绣,GC在掃描時(shí)就可以直接得知這些信息了掠哥。
安全點(diǎn)
在OopMap的協(xié)助下,HotSpot可以迅速完成GC Roots枚舉秃诵,但有一個(gè)很現(xiàn)實(shí)的問題隨之而來:可能導(dǎo)致引用關(guān)系發(fā)生變化续搀,或者說OopMap內(nèi)容變化的指令很多,如果每一條指令都生成一個(gè)OopMap菠净,那么將需要大量額外空間禁舷,這樣GC的空間成本就會(huì)變的很高彪杉。
實(shí)際上,HotSpot也的確沒有為每條指令都生成一個(gè)OopMap牵咙,前面也已經(jīng)提到派近,只是在“特定的位置”記錄了這些信息,這些位置稱為安全點(diǎn)(SafePoint)洁桌,即程序執(zhí)行時(shí)并非所有地方都能停下來執(zhí)行GC渴丸,只有在達(dá)到安全點(diǎn)時(shí)才能暫停。SaftPoint既不能太少以致于GC需要等待時(shí)間太長另凌,也不能過于頻繁以致于過分增大運(yùn)行時(shí)負(fù)荷谱轨。所以,安全點(diǎn)的選擇基本上是以程序“是否具有讓長時(shí)間執(zhí)行的特征”為標(biāo)準(zhǔn)進(jìn)行選定的--因?yàn)槊恳粭l指令執(zhí)行的時(shí)間都非常短暫吠谢,程序不太可能因?yàn)橹噶盍鏖L度太長這個(gè)原因而過長時(shí)間運(yùn)行土童,“長時(shí)間執(zhí)行”的最明顯特征就是指令序列復(fù)用,例如方法調(diào)用工坊,循環(huán)跳轉(zhuǎn)献汗,異常跳轉(zhuǎn)等
對于SafePoint,另一個(gè)需要考慮的問題是如何在GC發(fā)生時(shí)讓所有線程都“跑”到最近的安全點(diǎn)上再停頓下來栅组。這里有兩種方案可供選擇:搶先式中斷(Preemptive Suspension)和主動(dòng)式中斷(Voluntary Suspension)雀瓢。
搶先式中斷不需要線程的執(zhí)行代碼主動(dòng)配合,在GC發(fā)生時(shí)玉掸,首先把所有線程全部中斷刃麸,如果發(fā)現(xiàn)有線程中斷的地方不在安全點(diǎn)上,就恢復(fù)線程讓它“跑”到安全點(diǎn)上∷纠耍現(xiàn)在幾乎沒有虛擬機(jī)實(shí)現(xiàn)采用搶先式中斷來暫停線程從而相應(yīng)GC事件泊业。
主動(dòng)式中斷的思想是當(dāng)GC需要中斷線程的時(shí)候,不直接對線程進(jìn)行操作啊易,僅僅設(shè)置一個(gè)簡單的標(biāo)志吁伺,各個(gè)線程執(zhí)行時(shí)主動(dòng)輪詢這個(gè)標(biāo)志,發(fā)現(xiàn)中斷標(biāo)志為真時(shí)就自己中斷掛起租谈。輪詢標(biāo)志的地方和安全點(diǎn)是重合的篮奄,另外再加上創(chuàng)建對象需要分配內(nèi)存的地方。
安全區(qū)
使用SafePoint似乎完美的解決了如何進(jìn)行入GC的問題割去,但實(shí)際情況卻并不一定窟却。SafePoint機(jī)制保證了程序執(zhí)行時(shí),在不太長的時(shí)間內(nèi)就會(huì)遇到可進(jìn)入的SafePoint呻逆。但是夸赫,程序“不執(zhí)行”的時(shí)候呢?所謂程序不執(zhí)行的時(shí)候是指沒有分配CPU時(shí)間咖城,典型的例子就是線程處于Sleep狀態(tài)或者Blocked狀態(tài)茬腿,這時(shí)候線程無法響應(yīng)JVM的中斷請求呼奢,“走”到安全的地方去中斷掛起,JVM也顯然不太可能等待線程重新被分配CPU時(shí)間切平。對于這種情況握础,就需要安全區(qū)域(Safe Region)來解決。
安全區(qū)域是值這一段代碼片段中揭绑,引用關(guān)系不會(huì)發(fā)生變化弓候。在這個(gè)區(qū)域的任何地方開始GC都是安全的。我們也可以把Safe Region看做是擴(kuò)展了的SafePoint他匪。
在線程執(zhí)行到Safe Region中的代碼時(shí),首先標(biāo)識(shí)自己已進(jìn)入Safe Region夸研,那樣邦蜜,當(dāng)在這段時(shí)間里JVM要發(fā)起GC時(shí),就不用管標(biāo)識(shí)自己為Safe Region狀態(tài)的線程了亥至。當(dāng)線程要離開Safe Region時(shí)悼沈,它要檢查系統(tǒng)是否已經(jīng)完成了根節(jié)點(diǎn)枚舉,如果完成了姐扮,那線程就繼續(xù)執(zhí)行絮供,否則它就必須等待直到收到可以安全離開Safe Region的信號為止。