圖解常見GC算法和垃圾收集器

1. 概述

垃圾收集(Garbage Collection) 通常被稱為"GC"却特,它誕生于1960年 MIT 的 Lisp 語言掏湾,經(jīng)過半個多世紀(jì),目前已經(jīng)十分成熟了调塌。
jvm 中逆害,程序計數(shù)器头镊、虛擬機(jī)棧、本地方法棧都是隨線程而生隨線程而滅魄幕,棧幀隨著方法的進(jìn)入和退出做入棧和出棧操作相艇,實現(xiàn)了自動的內(nèi)存清理,因此纯陨,我們的內(nèi)存垃圾回收主要集中于 java 堆和方法區(qū)中坛芽,在程序運行期間,這部分內(nèi)存的分配和使用都是動態(tài)的

2. 對象存活判斷

判斷對象是否存活一般有兩種方式:

(1) 引用計數(shù)

每個對象有一個引用計數(shù)屬性翼抠,新增一個引用時計數(shù)加1咙轩,引用釋放時計數(shù)減1,計數(shù)為0時可以回收阴颖。此方法簡單活喊,無法解決對象相互循環(huán)引用的問題。

(2) 可達(dá)性分析(Reachability Analysis)

從GC Roots開始向下搜索量愧,搜索所走過的路徑稱為引用鏈钾菊。當(dāng)一個對象到GC Roots沒有任何引用鏈相連時,則證明此對象是不可用的侠畔,是不可達(dá)對象结缚。

在Java語言中损晤,GC Roots包括:

  • 虛擬機(jī)棧中引用的對象
  • 方法區(qū)中類靜態(tài)屬性實體引用的對象
  • 方法區(qū)中常量引用的對象
  • 本地方法棧中JNI引用的對象

3. 垃圾收集算法

(1) 標(biāo)記 -清除算法

"標(biāo)記-清除"(Mark-Sweep)算法软棺,如它的名字一樣,算法分為"標(biāo)記"和"清除"兩個階段:首先標(biāo)記出所有需要回收的對象尤勋,在標(biāo)記完成后統(tǒng)一回收掉所有被標(biāo)記的對象喘落。之所以說它是最基礎(chǔ)的收集算法茵宪,是因為后續(xù)的收集算法都是基于這種思路并對其缺點進(jìn)行改進(jìn)而得到的

它的主要缺點有兩個:一個是效率問題,標(biāo)記和清除過程的效率都不高瘦棋;另外一個是空間問題稀火,標(biāo)記清除之后會產(chǎn)生大量不連續(xù)的內(nèi)存碎片,空間碎片太多可能會導(dǎo)致赌朋,當(dāng)程序在以后的運行過程中需要分配較大對象時無法找到足夠的連續(xù)內(nèi)存而不得不提前觸發(fā)另一次垃圾收集動作

(2) 復(fù)制算法

"復(fù)制"(Copying)的收集算法凰狞,它將可用內(nèi)存按容量劃分為大小相等的兩塊,每次只使用其中的一塊沛慢。當(dāng)這一塊的內(nèi)存用完了赡若,就將還存活著的對象復(fù)制到另外一塊上面,然后再把已使用過的內(nèi)存空間一次清理掉

這樣使得每次都是對其中的一塊進(jìn)行內(nèi)存回收团甲,內(nèi)存分配時也就不用考慮內(nèi)存碎片等復(fù)雜情況逾冬,只要移動堆頂指針,按順序分配內(nèi)存即可躺苦,實現(xiàn)簡單身腻,運行高效。只是這種算法的代價是將內(nèi)存縮小為原來的一半匹厘,持續(xù)復(fù)制長生存期的對象則導(dǎo)致效率降低

(3) 標(biāo)記-壓縮算法

復(fù)制收集算法在對象存活率較高時就要執(zhí)行較多的復(fù)制操作嘀趟,效率將會變低。更關(guān)鍵的是愈诚,如果不想浪費50%的空間去件,就需要有額外的空間進(jìn)行分配擔(dān)保,以應(yīng)對被使用的內(nèi)存中所有對象都100%存活的極端情況扰路,所以在老年代一般不能直接選用這種算法

根據(jù)老年代的特點尤溜,有人提出了另外一種"標(biāo)記-壓縮"(Mark-Compact)算法,標(biāo)記過程仍然與"標(biāo)記-清除"算法一樣汗唱,但后續(xù)步驟不是直接對可回收對象進(jìn)行清理宫莱,而是讓所有存活的對象都向一端移動,然后直接清理掉端邊界以外的內(nèi)存

(4) 分代收集算法

GC分代的基本假設(shè):絕大部分對象的生命周期都非常短暫哩罪,存活時間短授霸。
"分代收集"(Generational Collection)算法,把Java堆分為新生代和老年代际插,這樣就可以根據(jù)各個年代的特點采用最適當(dāng)?shù)氖占惴ǖ舛T谛律校看卫占瘯r都發(fā)現(xiàn)有大批對象死去框弛,只有少量存活辛辨,那就選用復(fù)制算法,只需要付出少量存活對象的復(fù)制成本就可以完成收集。而老年代中因為對象存活率高斗搞、沒有額外空間對它進(jìn)行分配擔(dān)保指攒,就必須使用"標(biāo)記-清理"或"標(biāo)記-壓縮"算法來進(jìn)行回收

4. 垃圾收集器

如果說收集算法是內(nèi)存回收的方法論,垃圾收集器就是內(nèi)存回收的具體實現(xiàn)

(1) Serial收集器

串行收集器是最古老僻焚,最穩(wěn)定以及效率高的收集器允悦,可能會產(chǎn)生較長的停頓,只使用一個線程去回收虑啤,新生代隙弛、老年代串行回收,新生代使用復(fù)制算法狞山,老年代使用標(biāo)記-壓縮算法驶鹉,垃圾收集的過程中會Stop The World(服務(wù)暫停)

參數(shù)控制:-XX:+UseSerialGC 指定收集器為Serial收集器

(2) ParNew收集器

ParNew收集器其實就是Serial收集器的多線程版本,新生代使用"復(fù)制"算法并行收集铣墨,老年代使用"標(biāo)記-壓縮"算法串行收集

參數(shù)控制:
-XX:+UseParNewGC 指定收集器為ParNew收集器
-XX:ParallelGCThreads 限制線程數(shù)量

(3) Parallel Scavenge 收集器

Parallel Scavenge收集器類似ParNew收集器室埋,Parallel收集器更關(guān)注系統(tǒng)的吞吐量∫猎迹可以通過參數(shù)來打開自適應(yīng)調(diào)節(jié)策略姚淆,虛擬機(jī)會根據(jù)當(dāng)前系統(tǒng)的運行情況收集性能監(jiān)控信息,動態(tài)調(diào)整這些參數(shù)以提供最合適的停頓時間或最大的吞吐量屡律;也可以通過參數(shù)控制GC的時間不大于多少毫秒或者比例腌逢;新生代使用"復(fù)制"算法,老年代使用"標(biāo)記-壓縮"

參數(shù)控制:-XX:+UseParallelGC 使用Parallel收集器+老年代串行

(4) Parallel Old 收集器

Parallel Old是Parallel Scavenge收集器的老年代版本超埋,使用多線程和"標(biāo)記壓縮"算法搏讶。這個收集器是在JDK 1.6中才開始提供

參數(shù)控制: -XX:+UseParallelOldGC 使用Parallel收集器+老年代并行

(5) CMS收集器

CMS(Concurrent Mark Sweep)收集器是一種以獲取最短回收停頓時間為目標(biāo)的收集器。目前很大一部分的Java應(yīng)用都集中在互聯(lián)網(wǎng)站或B/S系統(tǒng)的服務(wù)端上霍殴,這類應(yīng)用尤其重視服務(wù)的響應(yīng)速度媒惕,希望系統(tǒng)停頓時間最短,以給用戶帶來較好的體驗来庭。

從名字(包含"Mark Sweep")上就可以看出CMS收集器是基于"標(biāo)記-清除"算法實現(xiàn)的妒蔚,它的運作過程相對于前面幾種收集器來說要更復(fù)雜一些,
整個過程分為4個步驟月弛,包括:

  1. 初始標(biāo)記(CMS initial mark)
  2. 并發(fā)標(biāo)記(CMS concurrent mark)
  3. 重新標(biāo)記(CMS remark)
  4. 并發(fā)清除(CMS concurrent sweep)

其中初始標(biāo)記肴盏、重新標(biāo)記這兩個步驟仍然需要"Stop The World"。初始標(biāo)記僅僅只是標(biāo)記一下GC Roots能直接關(guān)聯(lián)到的對象帽衙,速度很快菜皂,并發(fā)標(biāo)記階段就是進(jìn)行GC Roots Tracing的過程,而重新標(biāo)記階段則是為了修正并發(fā)標(biāo)記期間厉萝,因用戶程序繼續(xù)運作而導(dǎo)致標(biāo)記產(chǎn)生變動的那一部分對象的標(biāo)記記錄恍飘,這個階段的停頓時間一般會比初始標(biāo)記階段稍長一些榨崩,但遠(yuǎn)比并發(fā)標(biāo)記的時間短。

由于整個過程中耗時最長的并發(fā)標(biāo)記和并發(fā)清除過程中常侣,收集器線程都可以與用戶線程一起工作,所以總體上來說弹渔,CMS收集器的內(nèi)存回收過程是與用戶線程一起并發(fā)地執(zhí)行胳施。老年代收集器(新生代使用ParNew)

優(yōu)點:并發(fā)收集、低停頓
缺點:產(chǎn)生大量空間碎片肢专、并發(fā)階段會降低吞吐量

參數(shù)控制:

-XX:+UseConcMarkSweepGC 使用CMS收集器
-XX:+UseCMSCompactAtFullCollection "Full GC"后舞肆,進(jìn)行一次碎片整理,整理過程是獨占的博杖,會引起停頓時間變長
-XX:+CMSFullGCsBeforeCompaction 設(shè)置進(jìn)行幾次Full GC后椿胯,進(jìn)行一次碎片整理
-XX:ParallelCMSThreads 設(shè)定CMS的線程數(shù)量(一般情況約等于可用CPU數(shù)量)

(6) G1收集器

G1是目前技術(shù)發(fā)展的最前沿成果之一,HotSpot開發(fā)團(tuán)隊賦予它的使命是未來可以替換掉JDK1.5中發(fā)布的CMS收集器剃根。與CMS收集器相比G1收集器有以下特點:

  1. 空間整合哩盲,G1收集器采用"標(biāo)記-壓縮"算法,不會產(chǎn)生內(nèi)存空間碎片狈醉。分配大對象時不會因為無法找到連續(xù)空間而提前觸發(fā)下一次GC廉油。

  2. 可預(yù)測停頓,這是G1的另一大優(yōu)勢苗傅,降低停頓時間是G1和CMS的共同關(guān)注點抒线,但G1除了追求低停頓外,還能建立可預(yù)測的停頓時間模型渣慕,能讓使用者明確指定在一個長度為N毫秒的時間片段內(nèi)嘶炭,消耗在垃圾收集上的時間不得超過N毫秒,這幾乎已經(jīng)是實時Java(RTSJ)的垃圾收集器的特征了逊桦。

上面提到的垃圾收集器眨猎,收集的范圍都是整個新生代或者老年代,而G1不再是這樣强经。使用G1收集器時宵呛,Java堆的內(nèi)存布局與其他收集器有很大差別,它將整個Java堆劃分為多個大小相等的獨立區(qū)域(Region)夕凝,雖然還保留有新生代和老年代的概念宝穗,但新生代和老年代不再是物理隔閡了,它們都是一部分(可以不連續(xù))Region的集合码秉。

收集步驟:

  1. 標(biāo)記階段逮矛,首先初始標(biāo)記(Initial-Mark),這個階段是停頓的(Stop the World Event),并且會觸發(fā)一次普通Mintor GC转砖,對應(yīng)GC log:GC pause (young) (inital-mark)
  1. Root Region Scanning须鼎,程序運行過程中會回收survivor區(qū)(存活到老年代)鲸伴,這一過程必須在young GC之前完成。

  2. Concurrent Marking晋控,在整個堆中進(jìn)行并發(fā)標(biāo)記(和應(yīng)用程序并發(fā)執(zhí)行)汞窗,此過程可能被young GC中斷。在并發(fā)標(biāo)記階段赡译,若發(fā)現(xiàn)區(qū)域?qū)ο笾械乃袑ο蠖际抢倮簦莻€這個區(qū)域會被立即回收(圖中打X)。同時蝌焚,并發(fā)標(biāo)記過程中裹唆,會計算每個區(qū)域的對象活性(區(qū)域中存活對象的比例)。


  3. Remark, 再標(biāo)記只洒,會有短暫停頓(STW)许帐。再標(biāo)記階段是用來收集 并發(fā)標(biāo)記階段 產(chǎn)生新的垃圾(并發(fā)階段和應(yīng)用程序一同運行);G1中采用了比CMS更快的初始快照算法:snapshot-at-the-beginning (SATB)毕谴。

  4. Copy/Clean up成畦,多線程清除失活對象,會有STW涝开。G1將回收區(qū)域的存活對象拷貝到新區(qū)域羡鸥,清除Remember Sets,并發(fā)清空回收區(qū)域并把它返回到空閑區(qū)域鏈表中忠寻。

  1. 復(fù)制/清除過程后惧浴。回收區(qū)域的活性對象已經(jīng)被集中回收到深藍(lán)色和深綠色區(qū)域奕剃。


5. 常用的收集器組合

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末衷旅,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子纵朋,更是在濱河造成了極大的恐慌柿顶,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,294評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件操软,死亡現(xiàn)場離奇詭異嘁锯,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)聂薪,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,493評論 3 385
  • 文/潘曉璐 我一進(jìn)店門家乘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人藏澳,你說我怎么就攤上這事仁锯。” “怎么了翔悠?”我有些...
    開封第一講書人閱讀 157,790評論 0 348
  • 文/不壞的土叔 我叫張陵业崖,是天一觀的道長野芒。 經(jīng)常有香客問我,道長双炕,這世上最難降的妖魔是什么狞悲? 我笑而不...
    開封第一講書人閱讀 56,595評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮妇斤,結(jié)果婚禮上摇锋,老公的妹妹穿的比我還像新娘。我一直安慰自己趟济,他們只是感情好乱投,可當(dāng)我...
    茶點故事閱讀 65,718評論 6 386
  • 文/花漫 我一把揭開白布咽笼。 她就那樣靜靜地躺著顷编,像睡著了一般。 火紅的嫁衣襯著肌膚如雪剑刑。 梳的紋絲不亂的頭發(fā)上媳纬,一...
    開封第一講書人閱讀 49,906評論 1 290
  • 那天,我揣著相機(jī)與錄音施掏,去河邊找鬼钮惠。 笑死,一個胖子當(dāng)著我的面吹牛七芭,可吹牛的內(nèi)容都是我干的素挽。 我是一名探鬼主播,決...
    沈念sama閱讀 39,053評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼狸驳,長吁一口氣:“原來是場噩夢啊……” “哼预明!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起耙箍,我...
    開封第一講書人閱讀 37,797評論 0 268
  • 序言:老撾萬榮一對情侶失蹤撰糠,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后辩昆,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體阅酪,經(jīng)...
    沈念sama閱讀 44,250評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,570評論 2 327
  • 正文 我和宋清朗相戀三年汁针,在試婚紗的時候發(fā)現(xiàn)自己被綠了术辐。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,711評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡施无,死狀恐怖术吗,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情帆精,我是刑警寧澤较屿,帶...
    沈念sama閱讀 34,388評論 4 332
  • 正文 年R本政府宣布隧魄,位于F島的核電站,受9級特大地震影響隘蝎,放射性物質(zhì)發(fā)生泄漏购啄。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 40,018評論 3 316
  • 文/蒙蒙 一嘱么、第九天 我趴在偏房一處隱蔽的房頂上張望狮含。 院中可真熱鬧,春花似錦曼振、人聲如沸几迄。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,796評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽映胁。三九已至,卻和暖如春甲雅,著一層夾襖步出監(jiān)牢的瞬間解孙,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,023評論 1 266
  • 我被黑心中介騙來泰國打工抛人, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留弛姜,地道東北人。 一個月前我還...
    沈念sama閱讀 46,461評論 2 360
  • 正文 我出身青樓妖枚,卻偏偏與公主長得像廷臼,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子绝页,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,595評論 2 350