1. 概述
垃圾收集(Garbage Collection) 通常被稱為"GC"却特,它誕生于1960年 MIT 的 Lisp 語言掏湾,經(jīng)過半個多世紀(jì),目前已經(jīng)十分成熟了调塌。
jvm 中逆害,程序計數(shù)器头镊、虛擬機(jī)棧、本地方法棧都是隨線程而生隨線程而滅魄幕,棧幀隨著方法的進(jìn)入和退出做入棧和出棧操作相艇,實現(xiàn)了自動的內(nèi)存清理,因此纯陨,我們的內(nèi)存垃圾回收主要集中于 java 堆和方法區(qū)中坛芽,在程序運行期間,這部分內(nèi)存的分配和使用都是動態(tài)的
2. 對象存活判斷
判斷對象是否存活一般有兩種方式:
(1) 引用計數(shù)
每個對象有一個引用計數(shù)屬性翼抠,新增一個引用時計數(shù)加1咙轩,引用釋放時計數(shù)減1,計數(shù)為0時可以回收阴颖。此方法簡單活喊,無法解決對象相互循環(huán)引用的問題。
(2) 可達(dá)性分析(Reachability Analysis)
從GC Roots開始向下搜索量愧,搜索所走過的路徑稱為引用鏈钾菊。當(dāng)一個對象到GC Roots沒有任何引用鏈相連時,則證明此對象是不可用的侠畔,是不可達(dá)對象结缚。
在Java語言中损晤,GC Roots包括:
- 虛擬機(jī)棧中引用的對象
- 方法區(qū)中類靜態(tài)屬性實體引用的對象
- 方法區(qū)中常量引用的對象
- 本地方法棧中JNI引用的對象
3. 垃圾收集算法
(1) 標(biāo)記 -清除算法
"標(biāo)記-清除"(Mark-Sweep)算法软棺,如它的名字一樣,算法分為"標(biāo)記"和"清除"兩個階段:首先標(biāo)記出所有需要回收的對象尤勋,在標(biāo)記完成后統(tǒng)一回收掉所有被標(biāo)記的對象喘落。之所以說它是最基礎(chǔ)的收集算法茵宪,是因為后續(xù)的收集算法都是基于這種思路并對其缺點進(jìn)行改進(jìn)而得到的
它的主要缺點有兩個:一個是效率問題,標(biāo)記和清除過程的效率都不高瘦棋;另外一個是空間問題稀火,標(biāo)記清除之后會產(chǎn)生大量不連續(xù)的內(nèi)存碎片,空間碎片太多可能會導(dǎo)致赌朋,當(dāng)程序在以后的運行過程中需要分配較大對象時無法找到足夠的連續(xù)內(nèi)存而不得不提前觸發(fā)另一次垃圾收集動作
(2) 復(fù)制算法
"復(fù)制"(Copying)的收集算法凰狞,它將可用內(nèi)存按容量劃分為大小相等的兩塊,每次只使用其中的一塊沛慢。當(dāng)這一塊的內(nèi)存用完了赡若,就將還存活著的對象復(fù)制到另外一塊上面,然后再把已使用過的內(nèi)存空間一次清理掉
這樣使得每次都是對其中的一塊進(jìn)行內(nèi)存回收团甲,內(nèi)存分配時也就不用考慮內(nèi)存碎片等復(fù)雜情況逾冬,只要移動堆頂指針,按順序分配內(nèi)存即可躺苦,實現(xiàn)簡單身腻,運行高效。只是這種算法的代價是將內(nèi)存縮小為原來的一半匹厘,持續(xù)復(fù)制長生存期的對象則導(dǎo)致效率降低
(3) 標(biāo)記-壓縮算法
復(fù)制收集算法在對象存活率較高時就要執(zhí)行較多的復(fù)制操作嘀趟,效率將會變低。更關(guān)鍵的是愈诚,如果不想浪費50%的空間去件,就需要有額外的空間進(jìn)行分配擔(dān)保,以應(yīng)對被使用的內(nèi)存中所有對象都100%存活的極端情況扰路,所以在老年代一般不能直接選用這種算法
根據(jù)老年代的特點尤溜,有人提出了另外一種"標(biāo)記-壓縮"(Mark-Compact)算法,標(biāo)記過程仍然與"標(biāo)記-清除"算法一樣汗唱,但后續(xù)步驟不是直接對可回收對象進(jìn)行清理宫莱,而是讓所有存活的對象都向一端移動,然后直接清理掉端邊界以外的內(nèi)存
(4) 分代收集算法
GC分代的基本假設(shè):絕大部分對象的生命周期都非常短暫哩罪,存活時間短授霸。
"分代收集"(Generational Collection)算法,把Java堆分為新生代和老年代际插,這樣就可以根據(jù)各個年代的特點采用最適當(dāng)?shù)氖占惴ǖ舛T谛律校看卫占瘯r都發(fā)現(xiàn)有大批對象死去框弛,只有少量存活辛辨,那就選用復(fù)制算法,只需要付出少量存活對象的復(fù)制成本就可以完成收集。而老年代中因為對象存活率高斗搞、沒有額外空間對它進(jìn)行分配擔(dān)保指攒,就必須使用"標(biāo)記-清理"或"標(biāo)記-壓縮"算法來進(jìn)行回收
4. 垃圾收集器
如果說收集算法是內(nèi)存回收的方法論,垃圾收集器就是內(nèi)存回收的具體實現(xiàn)
(1) Serial收集器
串行收集器是最古老僻焚,最穩(wěn)定以及效率高的收集器允悦,可能會產(chǎn)生較長的停頓,只使用一個線程去回收虑啤,新生代隙弛、老年代串行回收,新生代使用復(fù)制算法狞山,老年代使用標(biāo)記-壓縮算法驶鹉,垃圾收集的過程中會Stop The World(服務(wù)暫停)
參數(shù)控制:-XX:+UseSerialGC 指定收集器為Serial收集器
(2) ParNew收集器
ParNew收集器其實就是Serial收集器的多線程版本,新生代使用"復(fù)制"算法并行收集铣墨,老年代使用"標(biāo)記-壓縮"算法串行收集
參數(shù)控制:
-XX:+UseParNewGC 指定收集器為ParNew收集器
-XX:ParallelGCThreads 限制線程數(shù)量
(3) Parallel Scavenge 收集器
Parallel Scavenge收集器類似ParNew收集器室埋,Parallel收集器更關(guān)注系統(tǒng)的吞吐量∫猎迹可以通過參數(shù)來打開自適應(yīng)調(diào)節(jié)策略姚淆,虛擬機(jī)會根據(jù)當(dāng)前系統(tǒng)的運行情況收集性能監(jiān)控信息,動態(tài)調(diào)整這些參數(shù)以提供最合適的停頓時間或最大的吞吐量屡律;也可以通過參數(shù)控制GC的時間不大于多少毫秒或者比例腌逢;新生代使用"復(fù)制"算法,老年代使用"標(biāo)記-壓縮"
參數(shù)控制:-XX:+UseParallelGC 使用Parallel收集器+老年代串行
(4) Parallel Old 收集器
Parallel Old是Parallel Scavenge收集器的老年代版本超埋,使用多線程和"標(biāo)記壓縮"算法搏讶。這個收集器是在JDK 1.6中才開始提供
參數(shù)控制: -XX:+UseParallelOldGC 使用Parallel收集器+老年代并行
(5) CMS收集器
CMS(Concurrent Mark Sweep)收集器是一種以獲取最短回收停頓時間為目標(biāo)的收集器。目前很大一部分的Java應(yīng)用都集中在互聯(lián)網(wǎng)站或B/S系統(tǒng)的服務(wù)端上霍殴,這類應(yīng)用尤其重視服務(wù)的響應(yīng)速度媒惕,希望系統(tǒng)停頓時間最短,以給用戶帶來較好的體驗来庭。
從名字(包含"Mark Sweep")上就可以看出CMS收集器是基于"標(biāo)記-清除"算法實現(xiàn)的妒蔚,它的運作過程相對于前面幾種收集器來說要更復(fù)雜一些,
整個過程分為4個步驟月弛,包括:
- 初始標(biāo)記(CMS initial mark)
- 并發(fā)標(biāo)記(CMS concurrent mark)
- 重新標(biāo)記(CMS remark)
- 并發(fā)清除(CMS concurrent sweep)
其中初始標(biāo)記肴盏、重新標(biāo)記這兩個步驟仍然需要"Stop The World"。初始標(biāo)記僅僅只是標(biāo)記一下GC Roots能直接關(guān)聯(lián)到的對象帽衙,速度很快菜皂,并發(fā)標(biāo)記階段就是進(jìn)行GC Roots Tracing的過程,而重新標(biāo)記階段則是為了修正并發(fā)標(biāo)記期間厉萝,因用戶程序繼續(xù)運作而導(dǎo)致標(biāo)記產(chǎn)生變動的那一部分對象的標(biāo)記記錄恍飘,這個階段的停頓時間一般會比初始標(biāo)記階段稍長一些榨崩,但遠(yuǎn)比并發(fā)標(biāo)記的時間短。
由于整個過程中耗時最長的并發(fā)標(biāo)記和并發(fā)清除過程中常侣,收集器線程都可以與用戶線程一起工作,所以總體上來說弹渔,CMS收集器的內(nèi)存回收過程是與用戶線程一起并發(fā)地執(zhí)行胳施。老年代收集器(新生代使用ParNew)
優(yōu)點:并發(fā)收集、低停頓
缺點:產(chǎn)生大量空間碎片肢专、并發(fā)階段會降低吞吐量
參數(shù)控制:
-XX:+UseConcMarkSweepGC 使用CMS收集器
-XX:+UseCMSCompactAtFullCollection "Full GC"后舞肆,進(jìn)行一次碎片整理,整理過程是獨占的博杖,會引起停頓時間變長
-XX:+CMSFullGCsBeforeCompaction 設(shè)置進(jìn)行幾次Full GC后椿胯,進(jìn)行一次碎片整理
-XX:ParallelCMSThreads 設(shè)定CMS的線程數(shù)量(一般情況約等于可用CPU數(shù)量)
(6) G1收集器
G1是目前技術(shù)發(fā)展的最前沿成果之一,HotSpot開發(fā)團(tuán)隊賦予它的使命是未來可以替換掉JDK1.5中發(fā)布的CMS收集器剃根。與CMS收集器相比G1收集器有以下特點:
空間整合哩盲,G1收集器采用"標(biāo)記-壓縮"算法,不會產(chǎn)生內(nèi)存空間碎片狈醉。分配大對象時不會因為無法找到連續(xù)空間而提前觸發(fā)下一次GC廉油。
可預(yù)測停頓,這是G1的另一大優(yōu)勢苗傅,降低停頓時間是G1和CMS的共同關(guān)注點抒线,但G1除了追求低停頓外,還能建立可預(yù)測的停頓時間模型渣慕,能讓使用者明確指定在一個長度為N毫秒的時間片段內(nèi)嘶炭,消耗在垃圾收集上的時間不得超過N毫秒,這幾乎已經(jīng)是實時Java(RTSJ)的垃圾收集器的特征了逊桦。
上面提到的垃圾收集器眨猎,收集的范圍都是整個新生代或者老年代,而G1不再是這樣强经。使用G1收集器時宵呛,Java堆的內(nèi)存布局與其他收集器有很大差別,它將整個Java堆劃分為多個大小相等的獨立區(qū)域(Region)夕凝,雖然還保留有新生代和老年代的概念宝穗,但新生代和老年代不再是物理隔閡了,它們都是一部分(可以不連續(xù))Region的集合码秉。
收集步驟:
- 標(biāo)記階段逮矛,首先初始標(biāo)記(Initial-Mark),這個階段是停頓的(Stop the World Event),并且會觸發(fā)一次普通Mintor GC转砖,對應(yīng)GC log:GC pause (young) (inital-mark)
Root Region Scanning须鼎,程序運行過程中會回收survivor區(qū)(存活到老年代)鲸伴,這一過程必須在young GC之前完成。
-
Concurrent Marking晋控,在整個堆中進(jìn)行并發(fā)標(biāo)記(和應(yīng)用程序并發(fā)執(zhí)行)汞窗,此過程可能被young GC中斷。在并發(fā)標(biāo)記階段赡译,若發(fā)現(xiàn)區(qū)域?qū)ο笾械乃袑ο蠖际抢倮簦莻€這個區(qū)域會被立即回收(圖中打X)。同時蝌焚,并發(fā)標(biāo)記過程中裹唆,會計算每個區(qū)域的對象活性(區(qū)域中存活對象的比例)。
Remark, 再標(biāo)記只洒,會有短暫停頓(STW)许帐。再標(biāo)記階段是用來收集 并發(fā)標(biāo)記階段 產(chǎn)生新的垃圾(并發(fā)階段和應(yīng)用程序一同運行);G1中采用了比CMS更快的初始快照算法:snapshot-at-the-beginning (SATB)毕谴。
Copy/Clean up成畦,多線程清除失活對象,會有STW涝开。G1將回收區(qū)域的存活對象拷貝到新區(qū)域羡鸥,清除Remember Sets,并發(fā)清空回收區(qū)域并把它返回到空閑區(qū)域鏈表中忠寻。
-
復(fù)制/清除過程后惧浴。回收區(qū)域的活性對象已經(jīng)被集中回收到深藍(lán)色和深綠色區(qū)域奕剃。