1. 概述

垃圾收集(Garbage Collection) 通常被稱為"GC"却特，它誕生于1960年 MIT 的 Lisp 語言掏湾，經(jīng)過半個多世紀(jì)，目前已經(jīng)十分成熟了调塌。
jvm 中逆害，程序計數(shù)器头镊、虛擬機(jī)棧、本地方法棧都是隨線程而生隨線程而滅魄幕，棧幀隨著方法的進(jìn)入和退出做入棧和出棧操作相艇，實現(xiàn)了自動的內(nèi)存清理，因此纯陨，我們的內(nèi)存垃圾回收主要集中于 java 堆和方法區(qū)中坛芽，在程序運行期間，這部分內(nèi)存的分配和使用都是動態(tài)的

2. 對象存活判斷

判斷對象是否存活一般有兩種方式：

(1) 引用計數(shù)

每個對象有一個引用計數(shù)屬性翼抠，新增一個引用時計數(shù)加1咙轩，引用釋放時計數(shù)減1，計數(shù)為0時可以回收阴颖。此方法簡單活喊，無法解決對象相互循環(huán)引用的問題。

(2) 可達(dá)性分析(Reachability Analysis)

從GC Roots開始向下搜索量愧，搜索所走過的路徑稱為引用鏈钾菊。當(dāng)一個對象到GC Roots沒有任何引用鏈相連時，則證明此對象是不可用的侠畔，是不可達(dá)對象结缚。

在Java語言中损晤，GC Roots包括：

虛擬機(jī)棧中引用的對象
方法區(qū)中類靜態(tài)屬性實體引用的對象
方法區(qū)中常量引用的對象
本地方法棧中JNI引用的對象

3. 垃圾收集算法

(1) 標(biāo)記 -清除算法

"標(biāo)記-清除"(Mark-Sweep)算法软棺，如它的名字一樣，算法分為"標(biāo)記"和"清除"兩個階段：首先標(biāo)記出所有需要回收的對象尤勋，在標(biāo)記完成后統(tǒng)一回收掉所有被標(biāo)記的對象喘落。之所以說它是最基礎(chǔ)的收集算法茵宪，是因為后續(xù)的收集算法都是基于這種思路并對其缺點進(jìn)行改進(jìn)而得到的

它的主要缺點有兩個：一個是效率問題，標(biāo)記和清除過程的效率都不高瘦棋；另外一個是空間問題稀火，標(biāo)記清除之后會產(chǎn)生大量不連續(xù)的內(nèi)存碎片，空間碎片太多可能會導(dǎo)致赌朋，當(dāng)程序在以后的運行過程中需要分配較大對象時無法找到足夠的連續(xù)內(nèi)存而不得不提前觸發(fā)另一次垃圾收集動作

(2) 復(fù)制算法

"復(fù)制"(Copying)的收集算法凰狞，它將可用內(nèi)存按容量劃分為大小相等的兩塊，每次只使用其中的一塊沛慢。當(dāng)這一塊的內(nèi)存用完了赡若，就將還存活著的對象復(fù)制到另外一塊上面，然后再把已使用過的內(nèi)存空間一次清理掉

這樣使得每次都是對其中的一塊進(jìn)行內(nèi)存回收团甲，內(nèi)存分配時也就不用考慮內(nèi)存碎片等復(fù)雜情況逾冬，只要移動堆頂指針，按順序分配內(nèi)存即可躺苦，實現(xiàn)簡單身腻，運行高效。只是這種算法的代價是將內(nèi)存縮小為原來的一半匹厘，持續(xù)復(fù)制長生存期的對象則導(dǎo)致效率降低

(3) 標(biāo)記-壓縮算法

復(fù)制收集算法在對象存活率較高時就要執(zhí)行較多的復(fù)制操作嘀趟，效率將會變低。更關(guān)鍵的是愈诚，如果不想浪費50%的空間去件，就需要有額外的空間進(jìn)行分配擔(dān)保，以應(yīng)對被使用的內(nèi)存中所有對象都100%存活的極端情況扰路，所以在老年代一般不能直接選用這種算法

根據(jù)老年代的特點尤溜，有人提出了另外一種"標(biāo)記-壓縮"(Mark-Compact)算法，標(biāo)記過程仍然與"標(biāo)記-清除"算法一樣汗唱，但后續(xù)步驟不是直接對可回收對象進(jìn)行清理宫莱，而是讓所有存活的對象都向一端移動，然后直接清理掉端邊界以外的內(nèi)存

(4) 分代收集算法

GC分代的基本假設(shè)：絕大部分對象的生命周期都非常短暫哩罪，存活時間短授霸。
"分代收集"(Generational Collection)算法，把Java堆分為新生代和老年代际插，這樣就可以根據(jù)各個年代的特點采用最適當(dāng)?shù)氖占惴ǖ舛Ｔ谛律校看卫占瘯r都發(fā)現(xiàn)有大批對象死去框弛，只有少量存活辛辨，那就選用復(fù)制算法，只需要付出少量存活對象的復(fù)制成本就可以完成收集。而老年代中因為對象存活率高斗搞、沒有額外空間對它進(jìn)行分配擔(dān)保指攒，就必須使用"標(biāo)記-清理"或"標(biāo)記-壓縮"算法來進(jìn)行回收

4. 垃圾收集器

如果說收集算法是內(nèi)存回收的方法論，垃圾收集器就是內(nèi)存回收的具體實現(xiàn)

(1) Serial收集器

串行收集器是最古老僻焚，最穩(wěn)定以及效率高的收集器允悦，可能會產(chǎn)生較長的停頓，只使用一個線程去回收虑啤，新生代隙弛、老年代串行回收，新生代使用復(fù)制算法狞山，老年代使用標(biāo)記-壓縮算法驶鹉，垃圾收集的過程中會Stop The World(服務(wù)暫停)

參數(shù)控制：-XX:+UseSerialGC 指定收集器為Serial收集器

(2) ParNew收集器

ParNew收集器其實就是Serial收集器的多線程版本，新生代使用"復(fù)制"算法并行收集铣墨，老年代使用"標(biāo)記-壓縮"算法串行收集

參數(shù)控制：
-XX:+UseParNewGC 指定收集器為ParNew收集器
-XX:ParallelGCThreads 限制線程數(shù)量

(3) Parallel Scavenge 收集器

Parallel Scavenge收集器類似ParNew收集器室埋，Parallel收集器更關(guān)注系統(tǒng)的吞吐量∫猎迹可以通過參數(shù)來打開自適應(yīng)調(diào)節(jié)策略姚淆，虛擬機(jī)會根據(jù)當(dāng)前系統(tǒng)的運行情況收集性能監(jiān)控信息，動態(tài)調(diào)整這些參數(shù)以提供最合適的停頓時間或最大的吞吐量屡律；也可以通過參數(shù)控制GC的時間不大于多少毫秒或者比例腌逢；新生代使用"復(fù)制"算法，老年代使用"標(biāo)記-壓縮"

參數(shù)控制：-XX:+UseParallelGC 使用Parallel收集器+老年代串行

(4) Parallel Old 收集器

Parallel Old是Parallel Scavenge收集器的老年代版本超埋，使用多線程和"標(biāo)記壓縮"算法搏讶。這個收集器是在JDK 1.6中才開始提供

參數(shù)控制： -XX:+UseParallelOldGC 使用Parallel收集器+老年代并行

(5) CMS收集器

CMS(Concurrent Mark Sweep)收集器是一種以獲取最短回收停頓時間為目標(biāo)的收集器。目前很大一部分的Java應(yīng)用都集中在互聯(lián)網(wǎng)站或B/S系統(tǒng)的服務(wù)端上霍殴，這類應(yīng)用尤其重視服務(wù)的響應(yīng)速度媒惕，希望系統(tǒng)停頓時間最短，以給用戶帶來較好的體驗来庭。

從名字(包含"Mark Sweep")上就可以看出CMS收集器是基于"標(biāo)記-清除"算法實現(xiàn)的妒蔚，它的運作過程相對于前面幾種收集器來說要更復(fù)雜一些，
整個過程分為4個步驟月弛，包括：

初始標(biāo)記(CMS initial mark)
并發(fā)標(biāo)記(CMS concurrent mark)
重新標(biāo)記(CMS remark)
并發(fā)清除(CMS concurrent sweep)

其中初始標(biāo)記肴盏、重新標(biāo)記這兩個步驟仍然需要"Stop The World"。初始標(biāo)記僅僅只是標(biāo)記一下GC Roots能直接關(guān)聯(lián)到的對象帽衙，速度很快菜皂，并發(fā)標(biāo)記階段就是進(jìn)行GC Roots Tracing的過程，而重新標(biāo)記階段則是為了修正并發(fā)標(biāo)記期間厉萝，因用戶程序繼續(xù)運作而導(dǎo)致標(biāo)記產(chǎn)生變動的那一部分對象的標(biāo)記記錄恍飘，這個階段的停頓時間一般會比初始標(biāo)記階段稍長一些榨崩，但遠(yuǎn)比并發(fā)標(biāo)記的時間短。

由于整個過程中耗時最長的并發(fā)標(biāo)記和并發(fā)清除過程中常侣，收集器線程都可以與用戶線程一起工作，所以總體上來說弹渔，CMS收集器的內(nèi)存回收過程是與用戶線程一起并發(fā)地執(zhí)行胳施。老年代收集器（新生代使用ParNew）

優(yōu)點:并發(fā)收集、低停頓
缺點：產(chǎn)生大量空間碎片肢专、并發(fā)階段會降低吞吐量

參數(shù)控制：

-XX:+UseConcMarkSweepGC 使用CMS收集器
-XX:+UseCMSCompactAtFullCollection "Full GC"后舞肆，進(jìn)行一次碎片整理，整理過程是獨占的博杖，會引起停頓時間變長
-XX:+CMSFullGCsBeforeCompaction 設(shè)置進(jìn)行幾次Full GC后椿胯，進(jìn)行一次碎片整理
-XX:ParallelCMSThreads 設(shè)定CMS的線程數(shù)量(一般情況約等于可用CPU數(shù)量)

(6) G1收集器

G1是目前技術(shù)發(fā)展的最前沿成果之一，HotSpot開發(fā)團(tuán)隊賦予它的使命是未來可以替換掉JDK1.5中發(fā)布的CMS收集器剃根。與CMS收集器相比G1收集器有以下特點：

空間整合哩盲，G1收集器采用"標(biāo)記-壓縮"算法，不會產(chǎn)生內(nèi)存空間碎片狈醉。分配大對象時不會因為無法找到連續(xù)空間而提前觸發(fā)下一次GC廉油。
可預(yù)測停頓，這是G1的另一大優(yōu)勢苗傅，降低停頓時間是G1和CMS的共同關(guān)注點抒线，但G1除了追求低停頓外，還能建立可預(yù)測的停頓時間模型渣慕，能讓使用者明確指定在一個長度為N毫秒的時間片段內(nèi)嘶炭，消耗在垃圾收集上的時間不得超過N毫秒，這幾乎已經(jīng)是實時Java（RTSJ）的垃圾收集器的特征了逊桦。

上面提到的垃圾收集器眨猎，收集的范圍都是整個新生代或者老年代，而G1不再是這樣强经。使用G1收集器時宵呛，Java堆的內(nèi)存布局與其他收集器有很大差別，它將整個Java堆劃分為多個大小相等的獨立區(qū)域（Region）夕凝，雖然還保留有新生代和老年代的概念宝穗，但新生代和老年代不再是物理隔閡了，它們都是一部分(可以不連續(xù))Region的集合码秉。

收集步驟：

標(biāo)記階段逮矛，首先初始標(biāo)記(Initial-Mark),這個階段是停頓的(Stop the World Event)，并且會觸發(fā)一次普通Mintor GC转砖，對應(yīng)GC log:GC pause (young) (inital-mark)

Root Region Scanning须鼎，程序運行過程中會回收survivor區(qū)(存活到老年代)鲸伴，這一過程必須在young GC之前完成。
Concurrent Marking晋控，在整個堆中進(jìn)行并發(fā)標(biāo)記(和應(yīng)用程序并發(fā)執(zhí)行)汞窗，此過程可能被young GC中斷。在并發(fā)標(biāo)記階段赡译，若發(fā)現(xiàn)區(qū)域?qū)ο笾械乃袑ο蠖际抢倮簦莻€這個區(qū)域會被立即回收(圖中打X)。同時蝌焚，并發(fā)標(biāo)記過程中裹唆，會計算每個區(qū)域的對象活性(區(qū)域中存活對象的比例)。
Remark, 再標(biāo)記只洒，會有短暫停頓(STW)许帐。再標(biāo)記階段是用來收集并發(fā)標(biāo)記階段產(chǎn)生新的垃圾(并發(fā)階段和應(yīng)用程序一同運行)；G1中采用了比CMS更快的初始快照算法:snapshot-at-the-beginning (SATB)毕谴。
Copy/Clean up成畦，多線程清除失活對象，會有STW涝开。G1將回收區(qū)域的存活對象拷貝到新區(qū)域羡鸥，清除Remember Sets，并發(fā)清空回收區(qū)域并把它返回到空閑區(qū)域鏈表中忠寻。

復(fù)制/清除過程后惧浴。回收區(qū)域的活性對象已經(jīng)被集中回收到深藍(lán)色和深綠色區(qū)域奕剃。

圖解常見GC算法和垃圾收集器