概述
? ?垃圾收集 Garbage Collection 通常被稱為“GC”,它誕生于1960年 MIT 的 Lisp 語言,經(jīng)過半個多世紀(jì),目前已經(jīng)十分成熟了顶猜。
? ?jvm中,程序計數(shù)器草添、虛擬機棧驶兜、本地方法棧都是隨線程而生隨線程而滅,棧幀隨著方法的進入和退出做入棧和出棧操作远寸,實現(xiàn)了自動的內(nèi)存清理抄淑,因此,我們的內(nèi)存垃圾回收主要集中于 java 堆和方法區(qū)中驰后,在程序運行期間肆资,這部分內(nèi)存的分配和使用都是動態(tài)的.
對象存活判斷方法
引用計數(shù):每個對象有一個引用計數(shù)屬性,新增一個引用時計數(shù)加1灶芝,引用釋放時計數(shù)減1郑原,計數(shù)為0時可以回收。此方法簡單夜涕,無法解決對象相互循環(huán)引用的問題犯犁。
可達性分析(Reachability Analysis):從GC Roots開始向下搜索,搜索所走過的路徑稱為引用鏈女器。當(dāng)一個對象到GC Roots沒有任何引用鏈相連時酸役,則證明此對象是不可用的。不可達對象。
在Java語言中涣澡,GC Roots包括:
? ?虛擬機棧中引用的對象贱呐。
? ?方法區(qū)中類靜態(tài)屬性實體引用的對象。
? ?方法區(qū)中常量引用的對象入桂。
? ?本地方法棧中JNI引用的對象奄薇。
垃圾收集算法
標(biāo)記 - 清除算法
? ?“標(biāo)記-清除”(Mark-Sweep)算法,如它的名字一樣抗愁,算法分為“標(biāo)記”和“清除”兩個階段:首先標(biāo)記出所有需要回收的對象馁蒂,在標(biāo)記完成后統(tǒng)一回收掉所有被標(biāo)記的對象。之所以說它是最基礎(chǔ)的收集算法驹愚,是因為后續(xù)的收集算法都是基于這種思路并對其缺點進行改進而得到的远搪。
? ?它的主要缺點有兩個:一個是效率問題劣纲,標(biāo)記和清除過程的效率都不高逢捺;另外一個是空間問題,標(biāo)記清除之后會產(chǎn)生大量不連續(xù)的內(nèi)存碎片癞季,空間碎片太多可能會導(dǎo)致劫瞳,當(dāng)程序在以后的運行過程中需要分配較大對象時無法找到足夠的連續(xù)內(nèi)存而不得不提前觸發(fā)另一次垃圾收集動作。
復(fù)制算法
? ?“復(fù)制”(Copying)的收集算法绷柒,它將可用內(nèi)存按容量劃分為大小相等的兩塊志于,每次只使用其中的一塊。當(dāng)這一塊的內(nèi)存用完了废睦,就將還存活著的對象復(fù)制到另外一塊上面伺绽,然后再把已使用過的內(nèi)存空間一次清理掉。
? ?這樣使得每次都是對其中的一塊進行內(nèi)存回收嗜湃,內(nèi)存分配時也就不用考慮內(nèi)存碎片等復(fù)雜情況奈应,只要移動堆頂指針,按順序分配內(nèi)存即可购披,實現(xiàn)簡單杖挣,運行高效。只是這種算法的代價是將內(nèi)存縮小為原來的一半刚陡,持續(xù)復(fù)制長生存期的對象則導(dǎo)致效率降低惩妇。
標(biāo)記 - 壓縮算法
? ?復(fù)制收集算法在對象存活率較高時就要執(zhí)行較多的復(fù)制操作,效率將會變低筐乳。更關(guān)鍵的是歌殃,如果不想浪費50%的空間,就需要有額外的空間進行分配擔(dān)保蝙云,以應(yīng)對被使用的內(nèi)存中所有對象都100%存活的極端情況氓皱,所以在老年代一般不能直接選用這種算法。
? ?根據(jù)老年代的特點贮懈,有人提出了另外一種“標(biāo)記-整理”(Mark-Compact)算法匀泊,標(biāo)記過程仍然與“標(biāo)記-清除”算法一樣优训,但后續(xù)步驟不是直接對可回收對象進行清理,而是讓所有存活的對象都向一端移動各聘,然后直接清理掉端邊界以外的內(nèi)存
分代收集算法
? ?GC分代的基本假設(shè):絕大部分對象的生命周期都非常短暫揣非,存活時間短。
? ?“分代收集”(Generational Collection)算法躲因,把Java堆分為新生代和老年代早敬,這樣就可以根據(jù)各個年代的特點采用最適當(dāng)?shù)氖占惴āT谛律写舐觯看卫占瘯r都發(fā)現(xiàn)有大批對象死去搞监,只有少量存活,那就選用復(fù)制算法镰矿,只需要付出少量存活對象的復(fù)制成本就可以完成收集琐驴。而老年代中因為對象存活率高、沒有額外空間對它進行分配擔(dān)保秤标,就必須使用“標(biāo)記-清理”或“標(biāo)記-整理”算法來進行回收绝淡。
垃圾收集器
如果說收集算法是內(nèi)存回收的方法論,垃圾收集器就是內(nèi)存回收的具體實現(xiàn)
Serial收集器
串行收集器是最古老苍姜,最穩(wěn)定以及效率高的收集器牢酵,可能會產(chǎn)生較長的停頓,只使用一個線程去回收衙猪。新生代馍乙、老年代使用串行回收;新生代復(fù)制算法垫释、老年代標(biāo)記-壓縮丝格;垃圾收集的過程中會Stop The World(服務(wù)暫停)
參數(shù)控制:-XX:+UseSerialGC串行收集器
ParNew收集器
ParNew收集器其實就是Serial收集器的多線程版本。新生代并行饶号,老年代串行铁追;新生代復(fù)制算法、老年代標(biāo)記-壓縮
參數(shù)控制:-XX:+UseParNewGCParNew收集器
-XX:ParallelGCThreads限制線程數(shù)量
Parallel 收集器
Parallel Scavenge收集器類似ParNew收集器茫船,Parallel收集器更關(guān)注系統(tǒng)的吞吐量琅束。可以通過參數(shù)來打開自適應(yīng)調(diào)節(jié)策略算谈,虛擬機會根據(jù)當(dāng)前系統(tǒng)的運行情況收集性能監(jiān)控信息涩禀,動態(tài)調(diào)整這些參數(shù)以提供最合適的停頓時間或最大的吞吐量;也可以通過參數(shù)控制GC的時間不大于多少毫秒或者比例然眼;新生代復(fù)制算法艾船、老年代標(biāo)記-壓縮
參數(shù)控制:-XX:+UseParallelGC使用Parallel收集器+ 老年代串行
Parallel Old 收集器
Parallel Old是Parallel Scavenge收集器的老年代版本,使用多線程和“標(biāo)記-整理”算法。這個收集器是在JDK 1.6中才開始提供
參數(shù)控制:-XX:+UseParallelOldGC使用Parallel收集器+ 老年代并行
CMS 收集器
CMS(Concurrent Mark Sweep)收集器是一種以獲取最短回收停頓時間為目標(biāo)的收集器屿岂。目前很大一部分的Java應(yīng)用都集中在互聯(lián)網(wǎng)站或B/S系統(tǒng)的服務(wù)端上践宴,這類應(yīng)用尤其重視服務(wù)的響應(yīng)速度,希望系統(tǒng)停頓時間最短爷怀,以給用戶帶來較好的體驗阻肩。
從名字(包含“Mark Sweep”)上就可以看出CMS收集器是基于“標(biāo)記-清除”算法實現(xiàn)的,它的運作過程相對于前面幾種收集器來說要更復(fù)雜一些运授,整個過程分為4個步驟烤惊,包括:
初始標(biāo)記(CMS initial mark)
并發(fā)標(biāo)記(CMS concurrent mark)
重新標(biāo)記(CMS remark)
并發(fā)清除(CMS concurrent sweep)
其中初始標(biāo)記、重新標(biāo)記這兩個步驟仍然需要“Stop The World”吁朦。初始標(biāo)記僅僅只是標(biāo)記一下GC Roots能直接關(guān)聯(lián)到的對象柒室,速度很快,并發(fā)標(biāo)記階段就是進行GC Roots Tracing的過程逗宜,而重新標(biāo)記階段則是為了修正并發(fā)標(biāo)記期間雄右,因用戶程序繼續(xù)運作而導(dǎo)致標(biāo)記產(chǎn)生變動的那一部分對象的標(biāo)記記錄,這個階段的停頓時間一般會比初始標(biāo)記階段稍長一些锦溪,但遠比并發(fā)標(biāo)記的時間短不脯。
由于整個過程中耗時最長的并發(fā)標(biāo)記和并發(fā)清除過程中府怯,收集器線程都可以與用戶線程一起工作刻诊,所以總體上來說,CMS收集器的內(nèi)存回收過程是與用戶線程一起并發(fā)地執(zhí)行牺丙。老年代收集器(新生代使用ParNew)
優(yōu)點:并發(fā)收集则涯、低停頓
缺點:產(chǎn)生大量空間碎片、并發(fā)階段會降低吞吐量
參數(shù)控制:-XX:+UseConcMarkSweepGC使用CMS收集器
-XX:+ UseCMSCompactAtFullCollectionFullGC后冲簿,進行一次碎片整理粟判;整理過程是獨占的,會引起停頓時間變長
-XX:+CMSFullGCsBeforeCompaction設(shè)置進行幾次Full GC后峦剔,進行一次碎片整理
-XX:ParallelCMSThreads設(shè)定CMS的線程數(shù)量(一般情況約等于可用CPU數(shù)量)
G1 收集器
G1是目前技術(shù)發(fā)展的最前沿成果之一档礁,HotSpot開發(fā)團隊賦予它的使命是未來可以替換掉JDK1.5中發(fā)布的CMS收集器。與CMS收集器相比G1收集器有以下特點:
1.空間整合吝沫,G1收集器采用標(biāo)記整理算法呻澜,不會產(chǎn)生內(nèi)存空間碎片。分配大對象時不會因為無法找到連續(xù)空間而提前觸發(fā)下一次GC惨险。
2.可預(yù)測停頓羹幸,這是G1的另一大優(yōu)勢,降低停頓時間是G1和CMS的共同關(guān)注點辫愉,但G1除了追求低停頓外栅受,還能建立可預(yù)測的停頓時間模型,能讓使用者明確指定在一個長度為N毫秒的時間片段內(nèi),消耗在垃圾收集上的時間不得超過N毫秒屏镊,這幾乎已經(jīng)是實時Java(RTSJ)的垃圾收集器的特征了依疼。
上面提到的垃圾收集器,收集的范圍都是整個新生代或者老年代而芥,而G1不再是這樣涛贯。使用G1收集器時,Java堆的內(nèi)存布局與其他收集器有很大差別蔚出,它將整個Java堆劃分為多個大小相等的獨立區(qū)域(Region)弟翘,雖然還保留有新生代和老年代的概念,但新生代和老年代不再是物理隔閡了骄酗,它們都是一部分(可以不連續(xù))Region的集合稀余。
G1的新生代收集跟ParNew類似,當(dāng)新生代占用達到一定比例的時候趋翻,開始出發(fā)收集睛琳。和CMS類似,G1收集器收集老年代對象會有短暫停頓踏烙。
收集步驟:
1师骗、標(biāo)記階段,首先初始標(biāo)記(Initial-Mark),這個階段是停頓的(Stop the World Event)讨惩,并且會觸發(fā)一次普通Mintor GC辟癌。對應(yīng)GC log:GC pause (young) (inital-mark)
2、Root Region Scanning荐捻,程序運行過程中會回收survivor區(qū)(存活到老年代)黍少,這一過程必須在young GC之前完成。
3处面、Concurrent Marking临燃,在整個堆中進行并發(fā)標(biāo)記(和應(yīng)用程序并發(fā)執(zhí)行)冬殃,此過程可能被young GC中斷鲫竞。在并發(fā)標(biāo)記階段尚猿,若發(fā)現(xiàn)區(qū)域?qū)ο笾械乃袑ο蠖际抢莻€這個區(qū)域會被立即回收(圖中打X)野揪。同時访忿,并發(fā)標(biāo)記過程中,會計算每個區(qū)域的對象活性(區(qū)域中存活對象的比例)囱挑。
4醉顽、Remark, 再標(biāo)記,會有短暫停頓(STW)平挑。再標(biāo)記階段是用來收集 并發(fā)標(biāo)記階段 產(chǎn)生新的垃圾(并發(fā)階段和應(yīng)用程序一同運行)游添;G1中采用了比CMS更快的初始快照算法:snapshot-at-the-beginning (SATB)系草。
5、Copy/Clean up唆涝,多線程清除失活對象找都,會有STW。G1將回收區(qū)域的存活對象拷貝到新區(qū)域廊酣,清除Remember Sets能耻,并發(fā)清空回收區(qū)域并把它返回到空閑區(qū)域鏈表中。
6亡驰、復(fù)制/清除過程后晓猛。回收區(qū)域的活性對象已經(jīng)被集中回收到深藍色和深綠色區(qū)域凡辱。
參考