內(nèi)存動(dòng)態(tài)分配和垃圾收集這些自動(dòng)化技術(shù)使得Java語(yǔ)言比C++語(yǔ)言更加簡(jiǎn)單易用值戳,經(jīng)過(guò)幾十年的發(fā)展,這些技術(shù)也日趨成熟炉爆。雖然這些技術(shù)處于底層且較為成熟堕虹,但我們?nèi)杂斜匾獙W(xué)習(xí)并掌握它,因?yàn)楫?dāng)GC成為系統(tǒng)高并發(fā)的瓶頸時(shí)芬首,我們就需要進(jìn)行GC調(diào)優(yōu)赴捞。本文不涉及GC調(diào)優(yōu)的相關(guān)內(nèi)容,僅僅是作為當(dāng)前Java虛擬機(jī)GC技術(shù)的一個(gè)簡(jiǎn)單入門介紹郁稍。
總的來(lái)說(shuō)赦政,垃圾收集技術(shù)緊緊圍繞兩個(gè)核心:
- 哪些對(duì)象需要回收?(如何判斷對(duì)象是否存活)
- 如何回收耀怜?(常見的垃圾回收算法簡(jiǎn)介)
下面我們針對(duì)這兩個(gè)核心對(duì)GC進(jìn)行簡(jiǎn)單介紹恢着,并講解一下當(dāng)下常用的垃圾收集器的基本過(guò)程。
如何判斷對(duì)象是否存活
判斷對(duì)象是否存活的常用算法有引用計(jì)數(shù)法和可達(dá)性分析法财破,Java虛擬機(jī)一般使用可達(dá)性分析法掰派。
引用計(jì)數(shù)法的思想十分簡(jiǎn)單,它使用一個(gè)變量來(lái)記錄對(duì)象被引用的次數(shù)左痢,當(dāng)變量值為0時(shí)則該對(duì)象可被回收碗淌。但引用計(jì)數(shù)法無(wú)法解決循環(huán)引用的問(wèn)題,例如A引用B抖锥,B引用A亿眠,但沒(méi)有其它對(duì)象引用A和B,理論上講此時(shí)A和B都已經(jīng)是不可能再被訪問(wèn)到應(yīng)當(dāng)被回收磅废,但實(shí)際上A和B的引用計(jì)數(shù)都為1纳像,引用計(jì)數(shù)算法也就無(wú)法回收它們。
可達(dá)性分析算法的基本思想是從一些稱為“GC Roots”的對(duì)象出發(fā)拯勉,根據(jù)引用關(guān)系向下搜索竟趾,可以被訪問(wèn)到的對(duì)象是存活的,不能被訪問(wèn)到的對(duì)象則是可被回收的宫峦。例如岔帽,下圖中的Object 5,6导绷,7就是應(yīng)當(dāng)被回收的對(duì)象犀勒。JVM中可以作為GC Roots的對(duì)象包括類中靜態(tài)屬性引用的對(duì)象等。
常見的垃圾回收算法簡(jiǎn)介
分代假說(shuō)
當(dāng)下的垃圾回收器大多基于“分代假說(shuō)”設(shè)計(jì),分代假說(shuō)是對(duì)程序運(yùn)行情況的兩條經(jīng)驗(yàn)總結(jié):
- 絕大多數(shù)對(duì)象都是朝生夕死的
- 熬過(guò)垃圾收集次數(shù)越多的對(duì)象越難以消亡
根據(jù)分代假說(shuō)贾费,大多數(shù)垃圾收集器的設(shè)計(jì)原則為:將對(duì)象根據(jù)其年齡(熬過(guò)垃圾收集的次數(shù))存放在不同的內(nèi)存區(qū)域钦购,并針對(duì)該內(nèi)存區(qū)域中對(duì)象的存亡特征執(zhí)行相應(yīng)的垃圾回收策略。如果一個(gè)區(qū)域內(nèi)的對(duì)象大多數(shù)都是朝生夕死的褂萧,那么垃圾回收時(shí)就可以只關(guān)注少部分存活對(duì)象即可押桃,從而用較低代價(jià)回收到大量空間;如果一個(gè)區(qū)域內(nèi)的對(duì)象大多數(shù)是難以消亡的导犹,那么虛擬機(jī)就可以減少對(duì)該區(qū)域的垃圾回收頻率唱凯,從而兼顧了垃圾回收的時(shí)間開銷的回收效率。當(dāng)下虛擬機(jī)的具體實(shí)現(xiàn)中多把內(nèi)存區(qū)域分為新生代和老年代谎痢,并相應(yīng)的設(shè)計(jì)了標(biāo)記-清除算法磕昼、標(biāo)記-復(fù)制算法和標(biāo)記-整理算法。
標(biāo)記-清除算法
標(biāo)記-清除算法的基本思想為:首先使用可達(dá)性分析法標(biāo)記出所有需要被回收的對(duì)象舶得,標(biāo)記完成后統(tǒng)一回收被標(biāo)記的對(duì)象。該算法缺點(diǎn)有二:第一爽蝴,當(dāng)需要被回收的對(duì)象較多時(shí)沐批,其效率較低;第二蝎亚,會(huì)造成內(nèi)存碎片化問(wèn)題九孩。算法示意圖如下:
標(biāo)記-復(fù)制算法
標(biāo)記-清除算法的基本思想為:將內(nèi)存區(qū)域一分為二,每次只使用其中之一发框,垃圾回收時(shí)將這一塊內(nèi)存上的存活對(duì)象復(fù)制到另一塊未使用的內(nèi)存區(qū)域中去躺彬,然后將這一塊內(nèi)存一次性整體回收。這種算法解決了標(biāo)記-清除算法存在內(nèi)存碎片的問(wèn)題梅惯,但缺陷是存在空間浪費(fèi)宪拥。算法示意圖如下:
標(biāo)記-整理算法
標(biāo)記-整理算法的基本思想為:將所有存活對(duì)象向內(nèi)存空間的一端移動(dòng),然后直接清理掉邊界以外的內(nèi)存铣减。這種算法解決了空間浪費(fèi)的問(wèn)題她君。算法示意圖如下:
三種算法總結(jié)
新生代中存活對(duì)象較少,需要被回收的對(duì)象較多葫哗;老年代中存活對(duì)象較多缔刹,需要被回收的對(duì)象較少。三種算法的適應(yīng)場(chǎng)景如下:
- 標(biāo)記-清除算法:該算法標(biāo)記完成后統(tǒng)一回收被標(biāo)記的對(duì)象劣针,所以在被回收對(duì)象較少存活對(duì)象較多的老年代中效率更高
- 標(biāo)記-復(fù)制算法:該算法將存活對(duì)象復(fù)制到保留內(nèi)存中去校镐,所以在存活對(duì)象較少被回收對(duì)象較多的新生代中效率更高
- 標(biāo)記-整理算法:該算法將存活對(duì)象向一邊靠攏,效率比標(biāo)記-復(fù)制算法低捺典,一般用在老年代中
標(biāo)記-復(fù)制算法的具體實(shí)現(xiàn)并不會(huì)簡(jiǎn)單粗暴的按照1:1的比例來(lái)劃分新生代的內(nèi)存空間鸟廓,有研究表明98%的新生代對(duì)象都熬不過(guò)第一輪垃圾收集,因此可以采用一種Apple式回收的策略:將新生代劃分為一塊Eden區(qū)和兩塊Survivor區(qū),Eden:Survivor = 8:1肝箱,每次使用Eden區(qū)和一塊Survivor區(qū)哄褒,回收時(shí)將其存活對(duì)象復(fù)制到另一塊Survivor中,所以只有10%的新生代空間是被浪費(fèi)的煌张。
標(biāo)記-清除算法和標(biāo)記-整理算法都用于老年代的回收呐赡,兩種算法的根本區(qū)別是是否需要移動(dòng)存活對(duì)象。移動(dòng)存活對(duì)象骏融,內(nèi)存回收時(shí)更加復(fù)雜链嘀,而且移動(dòng)過(guò)程需要STW(Stop The World, 即暫停用戶線程档玻,因?yàn)橐苿?dòng)對(duì)象會(huì)改變內(nèi)存地址怀泊,需要更新相關(guān)對(duì)象的引用);而不移動(dòng)误趴,內(nèi)存分配時(shí)更加復(fù)雜霹琼,還產(chǎn)生空間碎片。因此凉当,從垃圾收集的停頓時(shí)間來(lái)看枣申,不移動(dòng)對(duì)象停頓時(shí)間會(huì)更短,甚至可以不需要停頓看杭,但是從整個(gè)程序的吞吐量來(lái)看忠藤,移動(dòng)對(duì)象會(huì)更劃算。
CMS的垃圾收集過(guò)程
CMS(Concurrent Mark Sweep)收集器專注于負(fù)責(zé)老年代的垃圾收集楼雹,以獲取最短回收停頓時(shí)間為目標(biāo)模孩,所以基于標(biāo)記-清除算法實(shí)現(xiàn)。整個(gè)過(guò)程分為四步:
- 初始標(biāo)記:需要STW贮缅,僅標(biāo)記和GC Roots直接關(guān)聯(lián)的對(duì)象榨咐,速度快
- 并發(fā)標(biāo)記:不需要STW,從GC Roots直接關(guān)聯(lián)的對(duì)象出發(fā)并發(fā)標(biāo)記谴供,和用戶線程并發(fā)運(yùn)行
- 重新標(biāo)記:需要STW祭芦,修正并發(fā)標(biāo)記過(guò)程中因用戶線程并發(fā)運(yùn)行導(dǎo)致的變動(dòng)(主要是垃圾變?yōu)榉抢男拚?/li>
- 并發(fā)清除:不需要STW,清理掉死亡對(duì)象憔鬼,因?yàn)槭褂脴?biāo)記-清除算法不需移動(dòng)對(duì)象龟劲,所以可以和用戶線程并發(fā)運(yùn)行
CMS運(yùn)行示意圖如下:
CMS的缺點(diǎn)有三:
- 吞吐量低,并發(fā)過(guò)程占用CPU
- 無(wú)法處理并發(fā)過(guò)程中新產(chǎn)生的浮動(dòng)垃圾
- 標(biāo)記-清除算法導(dǎo)致的內(nèi)存碎片化問(wèn)題
G1的垃圾收集過(guò)程
G1(Garbage First)收集器是全功能的垃圾收集器轴或,從JDK 9開始稱為服務(wù)端模式下的默認(rèn)收集器昌跌。G1不再單單針對(duì)新生代或者老年代,而是面向整個(gè)堆:G1將堆劃分為多個(gè)大小相等的獨(dú)立區(qū)域照雁,每個(gè)區(qū)域都可以根據(jù)需要扮演Eden蚕愤、Survivor或者老年代答恶,優(yōu)先針對(duì)垃圾最多回收價(jià)值最大的區(qū)域進(jìn)行回收。G1的設(shè)計(jì)目標(biāo)是在延遲可控的情況下盡可能追求高的吞吐量萍诱。
參考文獻(xiàn)
【1】《深入理解Java虛擬機(jī)(第3版)》周志明著悬嗓,機(jī)械工業(yè)出版社。
每日學(xué)習(xí)筆記裕坊,寫于2020-04-17 星期五