在Java虛擬機中,對象和數組的內存都是在堆中分配的要拂,垃圾收集器主要回收的內存就是再堆內存中。如果在Java程序運行過程中现柠,動態(tài)創(chuàng)建的對象或者數組沒有及時得到回收苹享,持續(xù)積累双絮,最終堆內存就會被占滿,導致OOM得问。
JVM提供了一種垃圾回收機制囤攀,簡稱GC機制。通過GC機制宫纬,能夠在運行過程中將堆中的垃圾對象不斷回收焚挠,從而保證程序的正常運行。
垃圾對象的判定
我們都知道漓骚,所謂“垃圾”對象蝌衔,就是指我們在程序的運行過程中不再有用的對象,即不再存活的對象蝌蹂。那么怎么來判斷堆中的對象是“垃圾”噩斟、不再存活的對象呢?
引用計數法
每個對象都有一個引用計數的屬性孤个,用來保存該對象被引用的次數剃允。當引用次數為0時,就意味著該對象沒有被引用了,也就不會在使用這個對象了斥废,可以判定為垃圾對象椒楣。但是,這種方式有一個很大的Bug营袜,就是無法解決對象間相互引用或者循環(huán)引用的問題:當兩個對象相互引用撒顿,他們兩個和其他任何對象也沒有引用關系,它倆的引用次數都不為0荚板,因此不會被回收凤壁,但實際上這兩個對象已經不再有用了。
可達性分析(根搜索法)
為了避免使用引用計數法帶來的問題跪另,Java采用了可達性分析法來判斷垃圾對象拧抖。
這種方式可以將所有對象的引用關系想象成一棵樹,從樹的根節(jié)點GC Root遍歷所有引用的對象免绿,樹的節(jié)點就為可達對象唧席,其他沒有處于節(jié)點的對象則為不可達對象。
那么什么樣的對象可以作為GC的根節(jié)點呢嘲驾?
- 虛擬機棧(幀棧中的本地變量表)中引用的對象
- 方法區(qū)中靜態(tài)屬性引用的對象
- 方法區(qū)中常量引用的對象
- 本地方法棧中JNI引用的對象
引用狀態(tài)
垃圾回收機制淌哟,不管采用是引用計數法,還是可達性分析法辽故,都與對象的引用有關徒仓,Java中存在四種引用狀態(tài):
強引用 - 我們使用的大部分引用實際上都是強引用,這是使用最普遍的引用誊垢。如果一個對象具有強引用掉弛,就表示它處于可達狀態(tài),垃圾回收器絕不會回收它喂走,即便系統(tǒng)內存非常緊張殃饿,Java虛擬機寧愿拋出
OutOfMemoryError
錯誤,使程序異常終止芋肠,也不會回收被強引用所引用的對象乎芳。因此,強引用是造成Java內存泄露的主要原因之一帖池。軟引用 - 一個對象只具有軟引用秒咐,如果內存空間足夠,垃圾回收器就不會回收它碘裕,如果內存空間不足了携取,就會回收這些對象的內存。只要垃圾回收器沒有回收它帮孔,該對象就可以被程序使用雷滋。
弱引用 - 一個對象只具有弱引用不撑,那就類似于是可有可無的。弱引用和軟引用很像晤斩,但弱引用的引用級別更低焕檬。弱引用與軟引用的區(qū)別在于:只具有弱引用的對象擁有更短暫的生命周期。在垃圾回收器線程掃描它所管轄的內存區(qū)域的過程中澳泵,一旦發(fā)現了只具有弱引用的對象实愚,不管當前內存空間足夠與否,都會回收它的內存兔辅。
虛引用 - 一個對象僅持有虛引用腊敲,那么它就和沒有任何引用一樣,在任何時候都可能被垃圾回收器回收维苔。虛引用主要用來跟蹤對象被垃圾回收的活動碰辅,我們平常一般不會使用。
垃圾回收算法
通過可達性分析算法能夠判定哪些對象是需要回收的了介时,那么回收具體需要怎樣去執(zhí)行呢没宾?
標記-清除算法
首先需要標記可以回收的對象內存,然后在對回收的內存進行清除沸柔。
但是這樣的話循衰,隨著程序的運行,會不斷分配釋放內存褐澎,在堆中會產生很多的不連續(xù)的空閑內存區(qū)羹蚣,即內存碎片。這樣即使有足夠多的空閑內存乱凿,也不一定能分配出足夠大的內存,并且可能會造成頻繁的GC咽弦,影響效率徒蟆,甚至OOM。
標記-整理算法
和標記-清除算法不同的是型型,標記-整理算法在標記后不直接清理可回收內存段审,而是將存活對象都移動到一端,然后清除掉可回收內存闹蒜。
這樣做的好處就是不會產生內存碎片寺枉。
復制算法
復制算法需要先將內存分為兩塊,先在其中一塊內存上分配內存绷落,當這塊內存被分配完后姥闪,則執(zhí)行垃圾回收,然后把存活對象全部復制到另一塊內存上砌烁,第一塊內存則全部清空筐喳。
這種算法不會產生內存碎片催式,但是相當于只能使用一半的內存空間。同時避归,復制算法和存活對象的數量有關荣月,如果存活對象的數量多,那么復制算法的效率會大大降低梳毙。
分代收集算法
在Java虛擬機中哺窄,對象的生命周期有長有短,大部分對象的生命周期很短账锹,只有少部分的對象才會在內存中存留較長時間萌业,因此可以依據對象生命周期的長短將它們放在不同的區(qū)域。在采用分代收集算法的Java虛擬機堆中牌废,一般分為三個區(qū)域咽白,用來分別儲存這三類對象:
新生代 - 剛創(chuàng)建的對象,在代碼運行時一般都會持續(xù)不斷地創(chuàng)建新的對象鸟缕,這些新創(chuàng)建的對象有很多是局部變量晶框,很快就會變成垃圾對象。這些對象被放在一塊稱為新生代的內存區(qū)域懂从。新生代的特點是垃圾對象多授段,存活對象少。
老年代 - 一些對象很早被創(chuàng)建了番甩,經歷了多次GC也沒有被回收侵贵,而是一直存活下來。這些對象被放在一塊稱為老年代的區(qū)域缘薛。老年代的特點是存活對象多窍育,垃圾對象少。
永久代 - 一些伴隨虛擬機生命周期永久存在的對象宴胧,比如一些靜態(tài)對象漱抓,常量等。這些對象被放在一塊稱為永久代的區(qū)域恕齐。永久代的特點是這些對象一般不需要垃圾回收乞娄,會在虛擬機運行過程中一直存活。(在Java1.7之前显歧,方法區(qū)中存儲的是永久代對象仪或,Java1.7方法區(qū)的永久代對象移到了堆中,而在Java1.8永久代已經從堆中移除了士骤,這塊內存給了元空間范删。)
分代收集算法也就根據新生代和老年代來進行垃圾回收的。
對于新生代區(qū)域拷肌,每次GC都會有很多垃圾對象被回收瓶逃,只有少量存活束铭。因此采用復制回收算法,GC時把剩余很少的存活對象復制過去即可厢绝。
在新生代區(qū)域中契沫,并不是按照1:1的比例來進行復制回收,而是按照8:1:1的比例分為了Eden昔汉、SurvivorA懈万、SurvivorB三個區(qū)域。其中Eden意為伊甸園靶病,形容有很多新生對象在里面創(chuàng)建会通;Survivor區(qū)則為幸存者,即經歷GC后仍然存活下來的對象娄周。
- Eden區(qū)對外提供堆內存涕侈。當Eden區(qū)快要滿了,則進行Minor GC(新生代GC)煤辨,把存活對象放入SurvivorA區(qū)裳涛,清空Eden區(qū);
- Eden區(qū)被清空后众辨,繼續(xù)對外提供堆內存端三;
- 當Eden區(qū)再次被填滿,此時對Eden區(qū)和SurvivorA區(qū)同時進行Minor GC(新生代GC)鹃彻,把存活對象放入SurvivorB區(qū)郊闯,此時同時清空Eden區(qū)和SurvivorA區(qū);
- Eden區(qū)繼續(xù)對外提供堆內存蛛株,并重復上述過程团赁,即在 Eden 區(qū)填滿后,把Eden區(qū)和某個Survivor區(qū)的存活對象放到另一個Survivor區(qū)谨履;
- 當某個Survivor區(qū)被填滿欢摄,且仍有對象未被復制完畢時,或者某些對象在反復Survive 15次左右時屉符,則把這部分剩余對象放到老年代區(qū)域;當老年區(qū)也被填滿時锹引,進行Major GC(老年代GC)矗钟,對老年代區(qū)域進行垃圾回收。
老年代區(qū)域對象一般存活周期較長嫌变,每次GC時吨艇,存活的對象比較多,因此采用標記-整理算法腾啥,GC時移動少量存活對象东涡,不會產生內存碎片冯吓。
觸發(fā)GC的類型
Java虛擬機會把每次觸發(fā)GC的信息打印出來,可以根據日志來分析觸發(fā)GC的原因疮跑。
- GC_FOR_MALLOC:表示是在堆上分配對象時內存不足觸發(fā)的GC组贺。
- GC_CONCURRENT:當我們應用程序的堆內存達到一定量,或者可以理解為快要滿的時候祖娘,系統(tǒng)會自動觸發(fā)GC操作來釋放內存失尖。
- GC_EXPLICIT:表示是應用程序調用System.gc、VMRuntime.gc接口或者收到SIGUSR1信號時觸發(fā)的GC渐苏。
- GC_BEFORE_OOM:表示是在準備拋OOM異常之前進行的最后努力而觸發(fā)的GC掀潮。
參考: