jvm內(nèi)存模型
一. 線程私有區(qū)域
線程私有數(shù)據(jù)區(qū)域生命周期與線程相同, 依賴用戶線程的啟動/結(jié)束而創(chuàng)建/銷毀(在Hotspot VM內(nèi), 每個(gè)線程都與操作系統(tǒng)的本地線程直接映射, 因此這部分內(nèi)存區(qū)域的存/否跟隨本地線程的生/死).
1. Program Counter Register(程序計(jì)數(shù)器):
一塊較小的內(nèi)存空間, 作用是當(dāng)前線程所執(zhí)行字節(jié)碼的行號指示器(類似于傳統(tǒng)CPU模型中的PC), PC在每次指令執(zhí)行后自增, 維護(hù)下一個(gè)將要執(zhí)行指令的地址. 在JVM模型中, 字節(jié)碼解釋器就是通過改變PC值來選取下一條需要執(zhí)行的字節(jié)碼指令,分支馍惹、循環(huán)动遭、跳轉(zhuǎn)皿伺、異常處理滋捶、線程恢復(fù)等基礎(chǔ)功能都需要依賴PC完成(僅限于Java方法, Native方法該計(jì)數(shù)器值為undefined
).
不同于OS以進(jìn)程為單位調(diào)度, JVM中的并發(fā)是通過線程切換并分配時(shí)間片執(zhí)行來實(shí)現(xiàn)的. 在任何一個(gè)時(shí)刻, 一個(gè)處理器內(nèi)核只會執(zhí)行一條線程中的指令. 因此, 為了線程切換后能恢復(fù)到正確的執(zhí)行位置, 每條線程都需要有一個(gè)獨(dú)立的程序計(jì)數(shù)器, 這類內(nèi)存被稱為“線程私有”內(nèi)存.
2. Java Stack(虛擬機(jī)棧)
虛擬機(jī)棧描述的是Java方法執(zhí)行的內(nèi)存模型: 每個(gè)方法被執(zhí)行時(shí)會創(chuàng)建一個(gè)棧幀(Stack Frame)用于存儲局部變量表、操作數(shù)棧、動態(tài)鏈接颖侄、方法出口等信息. 每個(gè)方法被調(diào)用至返回的過程, 就對應(yīng)著一個(gè)棧幀在虛擬機(jī)棧中從入棧到出棧的過程(VM提供了-Xss
來指定線程的最大椖癯空間, 該參數(shù)也直接決定了函數(shù)調(diào)用的最大深度).
-
局部變量表(對應(yīng)我們常說的‘堆棧’中的‘椑雷妫’)存放了編譯期可知的各種基本數(shù)據(jù)類型(如boolean孝鹊、int、double等) 展蒂、對象引用(reference : 不等同于對象本身, 可能是一個(gè)指向?qū)ο笃鹗嫉刂返闹羔? 也可能指向一個(gè)代表對象的句柄或其他與此對象相關(guān)的位置, 見下: HotSpot對象定位方式) 和 returnAddress類型(指向一條字節(jié)碼指令的地址). 其中
long
和double
占用2個(gè)局部變量空間(Slot), 其余只占用1個(gè).
3. Native Method Stack(本地方法棧)
與Java Stack作用類似, 區(qū)別是Java Stack為執(zhí)行Java方法服務(wù), 而本地方法棧則為Native方法服務(wù), 如果一個(gè)VM實(shí)現(xiàn)使用C-linkage模型來支持Native調(diào)用, 那么該棧將會是一個(gè)#(詳見: JVM學(xué)習(xí)筆記-本地方法棧(Native Method Stacks)), 但HotSpot VM直接就把本地方法棧和虛擬機(jī)棧合二為一.
二. 線程共享區(qū)域
隨虛擬機(jī)的啟動/關(guān)閉而創(chuàng)建/銷毀.
1. Heap(Java堆)
幾乎所有對象實(shí)例和數(shù)組都要在堆上分配(棧上分配又活、標(biāo)量替換除外), 因此是VM管理的最大一塊內(nèi)存, 也是垃圾收集器的主要活動區(qū)域. 由于現(xiàn)代VM采用分代收集算法, 因此Java堆從GC的角度還可以細(xì)分為: 新生代(Eden區(qū)、From Survivor區(qū)和To Survivor區(qū))和老年代; 而從內(nèi)存分配的角度來看, 線程共享的Java堆還還可以劃分出多個(gè)線程私有的分配緩沖區(qū)(TLAB). 而進(jìn)一步劃分的目的是為了更好地回收內(nèi)存和更快地分配內(nèi)存.
2. Method Area(方法區(qū))
即我們常說的永久代(Permanent Generation), 用于存儲被JVM加載的類信息锰悼、常量柳骄、靜態(tài)變量、即時(shí)編譯器編譯后的代碼等數(shù)據(jù). HotSpot VM把GC分代收集擴(kuò)展至方法區(qū), 即使用Java堆的永久代來實(shí)現(xiàn)方法區(qū), 這樣HotSpot的垃圾收集器就可以像管理Java堆一樣管理這部分內(nèi)存, 而不必為方法區(qū)開發(fā)專門的內(nèi)存管理器(永久帶的內(nèi)存回收的主要目標(biāo)是針對常量池的回收和類型的卸載, 因此收益一般很小)
運(yùn)行時(shí)常量池
方法區(qū)的一部分. Class文件中除了有類的版本箕般、字段耐薯、方法、接口等描述信息外,還有一項(xiàng)常量池(Constant Pool Table)用于存放編譯期生成的各種字面量和符號引用, 這部分內(nèi)容會存放到方法區(qū)的運(yùn)行時(shí)常量池中(如前面從test方法中讀到的signature信息). 但Java語言并不要求常量一定只能在編譯期產(chǎn)生, 即并非預(yù)置入Class文件中常量池的內(nèi)容才能進(jìn)入方法區(qū)運(yùn)行時(shí)常量池, 運(yùn)行期間也可能將新的常量放入池中, 如String的intern()方法.
三. 直接內(nèi)存
直接內(nèi)存并不是JVM運(yùn)行時(shí)數(shù)據(jù)區(qū)的一部分, 但也會被頻繁的使用: 在JDK 1.4引入的NIO提供了基于Channel與Buffer的IO方式, 它可以使用Native函數(shù)庫直接分配堆外內(nèi)存, 然后使用DirectByteBuffer
對象作為這塊內(nèi)存的引用進(jìn)行操作(詳見: Java I/O 擴(kuò)展), 這樣就避免了在Java堆和Native堆中來回復(fù)制數(shù)據(jù), 因此在一些場景中可以顯著提高性能.
顯然, 本機(jī)直接內(nèi)存的分配不會受到Java堆大小的限制(即不會遵守-Xms丝里、-Xmx等設(shè)置), 但既然是內(nèi)存, 則肯定還是會受到本機(jī)總內(nèi)存大小及處理器尋址空間的限制, 因此動態(tài)擴(kuò)展時(shí)也會出現(xiàn)OutOfMemoryError
異常.
GC算法種類
1曲初、引用計(jì)數(shù)算法:給對象中添加一個(gè)引用計(jì)數(shù)器,每當(dāng)有一個(gè)地方引用他時(shí)杯聚,計(jì)數(shù)器值就加1臼婆;當(dāng)引用失效時(shí),計(jì)數(shù)器值就減1幌绍;任何時(shí)刻計(jì)數(shù)器為0的對象就是不可能再被使用的颁褂。
缺點(diǎn):引用和去引用伴隨著加法和減法,影響性能纷捞,而且難以處理循環(huán)引用痢虹,java中沒有使用被去。
2主儡、可達(dá)性分析算法:通過一系列名為"GC Roots"的對象作為起始點(diǎn),從這些節(jié)點(diǎn)開始向下搜索惨缆,搜索所走過的路徑稱為引用鏈(Reference Chain)糜值,當(dāng)一個(gè)對象到GC Roots沒有任何引用鏈相連時(shí),則證明此對象是不可用的坯墨。
收集算法
1寂汇、標(biāo)記-清除算法
對待回收的對象進(jìn)行標(biāo)記。
算法缺點(diǎn):效率問題捣染,標(biāo)記和清除過程效率都很低骄瓣;空間問題,收集之后會產(chǎn)生大量的內(nèi)存碎片耍攘,不利于大對象的分配榕栏。
2畔勤、復(fù)制算法
復(fù)制算法將可用內(nèi)存劃分成大小相等的兩塊A和B,每次只使用其中一塊扒磁,當(dāng)A的內(nèi)存用完了庆揪,就把存活的對象復(fù)制到B,并清空A的內(nèi)存妨托,不僅提高了標(biāo)記的效率缸榛,因?yàn)橹恍枰獦?biāo)記存活的對象,同時(shí)也避免了內(nèi)存碎片的問題兰伤,代價(jià)是可用內(nèi)存縮小為原來的一半内颗。
3、標(biāo)記-整理算法
在老年代中敦腔,對象存活率較高起暮,復(fù)制算法的效率很低。在標(biāo)記-整理算法中会烙,標(biāo)記出所有存活的對象负懦,并移動到一端,然后直接清理邊界以外的內(nèi)存柏腻。
垃圾收集器
上圖展示了7種不同分代的收集器纸厉,如果兩兩之間存在連線,說明可以組合使用五嫂。
1颗品、Serial收集器(串行GC)
Serial 是一個(gè)采用單個(gè)線程并基于復(fù)制算法工作在新生代的收集器,進(jìn)行垃圾收集時(shí)沃缘,必須暫停其他所有的工作線程躯枢。對于單CPU環(huán)境來說,Serial由于沒有線程交互的開銷槐臀,可以很高效的進(jìn)行垃圾收集動作锄蹂,是Client模式下新生代默認(rèn)的收集器。
2水慨、ParNew收集器(并行GC)
ParNew其實(shí)是serial的多線程版本得糜,除了使用多條線程進(jìn)行垃圾收集之外,其余行為與Serial一樣晰洒。
3朝抖、Parallel Scavenge收集器(并行回收GC)
Parallel Scavenge是一個(gè)采用多線程基于復(fù)制算法并工作在新生代的收集器,其關(guān)注點(diǎn)在于達(dá)到一個(gè)可控的吞吐量谍珊,經(jīng)常被稱為“吞吐量優(yōu)先”的收集器治宣。
吞吐量 = 用戶代碼運(yùn)行時(shí)間 /(用戶代碼運(yùn)行時(shí)間 + 垃圾收集時(shí)間)
Parallel Scavenge提供了兩個(gè)參數(shù)用于精確控制吞吐量:
1、-XX:MaxGCPauseMillis 設(shè)置垃圾收集的最大停頓時(shí)間
2、-XX:GCTimeRatio 設(shè)置吞吐量大小
4侮邀、Serial Old收集器(串行GC)
Serial Old 是一個(gè)采用單線程基于標(biāo)記-整理算法并工作在老年代的收集器缆巧,是Client模式下老年代默認(rèn)的收集器。
5豌拙、Parallel Old收集器(并行GC)
Parallel Old是一個(gè)采用多線程基于標(biāo)記-整理算法并工作在老年代的收集器陕悬。在注重吞吐量以及CPU資源敏感的場合,可以優(yōu)先考慮Parallel Scavenge和Parallel Old的收集器組合按傅。
6捉超、CMS收集器(并發(fā)GC)
CMS(Concurrent Mark Sweep)是一種以獲取最短回收停頓時(shí)間為目標(biāo)的收集器,工作在老年代唯绍,基于“標(biāo)記-清除”算法實(shí)現(xiàn)拼岳,整個(gè)過程分為以下4步:
1、初始標(biāo)記:這個(gè)過程只是標(biāo)記以下GC Roots能夠直接關(guān)聯(lián)的對象况芒,但是仍然會Stop The World惜纸;
2、并發(fā)標(biāo)記:進(jìn)行GC Roots Tracing的過程绝骚,可以和用戶線程一起工作耐版。
3、重新標(biāo)記:用于修正并發(fā)標(biāo)記期間由于用戶程序繼續(xù)運(yùn)行而導(dǎo)致標(biāo)記產(chǎn)生變動的那部分記錄压汪,這個(gè)過程會暫停所有線程粪牲,但其停頓時(shí)間遠(yuǎn)比并發(fā)標(biāo)記的時(shí)間短;
4止剖、并發(fā)清理:可以和用戶線程一起工作腺阳。
CMS收集器的缺點(diǎn):
1、對CPU資源比較敏感穿香,在并發(fā)階段亭引,雖然不會導(dǎo)致用戶線程停頓,但是會占用一部分線程資源皮获,降低系統(tǒng)的總吞吐量焙蚓。
2、無法處理浮動垃圾魔市,在并發(fā)清理階段主届,用戶線程的運(yùn)行依然會產(chǎn)生新的垃圾對象,這部分垃圾只能在下一次GC時(shí)收集待德。
3、CMS是基于標(biāo)記-清除算法實(shí)現(xiàn)的枫夺,意味著收集結(jié)束后會造成大量的內(nèi)存碎片将宪,可能導(dǎo)致出現(xiàn)老年代剩余空間很大,卻無法找到足夠大的連續(xù)空間分配當(dāng)前對象,不得不提前觸發(fā)一次Full GC较坛。
JDK1.5實(shí)現(xiàn)中印蔗,當(dāng)老年代空間使用率達(dá)到68%時(shí),就會觸發(fā)CMS收集器丑勤,如果應(yīng)用中老年代增長不是太快华嘹,可以通過-XX:CMSInitiatingOccupancyFraction參數(shù)提高觸發(fā)百分比,從而降低內(nèi)存回收次數(shù)提高系統(tǒng)性能法竞。
JDK1.6實(shí)現(xiàn)中耙厚,觸發(fā)CMS收集器的閾值已經(jīng)提升到92%,要是CMS運(yùn)行期間預(yù)留的內(nèi)存無法滿足用戶線程需要岔霸,會出現(xiàn)一次"Concurrent Mode Failure"失敗薛躬,這是虛擬機(jī)會啟動Serial Old收集器對老年代進(jìn)行垃圾收集,當(dāng)然呆细,這樣應(yīng)用的停頓時(shí)間就更長了型宝,所以這個(gè)閾值也不能設(shè)置的太高,如果導(dǎo)致了"Concurrent Mode Failure"失敗絮爷,反而會降低性能趴酣,至于如何設(shè)置這個(gè)閾值,還得長時(shí)間的對老年代空間的使用情況進(jìn)行監(jiān)控坑夯。
7价卤、G1收集器
G1(Garbage First)是JDK1.7提供的一個(gè)工作在新生代和老年代的收集器,基于“標(biāo)記-整理”算法實(shí)現(xiàn)渊涝,在收集結(jié)束后可以避免內(nèi)存碎片問題慎璧。
G1優(yōu)點(diǎn):
1、并行與并發(fā):充分利用多CPU來縮短Stop The World的停頓時(shí)間跨释;
2胸私、分代收集:不需要其他收集配合就可以管理整個(gè)Java堆,采用不同的方式處理新建的對象鳖谈、已經(jīng)存活一段時(shí)間和經(jīng)歷過多次GC的對象獲取更好的收集效果;
3岁疼、空間整合:與CMS的"標(biāo)記-清除"算法不同,G1在運(yùn)行期間不會產(chǎn)生內(nèi)存空間碎片缆娃,有利于應(yīng)用的長時(shí)間運(yùn)行捷绒,且分配大對象時(shí),不會導(dǎo)致由于無法申請到足夠大的連續(xù)內(nèi)存而提前觸發(fā)一次Full GC;
4贯要、停頓預(yù)測:G1中可以建立可預(yù)測的停頓時(shí)間模型暖侨,能讓使用者明確指定在M毫秒的時(shí)間片段內(nèi),消耗在垃圾收集上的時(shí)間不得超過N毫秒崇渗。
使用G1收集器時(shí)字逗,Java堆的內(nèi)存布局與其他收集器有很大區(qū)別京郑,整個(gè)Java堆會被劃分為多個(gè)大小相等的獨(dú)立區(qū)域Region,新生代和老年代不再是物理隔離了葫掉,都是一部分Region(不需要連續(xù))的集合些举。G1會跟蹤各個(gè)Region的垃圾收集情況(回收空間大小和回收消耗的時(shí)間),維護(hù)一個(gè)優(yōu)先列表俭厚,根據(jù)允許的收集時(shí)間户魏,優(yōu)先回收價(jià)值最大的Region,避免在整個(gè)Java堆上進(jìn)行全區(qū)域的垃圾回收挪挤,確保了G1收集器可以在有限的時(shí)間內(nèi)盡可能收集更多的垃圾叼丑。
不過問題來了:使用G1收集器,一個(gè)對象分配在某個(gè)Region中电禀,可以和Java堆上任意的對象有引用關(guān)系幢码,那么如何判定一個(gè)對象是否存活,是否需要掃描整個(gè)Java堆尖飞?其實(shí)這個(gè)問題在之前收集器中也存在症副,如果回收新生代的對象時(shí),不得不同時(shí)掃描老年代的話政基,會大大降低Minor GC的效率贞铣。
針對這種情況,虛擬機(jī)提供了一個(gè)解決方案:G1收集器中Region之間的對象引用關(guān)系和其他收集器中新生代與老年代之間的對象引用關(guān)系被保存在Remenbered Set數(shù)據(jù)結(jié)構(gòu)中沮明,用來避免全堆掃描辕坝。G1中每個(gè)Region都有一個(gè)對應(yīng)的Remenbered Set,當(dāng)虛擬機(jī)發(fā)現(xiàn)程序?qū)eference類型的數(shù)據(jù)進(jìn)行寫操作時(shí)荐健,會產(chǎn)生一個(gè)Write Barrier暫時(shí)中斷寫操作酱畅,檢查Reference引用的對象是否處于相同的Region中,如果不是江场,則通過CardTable把相關(guān)引用信息記錄到被引用對象所屬Region的Remenbered Set中纺酸。