簡介
Java與C++之間有一堆由內存動態(tài)分配與垃圾收集技術所圍成的“高墻”,墻外面的人想進去伏恐,墻里面的人卻想出來。 —— 《深入理解Java虛擬機:JVM高級特性與最佳實踐》
運行時數(shù)據(jù)區(qū)域
Java虛擬機在執(zhí)行Java程序的過程中會把它所管理的內存劃分為若干個不同的數(shù)據(jù)區(qū)域。這些區(qū)域都有各自的用途暑塑。以及創(chuàng)建和銷毀的時間察净。有的區(qū)域隨著虛擬機進程的啟動而存在驾茴,有些區(qū)域則依賴用戶線程的啟動和結束而建立和銷毀。
程序計數(shù)器
程序計數(shù)器只占用了一塊比較小的內存空間氢卡。
可以看作是當前線程所執(zhí)行的字節(jié)碼文件(class)的行號指示器锈至。在虛擬機的世界中,字節(jié)碼解析器就是通過改變計數(shù)器的值來選取下一條執(zhí)行的字節(jié)碼指令译秦,分支峡捡、循環(huán)、跳轉筑悴、異常處理们拙、線程恢復等,都需要通過程序計數(shù)器來實現(xiàn)阁吝。
因為處理器在一個確定的時刻只會執(zhí)行一個線程中的指令睛竣,線程切換后,是通過計數(shù)器來記錄執(zhí)行痕跡求摇,因而可以看出射沟,程序計數(shù)器是每個線程私有的
如果執(zhí)行的是java方法殊者,那么記錄的是正在執(zhí)行的虛擬機字節(jié)碼指令的地址的地址,如果是native方法验夯,計數(shù)器的值為空(undefined)
這個內存區(qū)域是唯一一個在java虛擬機規(guī)范中沒有規(guī)定任務OutOfMemoryError的情況區(qū)域
Java虛擬機棧
與程序計數(shù)器一樣猖吴,Java虛擬機棧也是線程私有的,它的生命周期與線程相同挥转。虛擬機棧描述的是java方法執(zhí)行的內存模型海蔽,每個方法都在執(zhí)行的同時會創(chuàng)建一個棧幀用于存儲局部變量表、操作數(shù)棧绑谣、動態(tài)鏈接党窜、方法出口等信息。每一個方法從調用直至執(zhí)行完成的過程借宵,就對應著一個棧幀在虛擬機棧中從入棧到出棧的過程幌衣。
局部變量表
局部變量表是一組變量值的存儲空間,用于存放方法參數(shù)和局部變量壤玫。變量槽(Variable Slot)是局部變量表的最小單位豁护,沒有強制規(guī)定大小為32位,雖然32位足夠存放大部分類型的數(shù)據(jù)欲间。一個Slot可以方法boolean楚里、byte、char猎贴、short班缎、int、float她渴、reference达址、和returnAddress 8種類型。其中reference表示對一個對象實例的引用惹骂,通過它可以得到對象在java堆中存放的起始地址的索引和該數(shù)據(jù)所屬數(shù)據(jù)類型的方法區(qū)的類型信息苏携。returnAddress則指向一條字節(jié)碼指令的地址做瞪。對于64位的long和double變量而言对粪,虛擬機會為其分配兩個連續(xù)的slot空間。
虛擬機通過索引定位的方式使用局部變量表装蓬。為了節(jié)省棧幀空間著拭,局部變量表中的Slot是可以重要的。當離開了某些變量的作用域之后牍帚,這些變量對應的Slot就可以交給其他變量使用儡遮。
操作數(shù)棧
操作數(shù)棧也稱為操作棧,是一個后入先出的棧暗赶。方法執(zhí)行中進行算術運算或者是調用其他的方法進行參數(shù)傳遞的時候是通過操作數(shù)棧進行的鄙币。在概念模型中肃叶,兩個棧幀是相互獨立的。但是大多數(shù)虛擬機的實現(xiàn)都會進行優(yōu)化十嘿,令兩個棧幀出現(xiàn)一部分重疊因惭。令下面的部分操作數(shù)棧與上面的局部變量表重疊在一塊,這樣在方法調用的時候可以共用一部分數(shù)據(jù)绩衷,無需進行額外的參數(shù)復制傳遞
動態(tài)鏈接
每個棧幀都包含一個執(zhí)行運行時常量池中該棧幀所屬方法的引用蹦魔,持有這個引用是為了支持方法調用過程中的動態(tài)鏈接
方法返回地址
當一個方法開始執(zhí)行以后,只有兩種方法可以退出當前方法:
- 當執(zhí)行遇到返回指令咳燕,會將返回值傳遞給上層的方法調用者勿决,這種退出的方式稱為正常完成出口,一般來說招盲,調用者的PC計數(shù)器可以作為返回地址
- 當執(zhí)行遇到一次低缩,并且當前方法體內沒有得到處理,就會導致方法退出宪肖,此時沒有返回值表制,稱為異常完成出口,返回地址要通過異常處理器表來確定
當方法返回時控乾,可能進行3個操作:
- 恢復上層方法的局部變量表和操作數(shù)棧
- 把返回值壓入調用者調用棧幀的操作數(shù)棧
- 調整PC計數(shù)器的值以指向方法調用指令后面的一條指令
本地方法棧
本地方法棧與虛擬機棧所發(fā)揮的作用是非常相似的么介,它們之間的區(qū)別不過是虛擬機棧為虛擬機執(zhí)行Java方法(也就是字節(jié)碼)服務,而本地的方法棧則為虛擬機使用到的Native方法服務蜕衡。在虛擬機規(guī)范中對本地方法棧中方法使用的語言壤短,使用方式和數(shù)據(jù)結構并沒有強制規(guī)定,因此具體的虛擬機可以自由實現(xiàn)它慨仿。甚至有的虛擬機(譬如 Sun HotSport虛擬機)直接就把本地方法棧和虛擬機棧合二為一久脯,本地方法棧區(qū)域也會拋出StackOverflowError和OutOfMemoryError異常
Java堆
對于大多數(shù)應用來說,Java堆是Java虛擬機所管理的內存中最大的一塊镰吆。Java堆是被所有線程共享的一塊內存區(qū)域帘撰,在虛擬機啟動時創(chuàng)建。此內存區(qū)域的唯一目的就是存放對象實例万皿,幾乎所有的對象實例都在這里分配內存摧找。
Java堆是垃圾收集管理器的主要區(qū)域。因此很多時候也被稱做“GC”堆牢硅。從內存回收的角度來看蹬耘,由于現(xiàn)在收集器基本都采用分代收集算法。所以Java堆中還可以細分為:新生代和老年代:再細致一點的有Eden空間减余、From Survivor空間综苔、ToSurvivor空間等,從內存分配的角度來看,線程共享的Java堆中可能劃分出多個線程私用的分配緩沖區(qū)如筛。不過無論如何如何劃分堡牡,都與存放內容無關,無論哪個區(qū)域杨刨,存儲的都任然是對象實例悴侵,進一步劃分的目的是為了更好地回收內存,或者更快地分配內存拭嫁。
Java堆可以處理物理上不連續(xù)的內存空間可免,只要邏輯上是連續(xù)的即可。如果在堆中沒有內存完成實例分配做粤,并且堆也無法再擴展時浇借,將會拋出OutOfMenoryError異常
方法區(qū)
方法區(qū)與Java堆一樣,是各個線程共享的內存區(qū)域怕品,它用于存儲已被虛擬機加載的類信息妇垢、常量、靜態(tài)變量肉康、即時編譯器編譯后的代碼等數(shù)據(jù)闯估,
方法區(qū)也叫永久代。在過去(自定義類加載器還不是很常見的時候)吼和,類大多是”static”的涨薪,很少被卸載或收集,因此被稱為“永久的(Permanent)”炫乓。雖然Java虛擬機規(guī)范把方法區(qū)描述為堆的一個邏輯部分刚夺,但是它卻有一個別名叫做Non-Heap(非堆),目的應該是與Java 堆區(qū)分開來末捣。同時侠姑,由于類class是JVM實現(xiàn)的一部分,并不是由應用創(chuàng)建的箩做,所以又被認為是“非堆(non-heap)”內存莽红。
運行時常量池
運行時常量池是方法區(qū)的一部分,Class文件中除了有類的版本邦邦、字段安吁、方法、接口等描述信息外們還有一項信息是常量池圃酵,用于存放編譯期生成的各種常量和符合引用柳畔,這部分內容將在類加載后進入方法區(qū)的運行時常量池中存放
直接內存
直接內存并不是虛擬機運行時數(shù)據(jù)區(qū)的一部分馍管,也不是Java虛擬機規(guī)范中定義的內存區(qū)域郭赐。在JDK1.4中新加入了MIO(New Input/Output)類,引入了一種基于通道(Channel)與緩沖區(qū)(Buffer)的I/O方式,他可以使用Native函數(shù)庫直接分配堆外內存捌锭,然后通過一個存儲在Java堆中的DirectByteBuffer對象作為這塊內存的引用進行操作俘陷。這樣能在一些場景中顯著提高性能,因此避免了在Java堆和Native堆中來回復制數(shù)據(jù)
new 一個對象 發(fā)生了什么观谦?
對象創(chuàng)建
Java是一門面向對象的編程語言拉盾,在Java程序運行過程中無時無刻都有對象被創(chuàng)建出來,在語言層面只是使用new關鍵字豁状,而在虛擬機中捉偏,對象的創(chuàng)建又是怎樣一個過程呢?
類加載檢查
虛擬機遇到一條new 指令時泻红,首先將去檢查這個指令的參數(shù)是否能在常量池中定位到一個類的符合引用夭禽,并且檢查這個符合引用代表的類是否已被加載、解析和初始化過谊路。如果沒有讹躯,那必須先執(zhí)行相應的類加載過程。對象分配內存
在類加載檢查通過后缠劝,接下來虛擬機將為新生對象分配內存潮梯。對象所需內存的大小在類加載完成后便可完全確定,為對象分配空間的任務等同于把一塊確定大小的內存從Java堆中劃分出來惨恭。根據(jù)Java堆中的內存是否規(guī)整秉馏,有2種處理方式。
- 指針碰撞(Bump the pointer)
Java堆中的內存是規(guī)整的脱羡,所有用過的內存都放在一邊沃饶,空閑的內存放在另一邊,中間放著一個指針作為分界點的指示器轻黑,分配內存也就是把指針向空閑空間那邊移動一段與內存大小相等的距離糊肤。例如:Serial、ParNew等收集器氓鄙。
- 空閑列表(Free List)
Java堆中的內存不是規(guī)整的馆揉,已使用的內存和空閑的內存相互交錯,就沒有辦法簡單的進行指針碰撞了抖拦。虛擬機必須維護一張列表升酣,記錄哪些內存塊是可用的,在分配的時候從列表中找到一塊足夠大的空間劃分給對象實例态罪,并更新列表上的記錄噩茄。例如:CMS這種基于Mark-Sweep算法的收集器。
- 并發(fā)處理
對象創(chuàng)建在虛擬機中是非常頻繁的行為复颈,即使是僅僅修改一個指針所指向的位置绩聘,在并發(fā)情況下也并不是線程安全的,可能出現(xiàn)正在給對象A分配內存,指針還沒來得及修改凿菩,對象B又同時使用了原來的指針來分配內存的情況机杜。處理方案有2種。
- 同步處理
對分配內存空間的動作進行同步處理衅谷,實際上虛擬機采用CAS配上失敗重試的方式保證更新操作的原子性
- TLAB
把內存分配的動作按照線程劃分在不同的空間之中進行椒拗,即每個線程在Java堆中預先分配一小塊內存,稱為本地線程分配緩沖(Thread Local Allocation Buffer获黔,TLAB)蚀苛。那個線程要分配內存,就在哪個線程的TLAB上分配玷氏,只有TLAB用完并分配新的TLAB時枉阵,才需同步鎖定。
- 內存空間初始化
虛擬機將分配到的內存空間都初始化為零值(不包括對象頭),如果使用了TLAB预茄,這一工作過程也可以提前至TLAB分配時進行兴溜。
內存空間初始化保證了對象的實例字段在Java代碼中可以不賦初始值就直接使用,程序能訪問到這些字段的數(shù)據(jù)類型所對應的零值耻陕。
- 對象設置
接下來拙徽,虛擬機要對對象進行必要的設置,例如這個對象是那個類的實例诗宣、如何才能找到類的元數(shù)據(jù)信息膘怕、對象的哈希碼、對象的GC分代年齡等信息召庞。這些信息存放在對象的對象頭中岛心。
- 執(zhí)行init()
在上面的工作都完成之后,從虛擬機的角度看篮灼,一個新的對象已經(jīng)產(chǎn)生了忘古。但是從Java程序的角度看,對象的創(chuàng)建才剛剛開始init()方法還沒有執(zhí)行诅诱,所有的字段都還是零髓堪。
所以,一般來說(由字節(jié)碼中是否跟隨invokespecial指令所決定)娘荡,執(zhí)行new指令之后會接著執(zhí)行init()方法干旁,把對象按照程序員的意愿進行初始化,這樣一個真正可用的對象才算產(chǎn)生出來炮沐。
對象內存布局
對象的內存結構又可以被分為:對象頭争群,實例數(shù)據(jù),對象填充大年。
- 對象頭
對象頭包括兩部分信息
第一部分用于存儲對象自身的運行時數(shù)據(jù)换薄, 如哈希碼(HashCode)玉雾、GC分代年齡、鎖狀態(tài)標志专控、線程持有的鎖、偏向線程ID遏餐、偏向時間戳等等伦腐,這部分數(shù)據(jù)的長度在32位和64位的虛擬機(暫 不考慮開啟壓縮指針的場景)中分別為32個和64個Bits,官方稱它為“Mark Word”失都。
存儲內容 | 標志位 | 狀態(tài) |
---|---|---|
對象哈希碼柏蘑、對象分代年齡 | 01 | 未鎖定 |
指向鎖記錄的指針 | 00 | 輕量級鎖定 |
指向重量級鎖的指針 | 10 | 膨脹(重量級鎖定) |
空,不需要記錄信息 | 11 | GC標記 |
偏向線程ID粹庞、偏向時間戳咳焚、對象分代年齡 | 01 | 可偏向 |
第二部分是類型指針,即是對象指向它的類的元數(shù)據(jù)的指針庞溜,虛擬機通過這個指針來確定這個對象是哪個類的實例
- 實例數(shù)據(jù)
對象真正存儲的有效信息革半,也是在程序代碼中定義的各種類型字段內容。無論是從父類繼承下來的還是子類定義的流码,都需要記錄下來又官。
- 對象填充
沒有實際意義,僅僅起著占位符的作用漫试。以為對象的大小必須是8字節(jié)的整數(shù)倍六敬。
對象訪問定位
建立對象是為了使用對象,我們的Java程序需要通過棧上的reference數(shù)據(jù)來操作堆上的具體對象驾荣。由于在Java虛擬機規(guī)范里面只規(guī)定了reference類型是一個指向對象的引用外构,并沒有定義這個引用應該通過什么種方式去定位、訪問到堆中的對象的具體位置播掷,對象訪問方式也是取決于虛擬機實現(xiàn)而定的审编。主流的訪問方式有使用句柄和直接指針兩種。
- 句柄訪問
如果使用句柄訪問的話歧匈,Java堆中將會劃分出一塊內存來作為句柄池割笙,reference中存儲的就是對象的句柄地址,而句柄中包含了對象實例數(shù)據(jù)與類型數(shù)據(jù)的具體各自的地址信息眯亦。
- 指針訪問對象
使用直接指針訪問的話伤溉,Java堆對象的布局中就必須考慮如何放置訪問類型數(shù)據(jù)的相關信息,reference中存儲的直接就是對象地址
這兩種對象訪問方式各有優(yōu)勢妻率,使用句柄來訪問的最大好處就是reference中存儲的是穩(wěn)定句柄地址乱顾,在對象被移動(垃圾收集時移動對象是非常普遍的行為)時只會改變句柄中的實例數(shù)據(jù)指針,而reference本身不需要被修改宫静。
使用直接指針來訪問最大的好處就是速度更快走净,它節(jié)省了一次指針定位的時間開銷券时,由于對象訪問的在Java中非常頻繁,因此這類開銷積小成多也是一項非撤可 觀的執(zhí)行成本橘洞。從上一部分講解的對象內存布局可以看出,就虛擬機HotSpot而言说搅,它是使用第二種方式進行對象訪問炸枣,但在整個軟件開發(fā)的范圍來看,各種 語言弄唧、框架中使用句柄來訪問的情況也十分常見
參考
本文主要參考《深入理解Java虛擬機:JVM高級特性與最佳實踐》后的學習筆記及總結