1.1 概述
對(duì)于Java程序員來(lái)說(shuō), 在虛擬機(jī)自動(dòng)內(nèi)存管理機(jī)制的幫助下, 不再需要為每一個(gè)new操作去寫(xiě)配對(duì)的delete/free代碼, 不容易出現(xiàn)內(nèi)存泄漏和內(nèi)存溢出的問(wèn)題, 由虛擬機(jī)管理內(nèi)存這一切看起來(lái)都十分美好. 不過(guò), 也正是因?yàn)镴ava程序員把內(nèi)存控制的權(quán)利交給了Java虛擬機(jī), 一旦出現(xiàn)內(nèi)存泄露和溢出方面的問(wèn)題, 如果不了解虛擬機(jī)是怎樣使用內(nèi)存的, 那么排查錯(cuò)誤將會(huì)成為一項(xiàng)異常艱難的工作.
1.2 運(yùn)行時(shí)數(shù)據(jù)區(qū)域
Java虛擬機(jī)在執(zhí)行Java程序的過(guò)程中會(huì)把它所管理的內(nèi)存劃分為若干個(gè)不同的數(shù)據(jù)區(qū)域, 這些數(shù)據(jù)區(qū)域都有各自不同的用途, 以及創(chuàng)建和銷(xiāo)毀的時(shí)間, 有的區(qū)域隨著虛擬機(jī)進(jìn)程的啟動(dòng)而存在, 有些區(qū)域則依賴(lài)用戶(hù)線程的啟動(dòng)和結(jié)束而建立和銷(xiāo)毀. 根據(jù)《Java虛擬機(jī)規(guī)范(Java SE7版)》的規(guī)定, Java虛擬機(jī)所管理的內(nèi)存將會(huì)包括以下幾個(gè)運(yùn)行時(shí)數(shù)據(jù)區(qū)域. 如圖
1.2.1 程序計(jì)數(shù)器
程序計(jì)數(shù)器(Program Counter Register)是一塊較小的內(nèi)存空間, 它可以看作是當(dāng)前線程所執(zhí)行的字節(jié)碼行號(hào)指示器. 在虛擬機(jī)的概念模型里(僅是概念模型, 各種虛擬機(jī)可能會(huì)通過(guò)一些更高效的方式實(shí)現(xiàn)), 字節(jié)碼解釋器工作時(shí)就是通過(guò)改變這個(gè)計(jì)數(shù)器的值來(lái)選取下一條需要執(zhí)行的字節(jié)碼指令, 分支, 循環(huán), 跳轉(zhuǎn), 異常處理, 線程恢復(fù)等基礎(chǔ)功能都需要依賴(lài)這個(gè)計(jì)數(shù)器來(lái)完成.
由于Java虛擬機(jī)的多線程的實(shí)現(xiàn)是通過(guò)線程輪流切換并分配處理器執(zhí)行時(shí)間的方式來(lái)實(shí)現(xiàn)的, 在任何一個(gè)確定的時(shí)間, 一個(gè)處理器(對(duì)于多核處理器來(lái)說(shuō)是一個(gè)內(nèi)核)都只會(huì)執(zhí)行一條線程中的指令. 因此, 為了線程切換后能恢復(fù)到正確的執(zhí)行位置, 每條線程都需要有一個(gè)獨(dú)立的程序計(jì)數(shù)器, 各條線程之間的計(jì)數(shù)器互相不受影響, 獨(dú)立存儲(chǔ), 我們稱(chēng)這類(lèi)內(nèi)存區(qū)域?yàn)?線程私有"的內(nèi)存.
如果線程正在執(zhí)行的是一個(gè)Java方法, 這個(gè)計(jì)數(shù)器記錄的是正在執(zhí)行的虛擬機(jī)字節(jié)碼指令的地址; 如果正在執(zhí)行的是Native方法, 這個(gè)計(jì)數(shù)器值則為空(Undefined). 此內(nèi)存區(qū)域是唯一一個(gè)在Java虛擬機(jī)規(guī)范中沒(méi)有規(guī)定任何OutOfMemoryError
情況的區(qū)域.
1.2.2 Java虛擬機(jī)棧
與程序計(jì)數(shù)器一樣, Java虛擬機(jī)棧(Java Virtual Machine Stacks)也是線程私有的, 它的生命周期與線程相同. 虛擬機(jī)棧描述的是Java方法執(zhí)行的內(nèi)存模型: 每個(gè)方法在執(zhí)行的同時(shí)都會(huì)創(chuàng)建一個(gè)棧幀(Stack Frame)用于存儲(chǔ)局部變量表, 操作數(shù)棧, 動(dòng)態(tài)鏈接, 方法出口等信息. 每一個(gè)方法從調(diào)用直至執(zhí)行完成的過(guò)程, 就對(duì)應(yīng)一個(gè)棧幀在虛擬機(jī)棧中入棧與出棧的過(guò)程.
經(jīng)常有人把Java內(nèi)存分為堆內(nèi)存(Heap)和棧內(nèi)存(Stack), 這種方法比較粗糙, Java內(nèi)存區(qū)域的劃分實(shí)際上遠(yuǎn)比這復(fù)雜. 這種劃分方式的流行只能說(shuō)明大多數(shù)程序員最關(guān)注的, 與對(duì)象內(nèi)存分配關(guān)系最密切的內(nèi)存區(qū)域是這兩塊. 其中所指的"堆"會(huì)在后面專(zhuān)門(mén)講述, 而所指的"棧"就是現(xiàn)在所講的虛擬機(jī)棧, 或者說(shuō)是虛擬機(jī)棧中局部變量表部分.
局部變量表存放了編譯期可知的各種基本數(shù)據(jù)類(lèi)型(boolean, byte, char, short, int, float, long, double), 對(duì)象引用(reference類(lèi)型, 它不等同于對(duì)象本身, 可能是一個(gè)指向?qū)ο笃鹗嫉刂返囊弥羔? 也可能是指向一個(gè)代表對(duì)象句柄或其他與此對(duì)象相關(guān)的位置)和returnAddress類(lèi)型(指向了一條字節(jié)碼指令的地址).
其中64位長(zhǎng)度的long和double類(lèi)型的數(shù)據(jù)會(huì)占用2個(gè)局部變量空間(Slot), 其余的數(shù)據(jù)類(lèi)型之占用1個(gè). 局部變量表所需的內(nèi)存空間在編譯期完成分配, 當(dāng)進(jìn)入一個(gè)方法時(shí), 這個(gè)方法需要在棧中分配多大的局部變量空間是完全確定的, 在方法運(yùn)行期間是不會(huì)改變局部變量表的大小.
在Java虛擬機(jī)規(guī)范中, 對(duì)這個(gè)區(qū)域規(guī)定了兩種異常狀況: 如果線程請(qǐng)求的棧深度大于虛擬機(jī)所允許的深度, 將拋出StackOverfloatError
異常; 如果虛擬機(jī)椣栌疲可以動(dòng)態(tài)擴(kuò)展(當(dāng)前大部分的Java虛擬機(jī)都可以動(dòng)態(tài)擴(kuò)展, 只不過(guò)Java虛擬機(jī)規(guī)范中也允許固定長(zhǎng)度的虛擬機(jī)棧), 如果擴(kuò)展時(shí)無(wú)法申請(qǐng)足夠的內(nèi)存, 就會(huì)拋出OutOfMemoryError
異常.
1.2.3 本地方法棧
本地方法棧(Native Method Stack)與虛擬機(jī)棧所發(fā)揮的作用非常相似, 它們的區(qū)別不過(guò)是虛擬機(jī)棧為虛擬機(jī)執(zhí)行Java方法(也就是字節(jié)碼)服務(wù), 而本地方法棧則為虛擬機(jī)使用到的Native方法服務(wù). 在虛擬機(jī)規(guī)范中對(duì)本地方法棧中方法是用的語(yǔ)言, 使用方法與數(shù)據(jù)結(jié)構(gòu)并沒(méi)有強(qiáng)制規(guī)定, 因此具體的虛擬機(jī)可以自由實(shí)現(xiàn)它. 甚至有的虛擬機(jī)(譬如Sun HotSpot虛擬機(jī))直接就把本地方法棧和虛擬機(jī)棧合二為一. 與虛擬機(jī)棧一樣, 本地方法棧區(qū)域也會(huì)拋出StackOverfloorError
和OutOfMemoryError
異常.
1.2.4 Java堆
對(duì)于大多數(shù)應(yīng)用來(lái)說(shuō), Java堆(Java Heap)是Java虛擬機(jī)所管理的內(nèi)存中最大的一塊. Java堆是被所有線程共享的一塊內(nèi)存區(qū)域, 在虛擬機(jī)啟動(dòng)時(shí)創(chuàng)建. 此內(nèi)存區(qū)域的唯一目的就是存放對(duì)象實(shí)例, 幾乎所有的對(duì)象實(shí)例都是在這里分配內(nèi)存. 這一點(diǎn)在Java虛擬機(jī)規(guī)范中描述是: 所有的對(duì)象實(shí)例以及數(shù)組都要在堆上分配, 但隨著JIT編譯器的發(fā)展與逃逸分析技術(shù)逐漸成熟, 棧上分配, 標(biāo)量替換優(yōu)化技術(shù)將會(huì)導(dǎo)致一些微妙的變化發(fā)生, 所有的對(duì)象都分配在堆上也漸漸變得不是那么"絕對(duì)"了.
Java堆是垃圾收集器管理的主要區(qū)域, 因此很多時(shí)候也被稱(chēng)作"GC堆"(Garbage Collected Heap), 從內(nèi)存回收的角度來(lái)看, 由于現(xiàn)有的收集器基本都采用分代收集算法,所以Java堆還可以細(xì)分為: 新生代和老年代; 再細(xì)致一點(diǎn)的有Eden空間, From Survivor空間, To Survivor空間等. 從內(nèi)存分配的角度來(lái)看, 線程共享的Java堆中可能劃分出多個(gè)線程私有的分配緩沖區(qū)(Thread Local Allocation Buffer, TLAB). 不過(guò)無(wú)論如何劃分, 都與存放內(nèi)容無(wú)關(guān), 無(wú)論哪個(gè)區(qū)域, 存儲(chǔ)的都是對(duì)象實(shí)例, 進(jìn)一步劃分的目的是為了更好地回收內(nèi)存, 或者更快地分配內(nèi)存.
根據(jù)Java虛擬機(jī)規(guī)范的規(guī)定, Java堆可以處于物理上不連續(xù)的內(nèi)存空間中, 只要邏輯上是連續(xù)的即可, 就像我們的磁盤(pán)空間一樣. 在實(shí)現(xiàn)時(shí), 既可以實(shí)現(xiàn)成固定大小的, 也可以是可擴(kuò)展的, 不過(guò)當(dāng)前主流的虛擬機(jī)都是按照可擴(kuò)展來(lái)實(shí)現(xiàn)的(通過(guò)-Xmx和-Xms控制). 如果在堆上沒(méi)有內(nèi)存完成實(shí)例分配, 并且堆也無(wú)法擴(kuò)展時(shí), 將拋出OutOfMemoryError
異常.
1.2.5 方法區(qū)
方法區(qū)(Method Area)與Java堆一樣, 是各個(gè)線程共享的內(nèi)存區(qū)域, 它用于存儲(chǔ)已被虛擬機(jī)加載的類(lèi)信息, 常量, 靜態(tài)變量, 即時(shí)編譯器編譯后的代碼等數(shù)據(jù). 雖然Java虛擬機(jī)規(guī)范把方法區(qū)描述為堆上的一個(gè)邏輯部分, 但是它卻有一個(gè)別名叫做Non-Heap(非堆), 目的應(yīng)該是與Java堆區(qū)分開(kāi)來(lái).
Java虛擬機(jī)規(guī)范對(duì)方法區(qū)的限制非常寬松, 除了和Java堆一樣不需要連續(xù)的內(nèi)存和可以選擇固定大小或者可擴(kuò)展外, 還可以選擇不實(shí)現(xiàn)垃圾收集. 相對(duì)而言, 垃圾收集行為在這個(gè)區(qū)域是比較少出現(xiàn)的, 但并非數(shù)據(jù)進(jìn)入了方法區(qū)就如永久代的名字一樣"永久"存在了.這區(qū)域的內(nèi)存回收目標(biāo)主要是針對(duì)常量池的回收和對(duì)類(lèi)型的卸載, 一般來(lái)說(shuō), 這個(gè)區(qū)域的回收"成績(jī)"比較難以令人滿(mǎn)意, 尤其是類(lèi)型的卸載, 條件相當(dāng)苛刻, 但是這部分區(qū)域的回收確實(shí)是必要的.
根據(jù)Java虛擬機(jī)規(guī)范的規(guī)定, 當(dāng)方法區(qū)無(wú)法滿(mǎn)足內(nèi)存分配的需求時(shí), 將拋出OutOfMemoryError
異常.
1.2.6 運(yùn)行時(shí)常量池
運(yùn)行時(shí)常量池(Runtime Constant Pool)是方法區(qū)的一部分. Class文件中除了有類(lèi)的版本, 字段, 方法, 接口等描述信息外, 還有一項(xiàng)信息是常量池(Constant Pool Table), 用于存放編譯期生成的各種字面量和符號(hào)引用, 這部分內(nèi)容將在類(lèi)加載后進(jìn)入方法區(qū)的運(yùn)行時(shí)常量池中存放.
Java虛擬機(jī)對(duì)Class文件的每一部分(也包括常量池)的格式都有嚴(yán)格規(guī)定, 每一個(gè)字節(jié)用于存儲(chǔ)哪種數(shù)據(jù)類(lèi)型都必須符合規(guī)范上的要求才會(huì)被虛擬機(jī)認(rèn)可, 裝載和執(zhí)行, 但對(duì)于運(yùn)行時(shí)常量池, Java虛擬機(jī)規(guī)范沒(méi)有做任何細(xì)節(jié)的要求, 不同的提供商實(shí)現(xiàn)的虛擬機(jī)可以按照自己的需求來(lái)實(shí)現(xiàn)這個(gè)內(nèi)存區(qū)域. 不過(guò), 一般來(lái)說(shuō), 除了保存Class文件中描述的符號(hào)引用外, 還會(huì)把翻譯出來(lái)的直接引用也存儲(chǔ)在運(yùn)行時(shí)常量池中.
運(yùn)行時(shí)常量池相對(duì)于Class文件常量池的另外一個(gè)重要特征是具備動(dòng)態(tài)性, Java語(yǔ)言并不要求常量一定只有編譯期才能產(chǎn)生, 也就是并非預(yù)置入Class文件中常量池的內(nèi)容才能進(jìn)入方法區(qū)運(yùn)行時(shí)常量池, 運(yùn)行期間也可能將新的常量放入池中, 這種特性被開(kāi)發(fā)人員利用得比較多的便是String類(lèi)的intern()方法.
既然運(yùn)行時(shí)常量池是方法區(qū)的一部分, 自然受到方法區(qū)內(nèi)存的限制, 當(dāng)常量池?zé)o法再申請(qǐng)到內(nèi)存時(shí)會(huì)拋出OutOfMemoryError
異常.
1.2.7直接內(nèi)存
直接內(nèi)存(Direct Memory)并不是虛擬機(jī)運(yùn)行時(shí)數(shù)據(jù)區(qū)的一部分, 也不是Java虛擬機(jī)規(guī)范中定義的內(nèi)存區(qū)域. 但是這部分內(nèi)存也被頻繁地使用, 而且也可能導(dǎo)致OutOfMemoryError
異常出現(xiàn).
在JDK 1.4中新加入了NIO(New Input/Output)類(lèi), 引入了一種基于通道(Channel)與緩沖區(qū)(Buffer)的I/O方式, 它可以使用Native函數(shù)庫(kù)直接分配堆內(nèi)存, 然后通過(guò)一個(gè)存儲(chǔ)在Java堆中的DirectByteBuffer對(duì)象作為這塊內(nèi)存的引用進(jìn)行操作. 這樣能在一些場(chǎng)景中顯著提高性能, 因?yàn)楸苊饬嗽贘ava堆和Native堆中來(lái)回復(fù)制數(shù)據(jù).
顯然, 本機(jī)直接內(nèi)存的分配不會(huì)受到Java堆大小的限制, 但是, 既然是內(nèi)存, 肯定還是受到本機(jī)總內(nèi)存(包括RAM以及SWAP區(qū)或者分頁(yè)文件)大小以及處理器尋址空間的限制. 服務(wù)器管理員在配置虛擬機(jī)參數(shù)時(shí), 會(huì)根據(jù)實(shí)際內(nèi)存設(shè)置-Xmx等參數(shù)信息, 但經(jīng)常忽略直接內(nèi)存, 使得各個(gè)內(nèi)存區(qū)域總和大于物理內(nèi)存限制(包括物理的和操作系統(tǒng)級(jí)別的限制), 從而導(dǎo)致動(dòng)態(tài)擴(kuò)展時(shí)出現(xiàn)OutOfMemoryError
異常.