Java內(nèi)存區(qū)域與內(nèi)存溢出異常
Java和C++之間有一堵由內(nèi)存動(dòng)態(tài)分配和垃圾手機(jī)技術(shù)所圍成的高墻榜晦,墻外面的人想進(jìn)去,墻里面的人卻想出來(lái)羽圃。
概述
對(duì)于從事C和C++程序開(kāi)發(fā)的開(kāi)發(fā)人員來(lái)說(shuō)乾胶,在內(nèi)存管理領(lǐng)域,他們即是擁有最高權(quán)力的皇帝朽寞,又是從事最基礎(chǔ)工作的勞動(dòng)人民——既有用每一個(gè)對(duì)象的“所有權(quán)”识窿,又擔(dān)負(fù)著每個(gè)對(duì)象生命開(kāi)始到終結(jié)的維護(hù)責(zé)任。
對(duì)Java程序員來(lái)說(shuō)脑融,在虛擬機(jī)的自動(dòng)內(nèi)存管理機(jī)制的幫助下喻频,不再需要為每一個(gè)new操作去寫(xiě)配對(duì)的delete/free代碼,而且不容易出現(xiàn)內(nèi)存泄漏和內(nèi)存溢出問(wèn)題肘迎,看起來(lái)由虛擬機(jī)管理內(nèi)存一切都很美好甥温。不過(guò),也正是因?yàn)镴ava程序員把內(nèi)存控制的權(quán)利交給了Java虛擬機(jī)妓布,一旦出現(xiàn)內(nèi)存泄漏和溢出方面的問(wèn)題姻蚓,如果不了解迅即是怎樣使用內(nèi)存的,那排查錯(cuò)誤將會(huì)稱(chēng)為一項(xiàng)異常艱難的工作匣沼。
運(yùn)行時(shí)數(shù)據(jù)區(qū)域
Java虛擬機(jī)在執(zhí)行Java程序的過(guò)程中會(huì)把它所管理的內(nèi)存劃分成為若干個(gè)不同的數(shù)據(jù)區(qū)域狰挡。根據(jù)《Java虛擬機(jī)規(guī)范(第2版)》的規(guī)定,Java虛擬機(jī)所管理的內(nèi)存將會(huì)包括以下幾個(gè)運(yùn)行時(shí)數(shù)據(jù)區(qū)域。
程序計(jì)數(shù)器
程序計(jì)數(shù)器(Program Counter Register)是一塊較小的內(nèi)存空間圆兵,它的作用可以看做是當(dāng)前線程所執(zhí)行的字節(jié)碼的行號(hào)指示器跺讯。在虛擬機(jī)的概念模型里,字節(jié)碼解釋器工作時(shí)就是通過(guò)改變這個(gè)計(jì)數(shù)器的值來(lái)選區(qū)下一條需要執(zhí)行的字節(jié)碼指令殉农,分支刀脏、循環(huán)、跳轉(zhuǎn)超凳、異常處理愈污、線程恢復(fù)等基礎(chǔ)功能都需要依賴(lài)這個(gè)計(jì)數(shù)器來(lái)完成。
由于Java虛擬機(jī)的多線程是通過(guò)線程輪流切換并分配處理器執(zhí)行時(shí)間的方式來(lái)實(shí)現(xiàn)的轮傍,在任何一個(gè)確定的時(shí)刻暂雹,一個(gè)處理器(對(duì)于多核處理器來(lái)說(shuō)是一個(gè)內(nèi)核)只會(huì)執(zhí)行一條線程中的指令。因此创夜,為了線程切換后能恢復(fù)到正確的執(zhí)行位置杭跪,每條線程都需要有一個(gè)獨(dú)立的程序計(jì)數(shù)器,各條線程之間的計(jì)數(shù)器互不影響驰吓,獨(dú)立存儲(chǔ)涧尿,我們稱(chēng)這類(lèi)內(nèi)存區(qū)域?yàn)椤?strong>線程私有”的內(nèi)存。
如果線程正在執(zhí)行的是一個(gè)Java方法檬贰,這個(gè)計(jì)數(shù)器記錄的是正在執(zhí)行的虛擬機(jī)字節(jié)碼指令的地址姑廉;如果正在執(zhí)行的是Natvie方法,這個(gè)計(jì)數(shù)器則為空(Undefined)翁涤。此內(nèi)存區(qū)域是唯一一個(gè)在Java虛擬機(jī)規(guī)范中沒(méi)有規(guī)定任何OutOfMemoryError情況的區(qū)域桥言。
Java虛擬機(jī)棧
與程序計(jì)數(shù)器一樣,Java虛擬機(jī)棧(Java Virtual Machine Stacks)也是線程私有的葵礼,它的生命周期與線程相同号阿。虛擬機(jī)棧描述的是Java方法執(zhí)行的內(nèi)存模型:每個(gè)方法被執(zhí)行的時(shí)候都會(huì)同時(shí)創(chuàng)建一個(gè)棧幀(Stack Frame)(棧幀是方法運(yùn)行期的基礎(chǔ)數(shù)據(jù)結(jié)構(gòu))用于存儲(chǔ)局部變量表、操作棧鸳粉、動(dòng)態(tài)鏈接倦西、方法出口等信息。每一個(gè)方法被調(diào)用直至執(zhí)行完成的過(guò)程赁严,就對(duì)應(yīng)著一個(gè)棧幀在虛擬機(jī)棧中從入棧到出棧的過(guò)程。
局部變量表存放了編譯期可知的各種基本數(shù)據(jù)類(lèi)型(boolean粉铐、byte疼约、char、short蝙泼、int程剥、float、long、double)织鲸、對(duì)象引用(reference類(lèi)型舔腾,它不等同于對(duì)象本身,根據(jù)不同的虛擬機(jī)實(shí)現(xiàn)搂擦,它可能是一個(gè)指向?qū)ο笃鹗嫉刂返囊弥羔樜瘸希部赡苤赶蛞粋€(gè)代表對(duì)象的句柄或者其他的與此對(duì)象相關(guān)的位置)和returnAddress類(lèi)型(指向了一條字節(jié)碼指令的地址)。其中64位長(zhǎng)度的long和double類(lèi)型的數(shù)據(jù)會(huì)占用2個(gè)局部變量空間(Slot)瀑踢,其余的數(shù)據(jù)類(lèi)型只占用1個(gè)扳还。
局部變量表所需的內(nèi)存空間在編譯期間完成分配,當(dāng)進(jìn)入一個(gè)方法時(shí)橱夭,這個(gè)方法需要在幀中分配多大的局部變量空間是完全確定的氨距,在方法運(yùn)行期間不會(huì)改變局部變量表的大小。
在Java虛擬機(jī)規(guī)范中棘劣,對(duì)這個(gè)區(qū)域規(guī)定了兩種異常狀況:
- 如果線程請(qǐng)求的棧深度大于虛擬機(jī)所允許的深度俏让,將拋出StackOverflowError異常;
- 如果虛擬機(jī)棽缦荆可以動(dòng)態(tài)擴(kuò)展(當(dāng)前大部分的Java虛擬機(jī)都可動(dòng)態(tài)擴(kuò)展首昔,只不過(guò)Java虛擬機(jī)規(guī)范中允許固定長(zhǎng)度的虛擬機(jī)棧),當(dāng)擴(kuò)展時(shí)無(wú)法申請(qǐng)到足夠的內(nèi)存時(shí)會(huì)拋出OutOfMemoryError異常而钞。
本地方法棧
本地方法棧(Natvive Method Stacks)與虛擬機(jī)棧所發(fā)揮的作用是非常相似的沙廉,其區(qū)別不過(guò)是虛擬機(jī)棧為虛擬機(jī)執(zhí)行Java方法(也就是字節(jié)碼)服務(wù),而本地方法棧則是為虛擬機(jī)使用到的Native方法服務(wù)臼节。
Java堆
對(duì)于大多數(shù)應(yīng)用來(lái)說(shuō)撬陵,Java堆(Java Heap)是Java虛擬機(jī)所管理的內(nèi)存中最大的一塊。Java堆是被所有線程共享的一塊內(nèi)存區(qū)域网缝,在虛擬機(jī)啟動(dòng)時(shí)創(chuàng)建巨税。此內(nèi)存區(qū)域的唯一目的就是存放對(duì)象實(shí)例,幾乎所有對(duì)象實(shí)例都在這里分配內(nèi)存粉臊。這一點(diǎn)在Java虛擬機(jī)規(guī)范中的描述是:所有的對(duì)象實(shí)例以及數(shù)組都要在堆上分配草添,但是隨著JIT編譯器的發(fā)展與逃逸分析技術(shù)的逐漸成熟,棧上分配扼仲、標(biāo)量替換優(yōu)化技術(shù)將會(huì)導(dǎo)致一些微妙的變化發(fā)生远寸,所有的對(duì)象都分配在堆上也漸漸變得不是那么“絕對(duì)”了。
Java堆是垃圾收集器管理的主要區(qū)域屠凶,因此很多時(shí)候也被稱(chēng)為“GC堆”(Garbage Collected Heap)驰后。如果從內(nèi)存回收的角度看,由于現(xiàn)在收集器基本都是采用的分代收集算法矗愧,所以Java堆中還可以細(xì)分為:新生代和老年代灶芝;如果從內(nèi)存分配的角度看,線程共享的Java堆中可能劃分出多個(gè)線程私有的分配緩沖區(qū)(Thread Local Allocation Buffer,TLAB)夜涕。不過(guò)犯犁,無(wú)論如何劃分,都與存放內(nèi)容無(wú)關(guān)女器,無(wú)論那個(gè)區(qū)域酸役,存儲(chǔ)的都仍然是對(duì)象實(shí)例,進(jìn)一步劃分的目的是為了更好地回收內(nèi)存晓避,或者更快的分配內(nèi)存簇捍。
根據(jù)Java虛擬機(jī)規(guī)范的規(guī)定,Java堆可以處于物理上不連續(xù)地內(nèi)存空間中俏拱,只要邏輯上是連續(xù)地的即可暑塑,就像我們的磁盤(pán)空間一樣。
方法區(qū)
方法區(qū)(Method Area)與Java堆一樣锅必,是各個(gè)線程共享的內(nèi)存區(qū)域事格,它用于存儲(chǔ)已被虛擬機(jī)加載的類(lèi)信息、常量搞隐、靜態(tài)變量驹愚、即時(shí)編譯器編譯后的代碼等數(shù)據(jù)。雖然Java虛擬機(jī)規(guī)范把方法區(qū)描述為堆的一個(gè)邏輯部分劣纲,但是它卻有一個(gè)別名叫做Non-Heap(非堆)逢捺,目的應(yīng)該是與Java堆區(qū)分開(kāi)來(lái)。
Java虛擬機(jī)規(guī)范對(duì)這個(gè)區(qū)域的限制非常寬松癞季,除了和Java堆一樣不需要連續(xù)的內(nèi)存和可以選擇固定大小或者可擴(kuò)展外劫瞳,還可以選擇不實(shí)現(xiàn)垃圾收集。這個(gè)區(qū)域的內(nèi)存回收目標(biāo)主要是針對(duì)常量池的回收和對(duì)類(lèi)型的卸載绷柒,一般來(lái)說(shuō)這個(gè)區(qū)域的回收“成績(jī)”比較難以令人滿(mǎn)意志于,尤其是類(lèi)型的卸載,條件相當(dāng)苛刻废睦,但是這部分區(qū)域的回收確實(shí)是有必要的伺绽。
根據(jù)Java虛擬機(jī)規(guī)范的規(guī)定,當(dāng)方法區(qū)無(wú)法滿(mǎn)足內(nèi)存分配需求時(shí)嗜湃,將拋出OutOfMemoryError異常奈应。
運(yùn)行時(shí)常量池
運(yùn)行時(shí)常量池(Runtime Constant Pool)是方法區(qū)的一部分。Class文件中除了有類(lèi)的版本购披、字段钥组、方法、接口等描述等信息外今瀑,還有一項(xiàng)信息是常量池(Constant Pool Table),用于存放編譯期生成的各種字面量和符號(hào)引用,這部分內(nèi)容將在類(lèi)加載后存放到方法區(qū)的運(yùn)行時(shí)常量池中橘荠。
一般來(lái)說(shuō)屿附,除了保存Class文件中描述的符號(hào)引用外,還會(huì)把翻譯出來(lái)的直接引用也存儲(chǔ)在運(yùn)行時(shí)常量池中哥童。
運(yùn)行時(shí)常量池相對(duì)于Class文件常量池的另外一個(gè)重要特征時(shí)具備動(dòng)態(tài)性挺份,Java語(yǔ)言并不要求常量一定只能在編譯器產(chǎn)生,也就是并非預(yù)置入Class文件中常量池的內(nèi)容才能進(jìn)入方法區(qū)運(yùn)行時(shí)常量池贮懈,運(yùn)行期間也可能將新的常量放入池中匀泊,這種特性被開(kāi)發(fā)人員利用的比較多的便是String類(lèi)的intern()方法。
當(dāng)常量池?zé)o法在申請(qǐng)到內(nèi)存時(shí)會(huì)拋出OutOfMemoryError異常朵你。
直接內(nèi)存
直接內(nèi)存(Direct Memory)并不是虛擬機(jī)運(yùn)行時(shí)數(shù)據(jù)區(qū)的一部分各聘,也不是虛擬機(jī)規(guī)范中定義的內(nèi)存區(qū)域,但是這部分內(nèi)存也被頻繁地使用抡医,而且也可能導(dǎo)致OutOfMemoryError異常出現(xiàn)躲因。
在JDK1.4中新加入了NIO(New Input/Oupt)類(lèi),引入了一種基于通道(Channel)與緩沖區(qū)(Buffer)的I/O方式忌傻,它可以使用Native函數(shù)庫(kù)直接分配堆外內(nèi)存大脉,然后通過(guò)一個(gè)存儲(chǔ)在Java堆里面的DirectByteBuffer對(duì)象作為這塊內(nèi)存的引用進(jìn)行操作。這樣能在一些場(chǎng)景中顯著提高性能水孩,因?yàn)楸苊饬嗽贘ava堆和Native堆中來(lái)回復(fù)制數(shù)據(jù)镰矿。
顯然,本地直接內(nèi)存的分配不會(huì)受到Java堆大小的限制俘种,但是秤标,既然是內(nèi)存,則肯定還是會(huì)受到本機(jī)總內(nèi)存(包括RAM及SWAP區(qū)或者分頁(yè)文件)的大小及處理器尋址空間的限制安疗。服務(wù)器管理員配置虛擬機(jī)參數(shù)時(shí)抛杨,一般會(huì)根據(jù)實(shí)際內(nèi)存設(shè)置-Xmx等參數(shù)信息,但經(jīng)常會(huì)忽略掉直接內(nèi)存荐类,使得各個(gè)內(nèi)存區(qū)域的總和大于物理內(nèi)存限制(包括物理上的和操作系統(tǒng)級(jí)的限制)怖现,從而導(dǎo)致動(dòng)態(tài)擴(kuò)展時(shí)出現(xiàn)OutOfMemoryError異常。
對(duì)象訪問(wèn)
在Java語(yǔ)言中玉罐,對(duì)象訪問(wèn)是如何進(jìn)行的屈嗤?
對(duì)象訪問(wèn)在Java語(yǔ)言中無(wú)處不在,是最普遍的程序行為吊输,但即使是最簡(jiǎn)單的訪問(wèn)饶号,也會(huì)卻涉及Java棧、Java堆季蚂、方法區(qū)這三個(gè)最重要內(nèi)存區(qū)域之間的關(guān)聯(lián)關(guān)系茫船,如下面的這句代碼:
Object obj = new Object();l
假設(shè)這句代碼出現(xiàn)在方法體中琅束,那”O(jiān)bject obj“這部分的語(yǔ)義將會(huì)反映到Java棧的本地變量表中,作為一個(gè)reference類(lèi)型數(shù)據(jù)出現(xiàn)算谈。而”new Object()“這部分的語(yǔ)義將會(huì)反映到Java堆中涩禀,形成一塊存儲(chǔ)了Object類(lèi)型所有實(shí)例數(shù)據(jù)值(Instance Date,對(duì)象中各個(gè)實(shí)例字段的數(shù)據(jù))的結(jié)構(gòu)化內(nèi)存然眼,根據(jù)具體類(lèi)型以及虛擬機(jī)實(shí)現(xiàn)的對(duì)象內(nèi)存布局(Object Memory Layout)的不同艾船,這塊內(nèi)存的長(zhǎng)度是不固定的。另外高每,在Java堆中還必須包含能夠找到此對(duì)象類(lèi)型數(shù)據(jù)(如對(duì)象類(lèi)型屿岂、父類(lèi)、實(shí)現(xiàn)的接口鲸匿、方法等)的地址信息爷怀,這些類(lèi)型數(shù)據(jù)則存儲(chǔ)在方法區(qū)中。
由于reference類(lèi)型在Java虛擬機(jī)規(guī)范里面只規(guī)定了一個(gè)指向?qū)ο蟮囊蒙购В](méi)有定義這個(gè)引用應(yīng)該通過(guò)那種方式去定位霉撵,以及訪問(wèn)到Java堆中的對(duì)象的具體位置,因此不同虛擬機(jī)實(shí)現(xiàn)的對(duì)象訪問(wèn)方式會(huì)有所不同洪囤,主流的訪問(wèn)方式有兩種:使用句柄和直接指針徒坡。
- 如果使用句柄訪問(wèn)方式,Java堆中將會(huì)劃分出一塊內(nèi)存來(lái)作為句柄池瘤缩,reference中存儲(chǔ)的就是對(duì)象的句柄地址喇完,而句柄中包含了對(duì)象實(shí)例數(shù)據(jù)和類(lèi)型數(shù)據(jù)各自的具體地址信息,如圖所示
- 如果使用直接指針訪問(wèn)方式剥啤,Java堆對(duì)象的布局中就必須考慮如何放置訪問(wèn)類(lèi)型數(shù)據(jù)的相關(guān)信息锦溪,reference中直接存儲(chǔ)的就是對(duì)象地址,如圖所示
使用句柄訪問(wèn)方式的最大好處就是reference中存儲(chǔ)的是穩(wěn)定的句柄地址府怯,在對(duì)象被移動(dòng)(垃圾收集時(shí)移動(dòng)對(duì)象是非常普遍的行為)時(shí)只會(huì)改變句柄中的實(shí)例數(shù)據(jù)指針刻诊,而reference本身不需要被修改。
使用直接指針訪問(wèn)方式的最大好處就是速度更快牺丙,它節(jié)省了一次指針定位的時(shí)間開(kāi)銷(xiāo)则涯,由于對(duì)象的訪問(wèn)在Java中非常頻繁,因此這類(lèi)開(kāi)銷(xiāo)積少成多也是一些非吵宀荆可觀的執(zhí)行成本粟判。