引言 :棧耸峭、堆、常量池雖同屬 Java 內(nèi)存分配時(shí)操作的區(qū)域黔酥,但其適用范圍和功用卻大不相同。本文將深入
Java 核心洪橘,詳細(xì)講解 Java 內(nèi)存分配方面的知識(shí)跪者。
Java 內(nèi)存分配與管理是 Java 的核心技術(shù)之一,之前我們?cè)榻B過 Java 的內(nèi)存管理與內(nèi)存泄露以及 Java 垃圾回收方面的知識(shí)熄求,今天我們?cè)俅紊钊?Java 核心渣玲,詳細(xì)介紹一下 Java
在內(nèi)存分配方面的知識(shí)。一般 Java 在內(nèi)存分配時(shí)會(huì)涉及到以下區(qū)域:
◆寄存器:我們?cè)诔绦蛑袩o法控制
◆棧:存放基本類型的數(shù)據(jù)和對(duì)象的引用弟晚,但對(duì)象本身不存放在棧中忘衍,而是存放在堆中
◆堆:存放用 new 產(chǎn)生的數(shù)據(jù)
◆靜態(tài)域:存放在對(duì)象中用 static 定義的靜態(tài)成員
◆常量池:存放常量
◆非 RAM 存儲(chǔ):硬盤等永久存儲(chǔ)空間
Java 內(nèi)存分配中的棧
在函數(shù)中定義的一些基本類型的變量數(shù)據(jù)和對(duì)象的引用變量都在函數(shù)的棧內(nèi)存中分配逾苫。
當(dāng)在一段代碼塊定義一個(gè)變量時(shí),Java 就在棧中 為這個(gè)變量分配內(nèi)存空間枚钓,當(dāng)該變量退出
該作用域后铅搓,Java 會(huì)自動(dòng)釋放掉為該變量所分配的內(nèi)存空間,該內(nèi)存空間可以立即被另作
他用搀捷。
Java 內(nèi)存分配中的堆
堆內(nèi)存用來存放由 new 創(chuàng)建的對(duì)象和數(shù)組星掰。 在堆中分配的內(nèi)存,由 Java 虛擬機(jī)的自動(dòng)垃圾
回收器來管理嫩舟。
在堆中產(chǎn)生了一個(gè)數(shù)組或?qū)ο蠛笄夂妫€可以 在棧中定義一個(gè)特殊的變量,讓棧中這個(gè)變量的
取值等于數(shù)組或?qū)ο笤诙褍?nèi)存中的首地址家厌,棧中的這個(gè)變量就成了數(shù)組或?qū)ο蟮囊米兞俊?br>
引用變量就相當(dāng)于是 為數(shù)組或?qū)ο笃鸬囊粋€(gè)名稱播玖,以后就可以在程序中使用棧中的引用變
量來訪問堆中的數(shù)組或?qū)ο蟆R米兞烤拖喈?dāng)于是為數(shù)組或者對(duì)象起的一個(gè)名稱饭于。
引用變量是普通的變量蜀踏,定義時(shí)在棧中分配,引用變量在程序運(yùn)行到其作用域之外后被釋放掰吕。
而數(shù)組和對(duì)象本身在堆中分配果覆,即使程序 運(yùn)行到使用 new 產(chǎn)生數(shù)組或者對(duì)象的語句所在的
代碼塊之外,數(shù)組和對(duì)象本身占據(jù)的內(nèi)存不會(huì)被釋放畴栖,數(shù)組和對(duì)象在沒有引用變量指向它的
時(shí)候随静,才變?yōu)槔荒茉诒皇褂寐鹧龋?然占據(jù)內(nèi)存空間不放燎猛,在隨后的一個(gè)不確定的時(shí)
間被垃圾回收器收走(釋放掉)。這也是 Java 比較占內(nèi)存的原因照皆。
實(shí)際上重绷,棧中的變量指向堆內(nèi)存中的變量,這就是 Java 中的指針膜毁!
常量池 (constant pool)
常量池指的是在編譯期被確定昭卓,并被保存在已編譯的.class 文件中的一些數(shù)據(jù)。除了包含
代碼中所定義的各種基本類型(如 int瘟滨、long 等等)和對(duì)象型(如 String 及數(shù)組)的常量
值(final)還包含一些以文本形式出現(xiàn)的符號(hào)引用候醒,比如:
◆類和接口的全限定名;
◆字段的名稱和描述符杂瘸;
◆方法和名稱和描述符倒淫。
虛擬機(jī)必須為每個(gè)被裝載的類型維護(hù)一個(gè)常量池。常量池就是該類型所用到常量的一個(gè)有序
集和败玉,包括直接常量(string,integer 和 floating point 常量)和對(duì)其他類型敌土,字段和方
法的符號(hào)引用镜硕。
對(duì)于 String 常量,它的值是在常量池中的返干。而 JVM 中的常量池在內(nèi)存當(dāng)中是以表的形式存
在的兴枯, 對(duì)于 String 類型,有一張固定長度的 CONSTANT_String_info 表用來存儲(chǔ)文字字符
串值矩欠,注意:該表只存儲(chǔ)文字字符串值财剖,不存儲(chǔ)符號(hào)引 用。說到這里晚顷,對(duì)常量池中的字符
串值的存儲(chǔ)位置應(yīng)該有一個(gè)比較明了的理解了峰伙。
在程序執(zhí)行的時(shí)候,常量池 會(huì)儲(chǔ)存在 Method Area,而不是堆中疗疟。
堆與棧
Java 的堆是一個(gè)運(yùn)行時(shí)數(shù)據(jù)區(qū),類的(對(duì)象從中分配空間该默。這些對(duì)象通過 new、newarray策彤、
anewarray 和 multianewarray 等指令建立栓袖,它們不需要程序代碼來顯式的釋放。堆是由垃
圾回收來負(fù)責(zé)的店诗,堆的優(yōu)勢是可以動(dòng)態(tài)地分配內(nèi)存 大小裹刮,生存期也不必事先告訴編譯器,
因?yàn)樗窃谶\(yùn)行時(shí)動(dòng)態(tài)分配內(nèi)存的庞瘸,Java 的垃圾收集器會(huì)自動(dòng)收走這些不再使用的數(shù)據(jù)捧弃。
但缺點(diǎn)是,由于要在運(yùn)行時(shí)動(dòng)態(tài) 分配內(nèi)存擦囊,存取速度較慢违霞。
棧的優(yōu)勢是,存取速度比堆要快瞬场,僅次于寄存器买鸽,棧數(shù)據(jù)可以共享。但缺點(diǎn)是贯被,存在棧中的
數(shù)據(jù)大小與生存期必須是 確定的眼五,缺乏靈活性。棧中主要存放一些基本類型的變量數(shù)據(jù)(int,
short, long, byte, float, double, boolean, char)和對(duì)象句柄(引用)彤灶。
棧有一個(gè)很重要的特殊性看幼,就是存在棧中的數(shù)據(jù)可以共享。假設(shè)我們同時(shí)定義:
Int a = 3;
Int b = 3幌陕;
編譯器先處理 int a = 3诵姜;首先它會(huì)在棧中創(chuàng)建一個(gè)變量為 a 的引用,然后查找棧中是否有
3 這個(gè)值苞轿,如果沒找到茅诱,就將 3 存放進(jìn)來逗物,然后將 a 指向 3。接著處理 int b = 3瑟俭;在創(chuàng)建
完 b 的引用變量后翎卓,因?yàn)樵跅V幸呀?jīng)有 3 這個(gè)值,便將 b 直接指向 3摆寄。這樣失暴,就出現(xiàn)了 a 與
b 同時(shí)均指向 3 的情況。
這時(shí)微饥,如果再令 a=4逗扒;那么編譯器會(huì)重新搜索棧中是否有 4 值,如果沒有欠橘,則將 4 存放進(jìn)來矩肩,
并令 a 指向 4;如果已經(jīng)有了肃续,則直接將 a 指向這個(gè)地址黍檩。因此 a 值的改變不會(huì)影響 到 b
的值。
要注意這種數(shù)據(jù)的共享與兩個(gè)對(duì)象的引用同時(shí)指向一個(gè)對(duì)象的這種共享是不同的始锚,因?yàn)檫@種
情況 a 的修改并不會(huì)影響到 b, 它是由編譯器完成的刽酱,它有利于節(jié)省空間。而一個(gè)對(duì)象引用
變量修改了這個(gè)對(duì)象的內(nèi)部狀態(tài)瞧捌,會(huì)影響到另一個(gè)對(duì)象引用變量棵里。
String 是一個(gè)特殊的包裝類數(shù)據(jù)〗隳牛可以用:
String str = new String("abc");
String str = "abc";
兩種的形式來創(chuàng)建殿怜,第一種是用 new()來新建對(duì)象的,它會(huì)在存放于堆中皮钠。每調(diào)用一次就會(huì)
創(chuàng)建一個(gè)新的對(duì)象稳捆。而第二種是先在棧中創(chuàng)建一個(gè)對(duì) String 類的對(duì)象引用變量 str,然后
通過符號(hào)引用去字符串常量池 里找有沒有"abc",如果沒有麦轰,則將"abc"存放進(jìn)字符串常量
池 乔夯,并令 str 指向”abc”,如果已經(jīng)有”abc” 則直接令 str 指向“abc”款侵。
比較類里面的數(shù)值是否相等時(shí)末荐,用 equals()方法;當(dāng)測試兩個(gè)包裝類的引用是否指向同一
個(gè)對(duì)象時(shí)新锈,用==甲脏,下面用例子說明上面的理論。
String str1 = "abc";
String str2 = "abc";
System.out.println(str1==str2); //true
可以看出 str1 和 str2 是指向同一個(gè)對(duì)象的。
String str1 =new String ("abc");
String str2 =new String ("abc");
System.out.println(str1==str2); // false
用 new 的方式是生成不同的對(duì)象块请。每一次生成一個(gè)娜氏。
因此用第二種方式創(chuàng)建多個(gè)”abc”字符串,在內(nèi)存中 其實(shí)只存在一個(gè)對(duì)象而已. 這種寫法
有利與節(jié)省內(nèi)存空間. 同時(shí)它可以在一定程度上提高程序的運(yùn)行速度,因?yàn)?JVM 會(huì)自動(dòng)根據(jù)
棧中數(shù)據(jù)的實(shí)際情況來決定是否有必要?jiǎng)?chuàng)建新對(duì)象墩新。而對(duì)于 String str = new
String("abc")贸弥;的代碼,則一概在堆中創(chuàng)建新對(duì)象海渊,而不管其字符串值是否相等绵疲,是否有
必要?jiǎng)?chuàng)建新對(duì)象,從而加重了程序的負(fù)擔(dān)臣疑。
另 一方面, 要注意: 我們?cè)谑褂弥T如 String str = "abc"盔憨;的格式定義類時(shí),總是想當(dāng)然
地認(rèn)為讯沈,創(chuàng)建了 String 類的對(duì)象 str郁岩。擔(dān)心陷阱!對(duì)象可能并沒有被創(chuàng)建芙盘!而可能只是指
向一個(gè)先前已經(jīng)創(chuàng)建的 對(duì)象驯用。只有通過 new()方法才能保證每次都創(chuàng)建一個(gè)新的對(duì)象脸秽。
由于 String 類的 immutable 性質(zhì)儒老,當(dāng) String 變量需要經(jīng)常變換 其值時(shí),應(yīng)該考慮使用
StringBuffer 類记餐,以提高程序效率驮樊。
首先 String 不屬于 8 種基本數(shù)據(jù)類型,String 是一個(gè)對(duì)象片酝。因?yàn)閷?duì)象的默認(rèn)值是 null囚衔,
所以 String 的默認(rèn)值也是 null;但它又是一種特殊的對(duì)象雕沿,有其它對(duì)象沒有的一些特性练湿。
new String()和 new String(”")都是申明一個(gè)新的空字符串,是空串不是 null审轮;
String str=”kvill”肥哎;String str=new String (”kvill”)的區(qū)別
示例:
1. String s0="kvill";
2. String s1="kvill";
3. String s2="kv" + "ill";
4. System.out.println( s0==s1 );
5. System.out.println( s0==s2 );
結(jié)果為:
true
true
首先,我們要知結(jié)果為道 Java 會(huì)確保一個(gè)字符串常量只有一個(gè)拷貝疾渣。
因?yàn)槔又械?s0和s1中的”kvill”都是字符串常量篡诽,它們?cè)诰幾g期就被確定了,所以s0==s1
為 true榴捡;而”kv”和”ill”也都是字符串常量杈女,當(dāng)一個(gè)字 符串由多個(gè)字符串常量連接而
成時(shí),它自己肯定也是字符串常量,所以 s2 也同樣在編譯期就被解析為一個(gè)字符串常量达椰,
所以 s2 也是常量池中” kvill”的一個(gè)引用翰蠢。所以我們得出 s0==s1==s2;用 new String()
創(chuàng)建的字符串不是常量啰劲,不能在編譯期就確定躏筏,所以 new String() 創(chuàng)建的字符串不放入常
量池中,它們有自己的地址空間呈枉。
示例:
1. String s0="kvill";
2. String s1=new String("kvill");
3. String s2="kv" + new String("ill");
4. System.out.println( s0==s1 );
5. System.out.println( s0==s2 );
6. System.out.println( s1==s2 );
結(jié)果為:
false
false
false
例中 s0 還是常量池 中"kvill”的應(yīng)用趁尼,s1 因?yàn)闊o法在編譯期確定,所以是運(yùn)行時(shí)創(chuàng)建
的新對(duì)象”kvill”的引用猖辫,s2 因?yàn)橛泻蟀氩糠?new String(”ill”)所以也無法在編譯期
確定酥泞,所以也是一個(gè)新創(chuàng)建對(duì)象”kvill”的應(yīng)用;明白了這些也就知道為何得出此結(jié)果了。
String.intern():
再補(bǔ)充介紹一點(diǎn):存在于.class 文件中的常量池啃憎,在運(yùn)行期被 JVM 裝載芝囤,并且可以擴(kuò)充。
String的 intern()方法就是擴(kuò)充常量池的 一個(gè)方法辛萍;當(dāng)一個(gè)String實(shí)例str調(diào)用intern()
方法時(shí)悯姊,Java 查找常量池中 是否有相同 Unicode 的字符串常量,如果有贩毕,則返回其的引用悯许,
如果沒有,則在常 量池中增加一個(gè) Unicode 等于 str 的字符串并返回它的引用辉阶;看示例就
清楚了
示例:
1. String s0= "kvill";
2. String s1=new String("kvill");
3. String s2=new String("kvill");
4. System.out.println( s0==s1 );
5. System.out.println( "**********" );
6. s1.intern();
7. s2=s2.intern(); //把常量池中"kvill"的引用賦給 s2
8. System.out.println( s0==s1);
9. System.out.println( s0==s1.intern() );
10. System.out.println( s0==s2 );
結(jié)果為:
false
false //雖然執(zhí)行了 s1.intern(),但它的返回值沒有賦給 s1
true //說明 s1.intern()返回的是常量池中"kvill"的引用
true
最后我再破除一個(gè)錯(cuò)誤的理解:有人說先壕, “使用 String.intern() 方法則可以將一個(gè) String
類的保存到一個(gè)全局 String 表中 ,如果具有相同值的 Unicode 字符串已經(jīng)在這個(gè)表中谆甜,
那么該方法返回表中已有字符串的地址垃僚,如果在表中沒有相同值的字符串,則將自己的地址
注冊(cè)到表中”如果我把他說的這個(gè)全局的 String 表理解為常量池的話规辱,他的最后一句話谆棺,”
如果在表中沒有相同值的字符串,則將自己的地址注冊(cè)到表中”是錯(cuò)的:
示例:
1. String s1=new String("kvill");
2. String s2=s1.intern();
3. System.out.println( s1==s1.intern() );
4. System.out.println( s1+" "+s2 );
5. System.out.println( s2==s1.intern() );
結(jié)果:
false
kvill kvill
true
在這個(gè)類中我們沒有聲名一個(gè)”kvill”常量罕袋,所以常量池中一開始是沒有”kvill”的改淑,當(dāng)
我們調(diào)用 s1.intern()后就在常量池中新添加了一 個(gè)”kvill”常量,原來的不在常量池中
的”kvill”仍然存在炫贤,也就不是“將自己的地址注冊(cè)到常量池中”了溅固。
s1==s1.intern() 為 false 說明原來的”kvill”仍然存在;s2 現(xiàn)在為常量池中”kvill”
的地址兰珍,所以有 s2==s1.intern()為 true侍郭。
關(guān)于 equals()和==:
這個(gè)對(duì)于 String 簡單來說就是比較兩字符串的 Unicode 序列是否相當(dāng),如果相等返回 true;
而==是 比較兩字符串的地址是否相同,也就是是否是同一個(gè)字符串的引用亮元。
關(guān)于 String 是不可變的
這一說又要說很多猛计,大家只 要知道 String 的實(shí)例一旦生成就不會(huì)再改變了,比如說:String
str=”kv”+”ill”+” “+”ans”; 就是有 4 個(gè)字符串常量爆捞,首先”kv”和”ill”生成
了”kvill”存在內(nèi)存中奉瘤,然后”kvill”又和” ” 生成 “kvill “存在內(nèi)存中,最后又
和生成了”kvill ans”;并把這個(gè)字符串的地址賦給了 str,就是因?yàn)?String 的”不可變”
產(chǎn)生了很多臨時(shí)變量煮甥,這也就是為什么建議用 StringBuffer 的原 因了盗温,因?yàn)?StringBuffer
是可改變的。
下面是一些 String 相關(guān)的常見問題:
String 中的 final 用法和理解
final StringBuffer a = new StringBuffer("111");
final StringBuffer b = new StringBuffer("222");
a=b;//此句編譯不通過
final StringBuffer a = new StringBuffer("111");
a.append("222");// 編譯通過
可見成肘,final 只對(duì)引用的"值"(即內(nèi)存地址)有效卖局,它迫使引用只能指向初始指向的那個(gè)對(duì)象,
改變它的指向會(huì)導(dǎo)致編譯期錯(cuò)誤双霍。至于它所指向的對(duì)象 的變化砚偶,final 是不負(fù)責(zé)的。
String 常量池問題的幾個(gè)例子
下面是幾個(gè)常見例子的比較分析和理解:
String a = "a1";
String b = "a" + 1;
System.out.println((a == b)); //result = true
String a = "atrue";
String b = "a" + "true";
System.out.println((a == b)); //result = true
String a = "a3.4";
String b = "a" + 3.4;
System.out.println((a == b)); //result = true
分析:JVM 對(duì)于字符串常量的"+"號(hào)連接洒闸,將程序編譯期染坯,JVM 就將常量字符串的"+"連接優(yōu)
化為連接后的值,拿"a" + 1 來說丘逸,經(jīng)編譯器優(yōu)化后在 class 中就已經(jīng)是 a1单鹿。在編譯期其字
符串常量的值就確定下來,故上面程序最終的結(jié)果都為 true鸣个。
String a = "ab";
String bb = "b";
String b = "a" + bb;
System.out.println((a == b)); //result = false
分析:JVM 對(duì)于字符串引用羞反,由于在字符串的"+"連接中,有字符串引用存在囤萤,而引用的值
在程序編譯期是無法確定的,即"a" + bb 無法被編譯器優(yōu)化是趴,只有在程序運(yùn)行期來動(dòng)態(tài)分
配并將連接后的新地址賦給 b涛舍。所以上面程序的結(jié)果也就為 false。
String a = "ab";
final String bb = "b";
String b = "a" + bb;
System.out.println((a == b)); //result = true
分析:和[3]中唯一不同的是 bb 字符串加了 final 修飾唆途,對(duì)于 final 修飾的變量富雅,它在編譯
時(shí)被解析為常量值的一個(gè)本地拷貝存儲(chǔ)到自己的常量 池中或嵌入到它的字節(jié)碼流中。所以
此時(shí)的"a" + bb 和"a" + "b"效果是一樣的肛搬。故上面程序的結(jié)果為 true没佑。
String a = "ab";
final String bb = getBB();
String b = "a" + bb;
System.out.println((a == b)); //result = false
private static String getBB() {
return "b";
}
分析:JVM 對(duì)于字符串引用 bb,它的值在編譯期無法確定温赔,只有在程序運(yùn)行期調(diào)用方法后蛤奢,
將方法的返回值和"a"來動(dòng)態(tài)連接并分配地址為 b,故上面 程序的結(jié)果為 false。
通過上面 4 個(gè)例子可以得出得知:
String s = "a" + "b" + "c";
就等價(jià)于 String s = "abc";
String a = "a";
String b = "b";
String c = "c";
String s = a + b + c;
這個(gè)就不一樣了啤贩,最終結(jié)果等于:
StringBuffer temp = new StringBuffer();
temp.append(a).append(b).append(c);
String s = temp.toString();
由上面的分析結(jié)果待秃,可就不難推斷出 String 采用連接運(yùn)算符(+)效率低下原因分析,形
如這樣的代碼:
public class Test {
public static void main(String args[]) {
String s = null;
for(int i = 0; i < 100; i++) {
s += "a";
}
}
}
每做一次 + 就產(chǎn)生個(gè) StringBuilder 對(duì)象痹屹,然后 append 后就扔掉章郁。下次循環(huán)再到達(dá)時(shí)重新
產(chǎn)生個(gè) StringBuilder 對(duì)象,然后 append 字符串志衍,如此循環(huán)直至結(jié)束暖庄。如果我們直接采用
StringBuilder 對(duì)象進(jìn)行 append 的話,我們可以節(jié)省 N - 1 次創(chuàng)建和銷毀對(duì)象的時(shí)間楼肪。
所以對(duì)于在循環(huán)中要進(jìn)行字符串連接的應(yīng)用雄驹,一般都是用 StringBuffer 或 StringBulider
對(duì)象來進(jìn)行 append 操作。
String 對(duì)象的 intern 方法理解和分析:
public class Test4 {
private static String a = "ab";
public static void main(String[] args){
String s1 = "a";
String s2 = "b";
String s = s1 + s2;
System.out.println(s == a);//false
System.out.println(s.intern() == a);//true
}
}
這里用到 Java 里面是一個(gè)常量池的問題淹辞。對(duì)于 s1+s2 操作医舆,其實(shí)是在堆里面重新創(chuàng)建了一
個(gè)新的對(duì)象,s 保存的是這個(gè)新對(duì)象在堆空間的的內(nèi)容,所 以 s 與 a 的值是不相等的象缀。而當(dāng)
調(diào)用 s.intern()方法蔬将,卻可以返回 s 在常量池中的地址值,因?yàn)?a 的值存儲(chǔ)在常量池中央星,
故 s.intern 和 a 的值相等霞怀。
總結(jié)
棧中用來存放一些原始數(shù)據(jù)類型的局部變量數(shù)據(jù)和對(duì)象的引用(String,數(shù)組.對(duì)象等等)但
不存放對(duì)象內(nèi)容
堆中存放使用 new 關(guān)鍵字創(chuàng)建的對(duì)象.
字符串是一個(gè)特殊包裝類,其引用是存放在棧里的,而對(duì)象內(nèi)容必須根據(jù)創(chuàng)建方式不同定(常
量池和堆).有的是編譯期就已經(jīng)創(chuàng)建好,存放在字符串常 量池中莉给,而有的是運(yùn)行時(shí)才被創(chuàng)
建.使用 new 關(guān)鍵字毙石,存放在堆中。