Java內(nèi)存分配與管理是Java的核心技術(shù)之一启绰,一般Java在內(nèi)存分配時會涉及到以下區(qū)域:
- 寄存器:我們在程序中無法控制
- 棧:存放基本類型的數(shù)據(jù)和對象的引用,但對象本身不存放在棧中豹障,而是存放在堆中
- 堆:存放用new產(chǎn)生的數(shù)據(jù)
- 靜態(tài)域:存放在對象中用static定義的靜態(tài)成員
- 常量池:存放常量
- 非RAM存儲:硬盤等永久存儲空間
Java內(nèi)存分配中的棧
在函數(shù)中定義的一些基本類型的變量數(shù)據(jù)和對象的引用變量都在函數(shù)的棧內(nèi)存中分配顾瞻。當(dāng)在一段代碼塊定義一個變量時,Java就在棧中為這個變量分配內(nèi)存空間宫峦,當(dāng)該變量退出該作用域后岔帽,Java會自動釋放掉為該變量所分配的內(nèi)存空間,該內(nèi)存空間可以立即被另作他用导绷。
Java內(nèi)存分配中的堆
堆內(nèi)存用來存放由new創(chuàng)建的對象和數(shù)組犀勒。 在堆中分配的內(nèi)存妥曲,由Java虛擬機的自動垃圾回收器來管理贾费。
在堆中產(chǎn)生了一個數(shù)組或?qū)ο蠛螅€可以在棧中定義一個特殊的變量檐盟,讓棧中這個變量的取值等于數(shù)組或?qū)ο笤诙褍?nèi)存中的首地址褂萧,棧中的這個變量就成了數(shù)組或?qū)ο蟮囊米兞俊?/p>
引用變量是普通的變量,定義時在棧中分配葵萎,引用變量在程序運行到其作用域之外后被釋放导犹。而數(shù)組和對象本身在堆中分配,即使程序運行到使用 new 產(chǎn)生數(shù)組或者對象的語句所在的代碼塊之外陌宿,數(shù)組和對象本身占據(jù)的內(nèi)存不會被釋放锡足,數(shù)組和對象在沒有引用變量指向它的時候,才變?yōu)槔瞧海荒茉俦皇褂貌暗茫匀徽紦?jù)內(nèi)存空間不放,在隨后的一個不確定的時間被垃圾回收器收走(釋放掉)爽蝴。這也是Java 比較占內(nèi)存的原因沐批。
常量池 (constant pool)
常量池指的是在編譯期被確定纫骑,并被保存在已編譯的.class文件中的一些數(shù)據(jù)。除了包含代碼中所定義的各種基本類型(如int九孩、long等等)和對象型(如String及數(shù)組)的常量值(final)還包含一些以文本形式出現(xiàn)的符號引用先馆,比如:
- 類和接口的全限定名
- 字段的名稱和描述符
- 方法和名稱和描述符
虛擬機必須為每個被裝載的類型維護一個常量池。常量池就是該類型所用到常量的一個有序集和躺彬,包括直接常量(string煤墙、integer和 floating point常量)和對其他類型、字段和方法的符號引用宪拥。
對于String常量仿野,它的值是在常量池中的。而JVM中的常量池在內(nèi)存當(dāng)中是以表的形式存在的她君。對于String類型脚作,有一張固定長度的CONSTANT_String_info表用來存儲文字字符串值,注意:該表只存儲文字字符串值缔刹,不存儲符號引用球涛。說到這里,對常量池中的字符串值的存儲位置應(yīng)該有一個比較明了的理解了校镐。在程序執(zhí)行的時候,常量池會儲存在Method Area亿扁,而不是堆中。
堆與棧
Java的堆是一個運行時數(shù)據(jù)區(qū)鸟廓,類的對象從中分配空間魏烫。這些對象通過new、newarray肝箱、 anewarray和multianewarray等指令建立。它們不需要程序代碼來顯式的釋放稀蟋。堆是由垃圾回收來負責(zé)的煌张,堆的優(yōu)勢是可以動態(tài)地分配內(nèi)存大小,生存期也不必事先告訴編譯器退客,因為它是在運行時動態(tài)分配內(nèi)存的骏融,Java的垃圾收集器會自動收走這些不再使用的數(shù)據(jù)。但缺點是萌狂,由于要在運行時動態(tài)分配內(nèi)存档玻,存取速度較慢。
棧的優(yōu)勢是茫藏,存取速度比堆要快误趴,僅次于寄存器,棧數(shù)據(jù)可以共享务傲。但缺點是凉当,存在棧中的數(shù)據(jù)大小與生存期必須是確定的枣申,缺乏靈活性。棧中主要存放一些基本類型的變量數(shù)據(jù)(int, short, long, byte, float, double, boolean, char)和對象句柄(引用)看杭。
棧有一個很重要的特殊性忠藤,就是存在棧中的數(shù)據(jù)可以共享。假設(shè)我們同時定義:
int a = 3;
int b = 3楼雹;
編譯器先處理int a = 3模孩;首先它會在棧中創(chuàng)建一個變量為a的引用,然后查找棧中是否有3這個值贮缅,如果沒找到榨咐,就將3存放進來,然后將a指向3携悯。接著處理int b = 3祭芦;在創(chuàng)建完b的引用變量后,因為在棧中已經(jīng)有3這個值憔鬼,便將b直接指向3龟劲。這樣,就出現(xiàn)了a與b同時均指向3的情況轴或。
這時昌跌,如果再令 a = 4;那么編譯器會重新搜索棧中是否有4值照雁,如果沒有蚕愤,則將4存放進來,并令a指向4饺蚊;如果已經(jīng)有了萍诱,則直接將a指向這個地址。因此a值的改變不會影響到b的值污呼。
要注意這種數(shù)據(jù)的共享與兩個對象的引用同時指向一個對象的這種共享是不同的裕坊,因為這種情況a的修改并不會影響到b, 它是由編譯器完成的,它有利于節(jié)省空間燕酷。而一個對象引用變量修改了這個對象的內(nèi)部狀態(tài)籍凝,會影響到另一個對象引用變量。
String
String是一個特殊的包裝類數(shù)據(jù)苗缩,可以用:
String str = new String("abc");
String str = "abc";
兩種形式來創(chuàng)建饵蒂,第一種是用new()來新建對象的,它會存放于堆中酱讶。每調(diào)用一次就會創(chuàng)建一個新的對象退盯。而第二種是先在棧中創(chuàng)建一個對String類的對象引用變量str,然后通過符號引用去字符串常量池里找有沒有"abc"。如果沒有得问,則將"abc"存放進字符串常量池 囤攀,并令str指向”abc”;如果已經(jīng)有”abc” 則直接令str指向“abc”宫纬。
比較類里面的數(shù)值是否相等時焚挠,用equals()方法;當(dāng)測試兩個包裝類的引用是否指向同一個對象時漓骚,用==蝌衔,下面用例子說明上面的理論。
String str1 = "abc";
String str2 = "abc";
System.out.println(str1==str2); //true
可以看出str1和str2是指向同一個對象的蝌蹂。
String str1 = new String ("abc");
String str2 = new String ("abc");
System.out.println(str1==str2); // false
用new的方式是生成不同的對象噩斟。每一次生成一個。
因此用第一種方式創(chuàng)建多個”abc”字符串,在內(nèi)存中其實只存在一個對象而已. 這種寫法有利于節(jié)省內(nèi)存空間孤个。同時它可以在一定程度上提高程序的運行速度剃允,因為JVM會自動根據(jù)棧中數(shù)據(jù)的實際情況來決定是否有必要創(chuàng)建新對象。而對于String str = new String("abc")齐鲤;的代碼斥废,則一概在堆中創(chuàng)建新對象,而不管其字符串值是否相等给郊,是否有必要創(chuàng)建新對象牡肉,從而加重了程序的負擔(dān)。
另一方面, 要注意: 我們在使用諸如String str = "abc"淆九;的格式定義類時统锤,總是想當(dāng)然地認為,創(chuàng)建了String類的對象str炭庙。擔(dān)心陷阱饲窿!對象可能并沒有被創(chuàng)建!而可能只是指向一個先前已經(jīng)創(chuàng)建的對象焕蹄。只有通過new()方法才能保證每次都創(chuàng)建一個新的對象免绿。
由于String類的immutable性質(zhì),當(dāng)String變量需要經(jīng)常變換其值時擦盾,應(yīng)該考慮使用StringBuffer類,以提高程序效率淌哟。
- 首先String不屬于8種基本數(shù)據(jù)類型迹卢,String是一個對象。因為對象的默認值是null徒仓,所以String的默認值也是null腐碱;但它又是一種特殊的對象,有其它對象沒有的一些特性。
- new String()和new String("")都是聲明一個新的空字符串症见,是空串不是null喂走;
- String str="kvill";String str=new String ("kvill")的區(qū)別
示例:
String s0 = "kvill";
String s1 = "kvill";
String s2 = "kv" + "ill";
System.out.println( s0 == s1 );
System.out.println( s0 == s2 );
結(jié)果為:
true
true
首先谋作,我們要知道Java會確保一個字符串常量只有一個拷貝芋肠。
因為例子中的s0和s1中的"kvill"都是字符串常量,它們在編譯期就被確定了遵蚜,所以s0==s1為true帖池;而"kv"和"ill"也都是字符串常量,當(dāng)一個字符串由多個字符串常量連接而成時吭净,它自己肯定也是字符串常量睡汹,所以s2也同樣在編譯期就被解析為一個字符串常量,所以s2也是常量池中"kvill"的一個引用寂殉。所以我們得出s0==s1==s2囚巴;用new String() 創(chuàng)建的字符串不是常量,不能在編譯期就確定友扰,所以new String()創(chuàng)建的字符串不放入常量池中彤叉,它們有自己的地址空間。
示例:
String s0 = "kvill";
String s1 = new String("kvill");
String s2 = "kv" + new String("ill");
System.out.println( s0 == s1 );
System.out.println( s0 == s2 );
System.out.println( s1 == s2 );
結(jié)果為:
false
false
false
例2中s0還是常量池 中"kvill”的應(yīng)用焕檬,s1因為無法在編譯期確定姆坚,所以是運行時創(chuàng)建的新對象”kvill”的引用,s2因為有后半部分 new String(”ill”)所以也無法在編譯期確定实愚,所以也是一個新創(chuàng)建對象”kvill”的引用兼呵;明白了這些也就知道為何得出此結(jié)果了。
- String.intern():
再補充介紹一點:存在于.class文件中的常量池腊敲,在運行期被JVM裝載击喂,并且可以擴充。String的 intern()方法就是擴充常量池的一個方法碰辅;當(dāng)一個String實例str調(diào)用intern()方法時懂昂,Java查找常量池中是否有相同Unicode的字符串常量,如果有没宾,則返回其的引用凌彬,如果沒有,則在常量池中增加一個Unicode等于str的字符串并返回它的引用循衰;看示例就清楚了
示例:
String s0 = "kvill";
String s1 = new String("kvill");
String s2 = new String("kvill");
System.out.println( s0==s1 );
System.out.println( "**********" );
s1.intern();
s2 = s2.intern(); //把常量池中"kvill"的引用賦給s2
System.out.println( s0==s1);
System.out.println( s0==s1.intern() );
System.out.println( s0==s2 );
結(jié)果為:
false
false //雖然執(zhí)行了s1.intern(),但它的返回值沒有賦給s1
true //說明s1.intern()返回的是常量池中"kvill"的引用
true
最后我再破除一個錯誤的理解铲敛。有人說,“使用String.intern()方法則可以將一個String類保存到一個全局String表中会钝。如果具有相同值的Unicode字符串已經(jīng)在這個表中伐蒋,那么該方法返回表中已有字符串的地址。如果在表中沒有相同值的字符串,則將自己的地址注冊到表中”先鱼。如果我把他說的這個全局的String表理解為常量池的話俭正,他的最后一句話,“如果在表中沒有相同值的字符串焙畔,則將自己的地址注冊到表中”是錯的掸读。
示例:
String s1 = new String("kvill");
String s2 = s1.intern();
System.out.println( s1 == s1.intern() );
System.out.println( s1 + " " + s2 );
System.out.println( s2 == s1.intern() );
結(jié)果:
false
kvill kvill
true
在這個類中我們沒有聲名一個”kvill”常量,所以常量池中一開始是沒有”kvill”的闹蒜,當(dāng)我們調(diào)用s1.intern()后就在常量池中新添加了一 個”kvill”常量寺枉,原來的不在常量池中的”kvill”仍然存在,也就不是“將自己的地址注冊到常量池中”了绷落。
s1==s1.intern() 為false說明原來的”kvill”仍然存在姥闪;s2現(xiàn)在為常量池中”kvill”的地址,所以有s2==s1.intern()為true砌烁。
- 關(guān)于equals()和==:
equals()對于String簡單來說就是比較兩字符串的Unicode序列是否相當(dāng)筐喳,如果相等返回true;而==是比較兩字符串的地址是否相同函喉,也就是是否是同一個字符串的引用避归。
- 關(guān)于String是不可變的
這一說又要說很多,大家只要知道String的實例一旦生成就不會再改變了管呵,比如說:
String str = "kv"+"ill"+" "+"ans";
就是有4個字符串常量梳毙,首先"kv"和"ill"生成了"kvill"存在內(nèi)存中,然后"kvill"又和" " 生成 "kvill "存在內(nèi)存中捐下,最后又和"ans"生成了"kvill ans账锹,并把這個字符串的地址賦給了str。就是因為String的”不可變”產(chǎn)生了很多臨時變量坷襟,這也就是為什么建議用StringBuffer的原因了奸柬,因為StringBuffer是可改變的。
下面是一些String相關(guān)的常見問題:
String中的final用法和理解
final StringBuffer a = new StringBuffer("111");
final StringBuffer b = new StringBuffer("222");
a=b;//此句編譯不通過
final StringBuffer a = new StringBuffer("111");
a.append("222");// 編譯通過
可見婴程,final只對引用的"值"(即內(nèi)存地址)有效廓奕,它迫使引用只能指向初始指向的那個對象,改變它的指向會導(dǎo)致編譯錯誤档叔。至于它所指向的對象的變化桌粉,final是不負責(zé)的。
String常量池問題的幾個例子
下面是幾個常見例子的比較分析和理解:
String a = "a1";
String b = "a" + 1;
System.out.println((a == b)); //result = true
String a = "atrue";
String b = "a" + "true";
System.out.println((a == b)); //result = true
String a = "a3.4";
String b = "a" + 3.4;
System.out.println((a == b)); //result = true
分析:JVM對于字符串常量的"+"號連接衙四,將程序編譯期铃肯,JVM就將常量字符串的"+"連接優(yōu)化為連接后的值,拿"a" + 1來說届搁,經(jīng)編譯器優(yōu)化后在class中就已經(jīng)是a1。在編譯期其字符串常量的值就確定下來,故上面程序最終的結(jié)果都為true卡睦。
String a = "ab";
String bb = "b";
String b = "a" + bb;
System.out.println((a == b)); //result = false
分析:JVM對于字符串引用宴胧,由于在字符串的"+"連接中,有字符串引用存在表锻,而引用的值在程序編譯期是無法確定的恕齐,即"a" + bb無法被編譯器優(yōu)化,只有在程序運行期來動態(tài)分配并將連接后的新地址賦給b瞬逊。所以上面程序的結(jié)果也就為false显歧。
String a = "ab";
final String bb = "b";
String b = "a" + bb;
System.out.println((a == b)); //result = true
分析:和[3]中唯一不同的是bb字符串加了final修飾,對于final修飾的變量确镊,它在編譯時被解析為常量值的一個本地拷貝存儲到自己的常量池中或嵌入到它的字節(jié)碼流中士骤。所以此時的"a" + bb和"a" + "b"效果是一樣的。故上面程序的結(jié)果為true蕾域。
String a = "ab";
final String bb = getBB();
String b = "a" + bb;
System.out.println((a == b)); //result = false
private static String getBB() {
return "b";
}
分析:JVM對于字符串引用bb拷肌,它的值在編譯期無法確定,只有在程序運行期調(diào)用方法后旨巷,將方法的返回值和"a"來動態(tài)連接并分配地址為b巨缘,故上面程序的結(jié)果為false。
通過上面4個例子可以得出得知:
String s = "a" + "b" + "c";
就等價于String s = "abc";
String a = "a";
String b = "b";
String c = "c";
String s = a + b + c;
這個就不一樣了采呐,最終結(jié)果等于:
StringBuffer temp = new StringBuffer();
temp.append(a).append(b).append(c);
String s = temp.toString();
由上面的分析結(jié)果若锁,可就不難推斷出String采用連接運算符(+)效率低下原因分析,形如這樣的代碼:
public class Test {
public static void main(String args[]) {
String s = null;
for(int i = 0; i < 100; i++) {
s += "a";
}
}
}
每做一次 + 就產(chǎn)生個StringBuilder對象斧吐,然后append后就扔掉又固。下次循環(huán)再到達時重新產(chǎn)生個StringBuilder對象,然后 append 字符串会通,如此循環(huán)直至結(jié)束口予。如果我們直接采用 StringBuilder 對象進行 append 的話,我們可以節(jié)省 N - 1 次創(chuàng)建和銷毀對象的時間涕侈。所以對于在循環(huán)中要進行字符串連接的應(yīng)用沪停,一般都是用StringBuffer或StringBulider對象來進行append操作。
String對象的intern方法理解和分析:
public class Test4 {
private static String a = "ab";
public static void main(String[] args){
String s1 = "a";
String s2 = "b";
String s = s1 + s2;
System.out.println(s == a);//false
System.out.println(s.intern() == a);//true
}
}
這里用到Java里面是一個常量池的問題裳涛。對于s1 + s2操作木张,其實是在堆里面重新創(chuàng)建了一個新的對象,s保存的是這個新對象在堆空間的的內(nèi)容端三,所以s與a的值是不相等的舷礼。而當(dāng)調(diào)用s.intern()方法,卻可以返回s在常量池中的地址值郊闯,因為a的值存儲在常量池中妻献,故s.intern和a的值相等蛛株。
總結(jié)
棧中用來存放一些原始數(shù)據(jù)類型的局部變量數(shù)據(jù)和對象的引用(String,數(shù)組育拨,對象等等)谨履,但不存放對象內(nèi)容。
堆中存放使用new關(guān)鍵字創(chuàng)建的對象熬丧。
字符串是一個特殊包裝類笋粟,其引用是存放在棧里的,而對象內(nèi)容必須根據(jù)創(chuàng)建方式不同定(常量池和堆)析蝴。有的是編譯期就已經(jīng)創(chuàng)建好害捕,存放在字符串常量池中,而有的是運行時才被創(chuàng)建闷畸。使用new關(guān)鍵字尝盼,存放在堆中。