java常量池是一個經(jīng)久不衰的話題督函,也是面試官的最愛嘀粱,題目花樣百出激挪。
理論
jvm虛擬內(nèi)存分布:
** 程序計數(shù)器是jvm執(zhí)行程序的流水線,存放一些跳轉(zhuǎn)指令锋叨,這個太高深垄分,小菜不懂。
** 本地方法棧是jvm調(diào)用操作系統(tǒng)方法所使用的棧娃磺。
** 虛擬機(jī)棧是jvm執(zhí)行java代碼所使用的棧薄湿。
** 方法區(qū)存放了一些常量、靜態(tài)變量偷卧、類信息等豺瘤,可以理解成class文件在內(nèi)存中的存放位置。
** 虛擬機(jī)堆是jvm執(zhí)行java代碼所使用的堆听诸。
Java中的常量池坐求,實(shí)際上分為兩種形態(tài):靜態(tài)常量池和運(yùn)行時常量池。
所謂靜態(tài)常量池晌梨,即.class文件中的常量池桥嗤,class文件中的常量池不僅僅包含字符串(數(shù)字)字面量,還包含類派任、方法的信息砸逊,占用class文件絕大部分空間。
而運(yùn)行時常量池掌逛,則是jvm虛擬機(jī)在完成類裝載操作后师逸,將class文件中的常量池載入到內(nèi)存中拦盹,并保存在方法區(qū)*中禁悠,我們常說的常量池邀跃,就是指方法區(qū)中的運(yùn)行時常量池竿刁。
接下來我們引用一些網(wǎng)絡(luò)上流行的常量池例子,然后借以講解神得。
String s1 = "Hello";
String s2 = "Hello";
String s3 = "Hel" + "lo";
String s4 = "Hel" + new String("lo");
String s5 = new String("Hello");
String s6 = s5.intern();
String s7 = "H";
String s8 = "ello";
String s9 = s7 + s8;
System.out.println(s1 == s2); // true
System.out.println(s1 == s3); // true
System.out.println(s1 == s4); // false
System.out.println(s1 == s9); // false
System.out.println(s4 == s5); // false
System.out.println(s1 == s6); // true
首先說明一點(diǎn)撞鹉,在java 中逆日,直接使用==操作符鸵鸥,比較的是兩個字符串的引用地址奠滑,并不是比較內(nèi)容,比較內(nèi)容請用String.equals()妒穴。
s1 == s2這個非常好理解宋税,s1、s2在賦值時讼油,均使用的字符串字面量杰赛,說白話點(diǎn),就是直接把字符串寫死矮台,在編譯期間乏屯,這種字面量會直接放入class文件的常量池中根时,從而實(shí)現(xiàn)復(fù)用,載入運(yùn)行時常量池后辰晕,s1蛤迎、s2指向的是同一個內(nèi)存地址,所以相等伞芹。
s1 == s3這個地方有個坑忘苛,s3雖然是動態(tài)拼接出來的字符串蝉娜,但是所有參與拼接的部分都是已知的字面量唱较,在編譯期間,這種拼接會被優(yōu)化召川,編譯器直接幫你拼好南缓,因此String s3 = "Hel" + "lo";在class文件中被優(yōu)化成String s3 = "Hello";,所以s1 == s3成立荧呐。
s1 == s4當(dāng)然不相等汉形,s4雖然也是拼接出來的,但new String("lo")這部分不是已知字面量倍阐,是一個不可預(yù)料的部分概疆,編譯器不會優(yōu)化,必須等到運(yùn)行時才可以確定結(jié)果峰搪,結(jié)合字符串不變定理岔冀,鬼知道s4被分配到哪去了,所以地址肯定不同概耻。配上一張簡圖理清思路:
s4 == s5已經(jīng)不用解釋了济欢,絕對不相等,二者都在堆中小渊,但地址不同法褥。
s1 == s6這兩個相等完全歸功于intern方法,s5在堆中酬屉,內(nèi)容為Hello 半等,intern方法會嘗試將Hello字符串添加到常量池中,并返回其在常量池中的地址呐萨,因?yàn)槌A砍刂幸呀?jīng)有了Hello字符串杀饵,所以intern方法直接返回地址;而s1在編譯期就已經(jīng)指向常量池了谬擦,因此s1和s6指向同一地址切距,相等。
至此惨远,我們可以得出三個非常重要的結(jié)論:
必須要關(guān)注編譯期的行為谜悟,才能更好的理解常量池。
運(yùn)行時常量池中的常量北秽,基本來源于各個class文件中的常量池葡幸。
程序運(yùn)行時,除非手動向常量池中添加常量(比如調(diào)用intern方法)贺氓,否則jvm不會自動添加常量到常量池蔚叨。
以上所講僅涉及字符串常量池,實(shí)際上還有整型常量池掠归、浮點(diǎn)型常量池等等缅叠,但都大同小異,只不過數(shù)值類型的常量池不可以手動添加常量虏冻,程序啟動時常量池中的常量就已經(jīng)確定了肤粱,比如整型常量池中的常量范圍:-128~127,只有這個范圍的數(shù)字可以用到常量池厨相。
實(shí)踐
說了這么多理論领曼,接下來讓我們觸摸一下真正的常量池。
前文提到過蛮穿,class文件中存在一個靜態(tài)常量池庶骄,這個常量池是由編譯器生成的,用來存儲java源文件中的字面量(本文僅僅關(guān)注字面量)践磅,假設(shè)我們有如下java代碼:
String s = "hi";
為了方便起見单刁,就這么簡單,沒錯府适!將代碼編譯成class文件后羔飞,用winhex打開二進(jìn)制格式的class文件肺樟。如圖:
簡單講解一下class文件的結(jié)構(gòu),開頭的4個字節(jié)是class文件魔數(shù)逻淌,用來標(biāo)識這是一個class文件么伯,說白話點(diǎn)就是文件頭,既:CA FE BA BE卡儒。
緊接著4個字節(jié)是java的版本號田柔,這里的版本號是34,因?yàn)楣P者是用jdk8編譯的骨望,版本號的高低和jdk版本的高低相對應(yīng)硬爆,高版本可以兼容低版本,但低版本無法執(zhí)行高版本锦募。所以摆屯,如果哪天讀者想知道別人的class文件是用什么jdk版本編譯的,就可以看這4個字節(jié)糠亩。
接下來就是常量池入口,入口處用2個字節(jié)標(biāo)識常量池常量數(shù)量准验,本例中數(shù)值為00 1A赎线,翻譯成十進(jìn)制是26,也就是有25個常量糊饱,其中第0個常量是特殊值垂寥,所以只有25個常量。
常量池中存放了各種類型的常量另锋,他們都有自己的類型滞项,并且都有自己的存儲規(guī)范,本文只關(guān)注字符串常量夭坪,字符串常量以01開頭(1個字節(jié))文判,接著用2個字節(jié)記錄字符串長度,然后就是字符串實(shí)際內(nèi)容室梅。本例中為:01 00 02 68 69戏仓。
接下來再說說運(yùn)行時常量池,由于運(yùn)行時常量池在方法區(qū)中亡鼠,我們可以通過jvm參數(shù):-XX:PermSize赏殃、-XX:MaxPermSize來設(shè)置方法區(qū)大小,從而間接限制常量池大小间涵。
假設(shè)jvm啟動參數(shù)為:-XX:PermSize=2M -XX:MaxPermSize=2M仁热,然后運(yùn)行如下代碼:
//保持引用,防止自動垃圾回收
List<String> list = new ArrayList<String>();
int i = 0;
while(true){
//通過intern方法向常量池中手動添加常量
list.add(String.valueOf(i++).intern());
}
程序立刻會拋出:Exception in thread "main" java.lang.outOfMemoryError: PermGen space異常勾哩。PermGen space正是方法區(qū)抗蠢,足以說明常量池在方法區(qū)中根盒。
在jdk8中,移除了方法區(qū)物蝙,轉(zhuǎn)而用Metaspace區(qū)域替代炎滞,所以我們需要使用新的jvm參數(shù):-XX:MaxMetaspaceSize=2M,依然運(yùn)行如上代碼诬乞,拋出:java.lang.OutOfMemoryError: Metaspace異常册赛。同理說明運(yùn)行時常量池是劃分在Metaspace區(qū)域中。具體關(guān)于Metaspace區(qū)域的知識震嫉,請讀者自行搜索森瘪。
本文所有代碼均在jdk7、jdk8下測試通過票堵,其他版本jdk可能會略有差異扼睬,請讀者自行探索。
參考文獻(xiàn):《深入理解java虛擬機(jī)———jvm高級特性與最佳實(shí)踐》
學(xué)習(xí)交流群:669823128