寫這篇博客的目的起源于自己想要知道String提供的intern()方法的作用以及String內(nèi)部的存儲(chǔ)原理是怎樣的大咱?
如下代碼:
String s1 = new String("cc");
s1.intern();
String s2 = new StringBuffer().append("cc").toString();
System.out.println(s2.intern() == s1);
運(yùn)行環(huán)境是jdk1.8, 上面這段代碼的執(zhí)行結(jié)果為false,可是為什么是false呢穷绵?
一般我們?cè)趈ava當(dāng)中創(chuàng)建String有兩種方式:
1 直接使用雙引號(hào)聲明出來(這種也叫字面量):比如?String?str = “aa”。
2?通過new String("aa")或者其他的比如StringBuffer或StringBuilder等特愿。
在接下去之前仲墨,先來了解一下基本概念:
class文件里的常量池:一般我們?cè)趯慾ava文件的時(shí)候,如果定義了"a"這種字符串揍障,就會(huì)被編譯器解析到class文件的常量池中目养,比如下面的代碼
public void test() {
????String s1 = "aa";
}
用javaap反編譯一下,可以看到亚兄,編譯器將字符串字面量解析到了常量池中混稽。
方法里的字節(jié)碼在運(yùn)行時(shí)使用ldc加載常量池里的字符串對(duì)象ref放到棧頂,然后用astore_1命令將棧頂ref賦值給局部變量s1审胚。
運(yùn)行時(shí)常量池(Constant pool):我們知道每個(gè)class文件在jvm運(yùn)行時(shí)會(huì)加載到虛擬機(jī)中匈勋,虛擬機(jī)中的每個(gè)class文件都會(huì)有一個(gè)自己的常量池,保存著class文件里的常量信息膳叨,比如class全限定名洽洁,父類的名字等。
String常量池(String Constant Pool):運(yùn)行時(shí)常量池(Constant pool)里包含了String?常量池菲嘴,底層實(shí)現(xiàn)是一個(gè)hashTable饿自。也就是說我們的class文件里使用 " " 的聲明的字符串字面量,最終都會(huì)放到String常量池龄坪。
在jdk1.6的時(shí)候昭雌,String常量池是放在PermGen區(qū),就是我們熟悉的永久代健田,由于PermGen是固定的大小的烛卧,而且不易擴(kuò)展,當(dāng)存儲(chǔ)的String對(duì)象太多妓局,會(huì)引發(fā)OutOfMemoryException总放,到了jdk1.7?jvm團(tuán)隊(duì)將String常量池移動(dòng)到了Heap中,并提供了通過命令行控制String常量池的大小好爬。詳情可以看https://bugs.java.com/bugdatabase/view_bug.do?bug_id=6962931和https://bugs.java.com/bugdatabase/view_bug.do?bug_id=6962930
放張圖片方便理解:
String的intern方法作用:
如果字符串在String?pool中不存在則創(chuàng)建一個(gè)局雄,并返回該字符串的引用,如果在Heap有字符串對(duì)象存炮,則返回將引用指向Heap中的對(duì)象炬搭,然后返回引用蜈漓。
現(xiàn)在來解釋一下代碼:
String s1 = "Cat";? //編譯期會(huì)在class文件常量池中,運(yùn)行時(shí)會(huì)放到String常量池(String pool)尚蝌。
String s2 = "Cat"http://同上迎变,運(yùn)行時(shí)如果String?pool中已經(jīng)存在Cat了充尉,就將Cat的引用返回給s2.
String s3 = new String("Cat"); //會(huì)在Heap中創(chuàng)建一個(gè)String對(duì)象Cat飘言,如果Cat不存在于String?pool中,也會(huì)在String pool中創(chuàng)建(注意不存在創(chuàng)建兩個(gè)對(duì)象)驼侠,因?yàn)樯厦嬉呀?jīng)創(chuàng)建了姿鸿,所以這里只創(chuàng)建一次。
s1 == s2 //true? ?很好解釋倒源,都是同一個(gè)對(duì)象在String?Pool
s1 ==?s3 //false? 由于s3的String對(duì)象在Heap中苛预,和s1不是一個(gè)對(duì)象,==?比較比的是對(duì)象的地址笋熬,所以不相等热某。
回答一下開始問題
String s1 = new String("cc"); //Heap創(chuàng)建了一個(gè)String對(duì)象,同時(shí)StringPool里創(chuàng)建了"cc"字符串?
s1.intern(); //這里沒有接收返回結(jié)果胳螟。只是把“cc”寫入到StringPool昔馋,上一步StringPool里已經(jīng)有"cc"了
String s2 = new StringBuffer().append("cc").toString(); //?這里只在Heap創(chuàng)建對(duì)象。String常量池有了"cc"
System.out.println(s2.intern() == s1); //?不可能相等糖耸,s1?是指向Heap里的String?對(duì)象秘遏,s2.intern()方法返回的是StringPool里“cc”的引用地址。
那么String的intern()方法嘉竟,這個(gè)方法怎么用呢邦危?
String s1 = "aa";
String s2 = new String("aa");
String s3 = s2.intern();
System.out.println(s3 == s1); //?執(zhí)行的結(jié)果為true
這里intern方法的作用是返回String?pool中 “aa”這個(gè)字符串字面量的引用(即使s2是通過new?String在堆中生成對(duì)象,但是aa本質(zhì)還是在String?pool中)舍扰,我們用s3保存這個(gè)引用倦蚪。對(duì)比上面的圖片,應(yīng)該能理解執(zhí)行的結(jié)果边苹。s3和s1他們指向的就是String?pool中"aa",?而s2指向堆中的String對(duì)象陵且。
ok,再來看這段代碼?s1 == s2?為什么會(huì)返回true呢勾给?
String s1 = new String("1") + new String("1"); //?堆中創(chuàng)建"11"字符串對(duì)象,將引用給s1滩报,同時(shí)String?pool創(chuàng)建"1"這個(gè)字符串對(duì)象
s1.intern();??由于Heap中已經(jīng)存在一個(gè), String?pool?里的"11" 直接指向Heap中的對(duì)象了播急。
String s2 = "11"; //?返回String?pool指向的那個(gè)對(duì)象脓钾。
System.out.println(s1 == s2); //?都是指向Heap中的對(duì)象,所以相等
總結(jié):對(duì)于intern()這個(gè)方法桩警,分為兩種情況:
1?如果在調(diào)用intern()這個(gè)方法之前可训,String?pool?里已經(jīng)有對(duì)應(yīng)的字符串了(一般就是我們直接寫在java文件里的“cc”這樣的字符串,在加載類的時(shí)候,虛擬機(jī)會(huì)幫我們把字面量生成String對(duì)象握截,存儲(chǔ)在String pool?里)飞崖,那么intern()直接返回String?pool?里的String對(duì)象。
2?如果在調(diào)用intern()這個(gè)方法之前谨胞,String?pool里沒有對(duì)應(yīng)字符串固歪,而我們又是通過new?String這種方式創(chuàng)建的(例如上面的new String("1") + new String("1"))。那么intern()會(huì)把"11"這個(gè)String對(duì)象(在堆上)胯努,放到String?pool?里牢裳。后面的代碼如果有?String s2 = "11";這種,那么s2就指向"11"這個(gè)堆上的String對(duì)象了叶沛。