String常量池和String#intern()

String是Java基礎(chǔ)的重要考點剃幌。可問的點多箫荡,而且很多點可以橫向切到其他考點,或縱向深入JVM渔隶。

本文略過了String的基本內(nèi)容羔挡,重點在于String#intern()。

String常量池

String常量可能會在兩種時機進入常量池:

  1. 編譯期:通過雙引號聲明的常量(包括顯示聲明间唉、靜態(tài)編譯優(yōu)化后的常量绞灼,如”1”+”2”優(yōu)化為常量”12”),在前端編譯期將被靜態(tài)的寫入class文件中的“常量池”呈野。該“常量池”會在類加載后被載入“內(nèi)存中的常量池”低矮,也就是我們平時所說的常量池。同時被冒,JIT優(yōu)化也可能產(chǎn)生類似的常量军掂。
  • 運行期:調(diào)用String#intern()方法,可能將該String對象動態(tài)的寫入上述“內(nèi)存中常量池”昨悼。

時機1的行為是明確的蝗锥。原理可閱讀class文件結(jié)構(gòu)、類加載率触、編譯期即運行期優(yōu)化等內(nèi)容终议。

時機2在jdk6和jdk7中的行為不同,下面討論。

String#intern()

讀者可直接閱讀參考資料穴张。下述總結(jié)僅為了猴子自己復習方便细燎。

聲明

/** 
 * Returns a canonical representation for the string object. 
 * <p> 
 * A pool of strings, initially empty, is maintained privately by the 
 * class <code>String</code>. 
 * <p> 
 * When the intern method is invoked, if the pool already contains a 
 * string equal to this <code>String</code> object as determined by 
 * the {@link #equals(Object)} method, then the string from the pool is 
 * returned. Otherwise, this <code>String</code> object is added to the 
 * pool and a reference to this <code>String</code> object is returned. 
 * <p> 
 * It follows that for any two strings <code>s</code> and <code>t</code>, 
 * <code>s.intern()&nbsp;==&nbsp;t.intern()</code> is <code>true</code> 
 * if and only if <code>s.equals(t)</code> is <code>true</code>. 
 * <p> 
 * All literal strings and string-valued constant expressions are 
 * interned. String literals are defined in section 3.10.5 of the 
 * <cite>The Java&trade; Language Specification</cite>. 
 * 
 * @return  a string that has the same contents as this string, but is 
 *          guaranteed to be from a pool of unique strings. 
 */  
public native String intern();

String#intern()是一個native方法。根據(jù)Javadoc皂甘,如果常量池中存在當前字符串, 就會直接返回當前字符串. 如果常量池中沒有此字符串, 會將此字符串放入常量池中后, 再返回玻驻。

實現(xiàn)原理

JNI最后調(diào)用了c++實現(xiàn)的StringTable::intern()方法:

oop StringTable::intern(Handle string_or_null, jchar* name,  
                        int len, TRAPS) {  
  unsigned int hashValue = java_lang_String::hash_string(name, len);  
  int index = the_table()->hash_to_index(hashValue);  
  oop string = the_table()->lookup(index, name, len, hashValue);  
  // Found  
  if (string != NULL) return string;  
  // Otherwise, add to symbol to table  
  return the_table()->basic_add(index, string_or_null, name, len,  
                                hashValue, CHECK_NULL);  
}
oop StringTable::lookup(int index, jchar* name,  
                        int len, unsigned int hash) {  
  for (HashtableEntry<oop>* l = bucket(index); l != NULL; l = l->next()) {  
    if (l->hash() == hash) {  
      if (java_lang_String::equals(l->literal(), name, len)) {  
        return l->literal();  
      }  
    }  
  }  
  return NULL;  
}

在the_table()返回的hash表中查找字符串,如果存在就返回偿枕,否則加入表击狮。

StringTable是一個固定大小Hashtable,默認大小是1009益老。基本邏輯與Java中HashMap相同寸莫,也使用拉鏈法解決碰撞問題捺萌。

既然是拉鏈法,那么如果放進的String非常多膘茎,就會加劇碰撞桃纯,導致鏈表非常長。最壞情況下披坏,String#intern()的性能由O(1)退化到O(n)态坦。

  • jdk6中StringTable的長度固定為1009。
  • jdk7中棒拂,StringTable的長度可以通過一個參數(shù)-XX:StringTableSize指定伞梯,默認1009。

jdk6和jdk7下String#intern()的區(qū)別

引言

相信很多Java程序員都做類似String s = new String("abc");這個語句創(chuàng)建了幾個對象的題目帚屉。這種題目主要是為了考察程序員對字符串對象常量池的掌握谜诫。上述的語句中創(chuàng)建了2個對象:

  • 第一個對象,內(nèi)容"abc"攻旦,存儲在常量池中喻旷。
  • 第二個對象,內(nèi)容"abc"牢屋,存儲在堆中且预。

問題

來看一段代碼:

public static void main(String[] args) {
    String s = new String("1");
    s.intern();
    String s2 = "1";
    System.out.println(s == s2);

    String s3 = new String("1") + new String("1");
    s3.intern();
    String s4 = "11";
    System.out.println(s3 == s4);
}

打印結(jié)果:

# jdk6下
false false
# jdk7下
false true

具體為什么稍后再解釋,然后將s3.intern();語句下調(diào)一行烙无,放到String s4 = "11";后面锋谐。將s.intern();放到String s2 = "1";后面:

public static void main(String[] args) {
    String s = new String("1");
    String s2 = "1";
    s.intern();
    System.out.println(s == s2);

    String s3 = new String("1") + new String("1");
    String s4 = "11";
    s3.intern();
    System.out.println(s3 == s4);
}

打印結(jié)果:

# jdk6下
false false
# jdk7下
false false

jdk6的解釋

image.png

注:圖中綠色線條代表String對象的內(nèi)容指向;黑色線條代表地址指向皱炉。

jdk6中怀估,上述的所有打印都是false。

因為jdk6的常量池放在Perm區(qū)中,和正常的Heap(指Eden多搀、Surviver歧蕉、Old區(qū))完全分開。具體來說:使用引號聲明的字符串都是通過編譯和類加載直接載入常量池康铭,位于Perm區(qū)惯退;new出來的String對象位于Heap(E、S从藤、O)中催跪。拿一個Perm區(qū)的對象地址和Heap中的對象地址進行比較,肯定是不相同的夷野。

Perm區(qū)主要存儲一些加載類的信息懊蒸、靜態(tài)變量、方法片段悯搔、常量池等骑丸。

jdk7的解釋

在jdk6及之前的版本中,字符串常量池都是放在Perm區(qū)的妒貌。Perm區(qū)的默認大小只有4M通危,如果多放一些大字符串,很容易拋出OutOfMemoryError: PermGen space灌曙。

因此菊碟,jdk7已經(jīng)將字符串常量池從Perm區(qū)移到正常的Heap(E、S在刺、O)中了逆害。

Perm區(qū)即永久代。本身用永久代實現(xiàn)方法區(qū)就容易遇到內(nèi)存溢出增炭;而且方法區(qū)存放的內(nèi)容也很難估計大小忍燥,沒必要放在堆中管理。jdk8已經(jīng)取消了永久代隙姿,在堆外新建了一個Metaspace實現(xiàn)方法區(qū)梅垄。

正是因為字符串常量池移到了Heap中,才產(chǎn)生了上述變化输玷。

第一段代碼

image.png

先看s3和s4:

  • 首先队丝,String s3 = new String("1") + new String("1");,生成了多個對象欲鹏,s3最終指向堆中的"11"机久。注意,此時常量池中是沒有字符串"11"的赔嚎。
  • 然后膘盖,s3.intern();胧弛,將s3中的字符串"11"放入了常量池中,因為此時常量池中不存在字符串"11"侠畔,因此常規(guī)做法與跟jdk6相同结缚,在常量池中生成一個String對象"11"——然而,jdk7中常量池不在Perm區(qū)中了软棺,相應(yīng)做了調(diào)整:常量池中不需要再存儲一份對象了红竭,而是直接存儲堆中的引用,也就是s3的引用地址喘落。
  • 接下來茵宪,String s4 = "11";,"11"通過雙引號顯示聲明瘦棋,因此會直接去常量池中查找稀火,如果沒有再創(chuàng)建。發(fā)現(xiàn)已經(jīng)有這個字符串了赌朋,也就是剛才通過s3.intern();存儲在常量池中的s3的引用地址憾股。于是,直接返回s3的引用地址箕慧,s4賦值為s3的引用,s4指向堆中的"11"茴恰。
  • 最后颠焦,s3、s4指向的堆中的"11"往枣,常量池中存儲s3的引用伐庭,滿足s3 == s4

再看s和s2:

  • 首先分冈,String s = new String("1");圾另,生成了2個對象,常量池中的"1"和堆中的"1"雕沉,s指向堆中的"1"集乔。
  • 然后,s.intern();坡椒,上一句已經(jīng)在常量池中創(chuàng)建了"1"扰路,所以此處什么都不做。
  • 接下來倔叼,汗唱,String s2 = "1";,常量池中有"1"丈攒,因此哩罪,s2直接指向常量池中的"1"授霸。
  • 最后,s指向的堆中的"1"际插,s2指向常量池中的"1"碘耳,常量池中存儲字符串"1",不滿足s == s2腹鹉。

第二段代碼

image.png

先看s3和s4藏畅,將s3.intern();放在了String s4 = "11";后:

  • 先執(zhí)行String s4 = "11";,此時功咒,常量池中不存在"11"愉阎,因此,將"11"放入常量池力奋,然后s4指向常量池中的"11"榜旦。
  • 再執(zhí)行s3.intern();,上一句已經(jīng)在常量池中創(chuàng)建了"11"景殷,所以此處什么都不做溅呢。
  • 最后,s3仍指向的堆中的"11"猿挚,s4指向常量池中的"11"咐旧,常量池中存儲字符串"11",不再滿足s3 == s4绩蜻。

再看s和s2铣墨,將s.intern();放到String s2 = "1";后:

  • 先執(zhí)行String s2 = "1";,之前已通過String s = new String("1");在常量池中創(chuàng)建了"1"办绝,因此伊约,s2直接指向常量池中的"1"
  • 再執(zhí)行s.intern();孕蝉,常量池中有"1"屡律,所以此處什么都不做。
  • 最后降淮,s指向的堆中的"1"超埋,s2指向常量池中的"1",常量池中存儲字符串"1"佳鳖,仍不滿足s == s2纳本。

區(qū)別小結(jié)

jdk7與jdk6相比,對String常量池的位置腋颠、String#intern()的語義都做了修改:

  • 將String常量池從Perm區(qū)移到了Heap區(qū)繁成。
  • 調(diào)用String#intern()方法時,堆中有該字符串而常量池中沒有淑玫,則直接在常量池中保存堆中對象的引用巾腕,而不會在常量池中重新創(chuàng)建對象面睛。

使用姿勢

建議直接閱讀參考資料。

額外的問題

String#intern()的基本用法如下:

String s1 = xxx1.toString().intern();
String s2 = xxx2.toString().intern();
assert s1 == s2;

然而尊搬,xxx1.toString()叁鉴、xxx2.toString()已經(jīng)創(chuàng)建了兩個匿名String對象,這之后再調(diào)用String#intern()佛寿。那么幌墓,這兩個匿名對象去哪了

估計猴子對創(chuàng)建對象的過程理解有問題冀泻,或許xxx1.toString()返回時還沒有將對象保存到堆上常侣?或許String#intern()上做了什么語法糖?

后面有時間再解決吧弹渔。胳施。。


參考:


本文鏈接:

本文鏈接:String常量池和String#intern()
作者:猴子007
出處:https://monkeysayhi.github.io
本文基于 知識共享署名-相同方式共享 4.0 國際許可協(xié)議發(fā)布肢专,歡迎轉(zhuǎn)載舞肆,演繹或用于商業(yè)目的,但是必須保留本文的署名及鏈接博杖。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末椿胯,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子剃根,更是在濱河造成了極大的恐慌压状,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件跟继,死亡現(xiàn)場離奇詭異,居然都是意外死亡镣丑,警方通過查閱死者的電腦和手機舔糖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來莺匠,“玉大人金吗,你說我怎么就攤上這事∪たⅲ” “怎么了摇庙?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長遥缕。 經(jīng)常有香客問我卫袒,道長,這世上最難降的妖魔是什么单匣? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任夕凝,我火速辦了婚禮宝穗,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘码秉。我一直安慰自己逮矛,他們只是感情好,可當我...
    茶點故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布转砖。 她就那樣靜靜地躺著须鼎,像睡著了一般。 火紅的嫁衣襯著肌膚如雪府蔗。 梳的紋絲不亂的頭發(fā)上晋控,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天,我揣著相機與錄音礁竞,去河邊找鬼糖荒。 笑死,一個胖子當著我的面吹牛模捂,可吹牛的內(nèi)容都是我干的捶朵。 我是一名探鬼主播,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼狂男,長吁一口氣:“原來是場噩夢啊……” “哼综看!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起岖食,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤红碑,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后泡垃,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體析珊,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年蔑穴,在試婚紗的時候發(fā)現(xiàn)自己被綠了忠寻。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,690評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡存和,死狀恐怖奕剃,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情捐腿,我是刑警寧澤纵朋,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站茄袖,受9級特大地震影響操软,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜宪祥,卻給世界環(huán)境...
    茶點故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一寺鸥、第九天 我趴在偏房一處隱蔽的房頂上張望猪钮。 院中可真熱鬧,春花似錦胆建、人聲如沸烤低。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽扑馁。三九已至,卻和暖如春凉驻,著一層夾襖步出監(jiān)牢的瞬間腻要,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工涝登, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留雄家,地道東北人。 一個月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓胀滚,卻偏偏與公主長得像趟济,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子咽笼,可洞房花燭夜當晚...
    茶點故事閱讀 44,577評論 2 353

推薦閱讀更多精彩內(nèi)容

  • ??需要說明的一點是顷编,這篇文章是以《深入理解Java虛擬機》第二版這本書為基礎(chǔ)的,這里假設(shè)大家已經(jīng)了解了JVM的運...
    Geeks_Liu閱讀 14,013評論 5 44
  • 相關(guān)概念 常量池的定義常量池(constant pool):指的是在編譯期被確定剑刑,并被保存在已編譯的.class文...
    snoweek閱讀 794評論 0 4
  • 不想說就什么都不要說 何必在意與自己不相關(guān)的人 ex
    車車車66閱讀 229評論 0 0
  • 今天當我和老婆拿著銀行卡去提款機取錢的時候媳纬,查詢余額竟然只還有一百塊錢,本來想取出錢來去買米的施掏,這一百塊錢連米都買...
    白天有多白閱讀 313評論 0 0
  • 題記:謹以此文
    青梅修閱讀 369評論 0 1