本文源自https://www.zhihu.com/question/29884421,由原作者回答整理而成秸抚,感謝凄诞。
String類
String類是一個final類(不可被繼承)斗锭,內部通過一個final字符數組表示該字符串內容。一旦String對象被創(chuàng)建后偿渡,就不能再修改此對象中存儲的字符串內容臼寄。String對象的所有編輯功能都是通過創(chuàng)建一個新的對象來實現的,而不是對原有對象進行修改溜宽。
它的equals()方法是通過比較字符數組的內容是否相等來判斷字符串對象是否相等吉拳。
這里順帶說一下toString()方法:System.out.println()方法會調用打印對象的toString()方法。Object基類默認的toString()方法返回的是getClass().getName() +"@"+ hashcode()适揉,而String類重寫了Object基類的toString()方法留攒,來返回String的字面量。
String賦值方式
String有兩種賦值方式嫉嘀,第一種是通過"字面量"賦值炼邀,比如String str = "Hello"。第二種是通過new關鍵字創(chuàng)建新對象剪侮,比如String str = new String("Hello")拭宁。
這兩種方式到底有什么不同?程序執(zhí)行的時候,內存里到底有幾個"實例"杰标?"實例"存在了內存的哪里兵怯?"字面量"又存在了哪里?"變量"又存在了哪里腔剂?
內存回顧
講之前媒区,先回顧一下內存。
我們主要看運行時數據區(qū)掸犬,一般講起來虛擬機內存最主要的就是三塊:堆和棧和方法區(qū)驻仅。
將這三塊放大并分析:
(下圖中的非堆(Non Heap)可以粗略理解為代表著與堆區(qū)分開來的一塊區(qū)域,包括代碼緩沖和永生帶登渣,永生帶中包括了駐留字符串區(qū)(即我們要重點講的字符串常量池)和方法區(qū),也就是說這里我們將方法區(qū)歸在非堆中毡泻。)
堆
上圖中胜茧,首先堆分成新生代和老年代,先不用管它仇味,這是GC垃圾回收時候的事呻顽。
棧
再說棧,重要的是棧里的局部變量表(Local Variables)和操作數棧(Operand Stack)丹墨。棧是線程私有的廊遍,每個線程里的每個方法被執(zhí)行的時候都會創(chuàng)建一個棧幀(Stack Frame),而每個棧幀里對應的都維護著一個局部變量表和操作數棧贩挣。我們總說基本型和對象引用存在棧里喉前,其實就是存在局部變量表里。而操作數棧是線程實際的操作臺王财÷延兀看下面這張圖,做個加法100+98绒净,局部變量表就是存數據的地方见咒,一直不變,到加法做完再把和加進去挂疆。操作數棧就很忙了改览,先把兩個數字壓進去,再求和缤言,算出來以后再彈出去宝当。
非堆中的方法區(qū)
我們再說方法區(qū)。"類"被加載后的信息墨闲、常量今妄、靜態(tài)變量存放在方法區(qū),方法區(qū)全局共享。在Hotspot里方法區(qū)也叫"永生代"盾鳞,但兩者不能等同犬性。
上面說了,每個類加載完之后腾仅,數據都存在方法區(qū)里乒裆。和String最相關的是方法區(qū)中的類數據中的運行時常量池(Run-Time Constant pool),它是每個類私有的推励。后面會說到鹤耍,每個class文件里的class文件常量池在類被加載器加載之后,就映射存放在這個地方验辞。另外一個是字符串常量池稿黄,它和運行時常量池不是—個概念,字符串常量池是全局共享的跌造。位置就在第二張圖里Interned Strings(駐留字符串區(qū))的位置杆怕,可以理解為在永生代里,方法區(qū)外面壳贪。后面會講到陵珍,String.intern()方法,字符串駐留之后违施,字符串的引用就放在這個String Pool互纯。
String創(chuàng)建分析
編譯成Test.class文件之后,如下圖磕蒲,除了版本留潦、字段、方法亿卤、接口等描述信息外愤兵,還有一個也叫常量池的東西(淡綠色區(qū)塊,即前面提到的class文件常量池)排吴,但這個常量池和內存里的常量池不是一個東西秆乳。class文件里的常量池主要存兩個東西:"字面量"和"符號引用量"。其中字面量就包括類中定義的一些常量钻哩,因為String是不可變的(由final關鍵字修飾過了)屹堰,所以代碼里的"Hello"字符串,就是作為字面量(常量)寫在class文件常量池里街氢。
運行程序用到Test類的時候扯键,Test.class會被類加載器加載,而Test.class文件的信息就會被解析到內存的方法區(qū)里珊肃。class文件常量池里大部分數據會被加載到運行時常量池荣刑。但String不是馅笙,例子中的"Hello"的一個引用會被存到同樣在Non Heap區(qū)的字符串常量池里,而"Hello"本體還是和所有對象一樣厉亏,被創(chuàng)建在堆區(qū)董习。測試的結果是在新生代的Eden區(qū),但因為一直有一個引用駐留在字符串常量池爱只,所以不會被GC清理掉皿淋。這個?Hello對象會生存到整個線程結束。如下圖所示恬试,字符串常量池的具體位置是在過去說的永生代里窝趣,方法區(qū)的外面。
注意:這只是在Test類被類加載器加載時候的情形训柴。主線程中的str變量這時候都還沒有被創(chuàng)建哑舒,但Hello的實例已經在堆里了,對它的引用也已經在字符串常量池里了幻馁。等主線程開始創(chuàng)建str變量的時候散址,虛擬機就會到字符串常量池里找,看有沒有equals("Hello")為true的String宣赔。如果找到了,就在棧區(qū)當前棧幀的局部變量表里創(chuàng)建str變量瞪浸,然后把字符串常量池里對Hello對象的引用復制給str變量儒将。找不到的話,才會在堆重新創(chuàng)建一個對象对蒲,然后把引用駐留到字符串常量區(qū)钩蚊,然后再把引用復制到棧幀的局部變量表。
如果我們定義了很多個值為"Hello"的字符串蹈矮,比如String str1 = "Hello";String str2 = "Hello";String str3 = "Hello";砰逻,有三個變量,也不會在堆上增加String實例泛鸟,局部變量表里三個變量統(tǒng)一指向同一個堆內存地址蝠咆。
但如果是下面的情況:String str1 = "Hello";String str2 = "Hello";String str3 = new String("Hello");,str3會指向一塊由new關鍵字創(chuàng)建的的新對象北滥。雖然字面還是"Hello"刚操,但是是完全不同的對象,有不同的內存地址再芋。
intern()方法
intern()方法讓我們能手動檢查字符串常量池菊霜,把有新字面值的字符串地址駐留到常量池中。
最后補充一下济赎,JDK7開始HotSpot把Interned String從PermGen移到堆鉴逞,JDK8又徹底取消了PermGen记某。但不管怎樣,基本原來還是不變的构捡。