String是Java開發(fā)中使用非常頻繁的類复濒,本文將對(duì)String的源碼和設(shè)計(jì)進(jìn)行探索府喳。
關(guān)鍵字:java蒲肋、String、immutable钝满、intern兜粘、hash
文章來(lái)源:陳同學(xué) Java基礎(chǔ)探索之String
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
private final char value[];
private int hash; // Default to 0
}
直觀來(lái)看,String及成員變量存在以下特性:
- String被final修飾弯蚜,即String不可被繼承
- String的實(shí)際存儲(chǔ)為字符數(shù)組
value
孔轴,且value被final修飾,即value指向的數(shù)組引用不可變更
了解不可變(immutable)對(duì)象
什么是不可變對(duì)象熟吏?
如果一個(gè)對(duì)象在創(chuàng)建之后距糖,不能再改變它的狀態(tài)玄窝,那么這個(gè)對(duì)象就是不可變的。
狀態(tài)指對(duì)象的成員變量悍引,有以下情況:
- 成員變量是基礎(chǔ)數(shù)據(jù)類型恩脂,那么其值不可改變
- 成員變量是引用類型,那么引用指向的對(duì)象不可改變(引用不能指向其他對(duì)象趣斤,但對(duì)象本身還是可以改變的)
為什么要設(shè)計(jì)不可變對(duì)象俩块?
immutable對(duì)象存在以下幾個(gè)優(yōu)點(diǎn):
- 線程安全,因?yàn)椴豢筛淖?read-only)浓领,因此可以被多個(gè)線程安全使用玉凯。
- 基于線程安全特性,可以在任何地方重復(fù)使用联贩,提高性能漫仆。
- 保證了hashcode的唯一性,如果緩存hashcode泪幌,在頻繁使用對(duì)象時(shí)可以不用重復(fù)計(jì)算hashcode
怎么創(chuàng)建一個(gè)不可變對(duì)象盲厌?
本質(zhì)上就是不提供任何方式改變對(duì)象的狀態(tài),以下是一些細(xì)節(jié):
- 使用final修飾類祸泪,確保沒(méi)有任何子類可以變更其不可變的特性
- 成員變量使用final修飾
- 不提供任何改變對(duì)象狀態(tài)的方法
- 若對(duì)對(duì)象進(jìn)行修改吗浩,使用拷貝的方式,不要返回對(duì)象本身
為什么String要設(shè)計(jì)成immutable没隘?
Why do we need immutable class?
這個(gè)問(wèn)題應(yīng)該拓展至一門語(yǔ)言為什么需要設(shè)計(jì)immutable數(shù)據(jù)類型懂扼?為什么基礎(chǔ)數(shù)據(jù)類型往往都是immutable的?
程序是通過(guò)代碼邏輯操縱內(nèi)存中的數(shù)據(jù)并最終持久化下來(lái)右蒲。內(nèi)存中的數(shù)據(jù)呈現(xiàn)顯示為各程序設(shè)計(jì)語(yǔ)言中的數(shù)據(jù)類型阀湿,而持久化的存儲(chǔ)可以是DB、磁盤等瑰妄。
在程序運(yùn)行時(shí)炕倘,數(shù)據(jù)會(huì)在程序中不斷進(jìn)行傳遞和變更,將基礎(chǔ)數(shù)據(jù)類型設(shè)計(jì)成immutable類型可以使得軟件構(gòu)建變更容易翰撑,因?yàn)椴挥脫?dān)心數(shù)據(jù)會(huì)在處理過(guò)程中發(fā)生變更。
Java中為8中基礎(chǔ)數(shù)據(jù)類型和String都設(shè)計(jì)了緩存池啊央。
String對(duì)象真的不可變嗎眶诈?
因?yàn)镾tring對(duì)象實(shí)際存儲(chǔ)是字符串?dāng)?shù)組,雖然無(wú)法直接變更引用所指向的對(duì)象瓜饥,但是可以直接變更對(duì)象逝撬。
也就是說(shuō):String對(duì)象的引用不可變,但是引用指向的對(duì)象可以被改變
public static void main(String[] args) throws Exception {
// 創(chuàng)建字符串"hello", 將引用s指向?qū)ο?hello". s用final修飾,無(wú)法顯示將s指向其他對(duì)象
final String s = "hello";
System.out.println(s.hashCode());
// 獲取String對(duì)象中的value字段
Field valueFiled = String.class.getDeclaredField("value");
// 將value字段設(shè)置為可訪問(wèn)的
valueFiled.setAccessible(true);
// 通過(guò)反射獲取s引用指向的對(duì)象的"value"字段的值
char[] value = (char[]) valueFiled.get(s);
// 變更對(duì)象"hello"中的第一個(gè)字符為"H", s引用還是指向這個(gè)對(duì)象
value[0] = 'H';
System.out.println(s);
System.out.println(s.hashCode());
}
輸入的結(jié)果:
通過(guò)反射變更了實(shí)際的對(duì)象乓土,但是沒(méi)有改變引用值宪潮,引用還是指向這個(gè)對(duì)象溯警。由于String緩存了hashcode,所以即使值變了狡相,但是hashcode卻沒(méi)變梯轻。
99162322
Hello
99162322
設(shè)計(jì)字符串常量池的意義在哪?
程序開發(fā)中涉及到許多池的概念尽棕,如:線程池喳挑、數(shù)據(jù)庫(kù)連接池、字符串池滔悉、Spring容器管理的單例對(duì)象以及其它的一些Buffer設(shè)計(jì)等伊诵。設(shè)計(jì)這些概念并實(shí)現(xiàn),無(wú)非是出于提高性能回官、節(jié)約資源(如內(nèi)存)之類的考慮曹宴。
由于String是immutable對(duì)象,天然的具備線程安全特性歉提,因?yàn)榭梢宰鳛槿止蚕韺?duì)象笛坦。
最為重要的是,String是Java中使用最為廣泛的類型唯袄,與8大基礎(chǔ)數(shù)據(jù)類型并列弯屈。實(shí)際應(yīng)用中,往往String的使用更為頻繁恋拷。因此設(shè)計(jì)常量池緩存String對(duì)象资厉,可以帶來(lái)如下幾個(gè)好處:
節(jié)約內(nèi)存,遇到大量重復(fù)String時(shí)節(jié)約內(nèi)存
-
提高效率蔬顾,遇到大量重復(fù)String時(shí)不用頻繁創(chuàng)建對(duì)象
?
字符串常量池在不同JDK版本中如何存儲(chǔ)宴偿?
- JDK1.6以前
常量池位于方法區(qū)中的Perm區(qū)
- jdk1.7以后
常量池位于堆中,JDK1.8時(shí)JVM內(nèi)存模型已經(jīng)移除了Perm區(qū)诀豁,由Metaspace代替
String窄刘、StringBuilder、StringBuffer的區(qū)別舷胜?
StringBuilder
- 利用char[]作為buffer存儲(chǔ)數(shù)據(jù)娩践,每次append時(shí)都是通過(guò)System.arraycopy做數(shù)據(jù)拷貝
- char[]的長(zhǎng)度默認(rèn)16,不夠時(shí)將會(huì)自動(dòng)擴(kuò)容
- 非線程安全烹骨,適合單線程下字符串拼接場(chǎng)景
StringBuffer
特性和StringBuilder一樣翻伺,但是每個(gè)操作方法中都用了synchronized
做同步處理
適合多線程下字符串拼接場(chǎng)景
String其他的有趣點(diǎn)
intern()函數(shù)的作用?
JDK源碼注釋:When the intern method is invoked, if the pool already contains a string equal to this object as determined by the method沮焕,then the string from the pool is returned吨岭;Otherwise, this object is added to the pool and a reference to this object is returned.
當(dāng)調(diào)用intern方法時(shí)時(shí),如果常量池已存在該字符串峦树,則返回其引用辣辫;否則先將該字符串加入常量池旦事,再返回其引用。
特別注意:JDK1.6及以下和JDK及以上版本對(duì)于intern的處理邏輯有變化急灭。
假設(shè):str為指向堆中字符串實(shí)例的引用姐浮,且String Pool中不存在值相同的字符串實(shí)例
- JDK1.6:調(diào)用str.intern()時(shí),若str在String Pool不存在化戳,將拷貝一份到String Pool
- JDK1.7:調(diào)用str.intern()時(shí)单料,若str在String Pool不存在,String Pool將存儲(chǔ)堆中對(duì)象的引用
下面通過(guò)一段代碼加兩張圖來(lái)解釋下:
String s1 = new String("H") + new String("i");
String s2 = s1.intern();
String s3 = "Hi";
System.out.println(s1 == s2);
System.out.println(s1 == s3);
System.out.println(s2 == s3);
執(zhí)行s1.intern()時(shí)点楼,String Pool也只會(huì)保存一個(gè)指向堆中對(duì)象的引用扫尖,不再像1.6那樣復(fù)制一個(gè)對(duì)象實(shí)例到String Pool中
理解String的加法運(yùn)算
開發(fā)中經(jīng)常會(huì)碰到String變量之間的加法操作,那JVM實(shí)際上是如何處理的呢掠廓?
下面看一個(gè)例子:
String s1 = "Hello";
String s2 = "Kitty";
String s3 = s1 + s2;
System.out.println(s3 == "HelloKitty"); // false
s3 = s1 + s2
到底會(huì)怎么處理换怖?我們看下這段代碼對(duì)應(yīng)的字節(jié)碼指令:
0: ldc #2 // String Hello
2: astore_1
3: ldc #3 // String Kitty
5: astore_2
6: new #4 // class java/lang/StringBuilder
9: dup
10: invokespecial #5 // Method java/lang/StringBuilder."<init>":()V
13: aload_1
14: invokevirtual #6 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
17: aload_2
18: invokevirtual #6 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
21: invokevirtual #7 // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
24: astore_3
25: getstatic #8 // Field java/lang/System.out:Ljava/io/PrintStream;
28: aload_3
29: ldc #9 // String HelloKitty
31: if_acmpne 38
34: iconst_1
35: goto 39
38: iconst_0
39: invokevirtual #10 // Method java/io/PrintStream.println:(Z)V
本質(zhì)上,String變量的加法運(yùn)算是通過(guò)StringBuilder來(lái)處理蟀瞧。s3 = s1 + s2實(shí)際對(duì)應(yīng)的代碼應(yīng)該是:
new StringBuilder().append("Hello").append("Kitty").toString();
而StringBuilder的toString()源碼為:
public String toString() {
// Create a copy, don't share the array
return new String(value, 0, count);
}
因此String變量的加法操作實(shí)際上是在堆中創(chuàng)建了一個(gè)String對(duì)象沉颂,同時(shí)返回對(duì)象在堆中的引用。
String的hashCode函數(shù)為何要設(shè)計(jì)緩存悦污?
String作為使用最頻繁的類型铸屉,其很多細(xì)微的設(shè)計(jì)都非常有趣。先回顧下String的屬性:
- value[] 字符數(shù)組用于存儲(chǔ)數(shù)據(jù)
- hash用來(lái)緩存hash code
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence {
/** The value is used for character storage. */
private final char value[];
/** Cache the hash code for the string */
private int hash; // Default to 0
}
hashCode的源碼:
如果hash碼已計(jì)算好切端,將不再進(jìn)行再次計(jì)算彻坛,直接返回cache的hash.
這樣設(shè)計(jì)主要是考慮到一方面String使用非常頻繁,另一方面String經(jīng)常所為一些數(shù)據(jù)結(jié)構(gòu)的檢索字段踏枣,例如:Map. 緩存hash可以提升性能
public int hashCode() {
int h = hash;
if (h == 0 && value.length > 0) {
char val[] = value;
for (int i = 0; i < value.length; i++) {
h = 31 * h + val[i];
}
hash = h;
}
return h;
}
String的immutable特性
String是不可變對(duì)象昌屉,前面我們也探討了怎么樣設(shè)計(jì)一個(gè)不可變對(duì)象。這里來(lái)看看String的情況:
- 類命茵瀑、實(shí)際存儲(chǔ)數(shù)據(jù)的字符數(shù)組都用final修飾
- 沒(méi)有提供任何setter方法
- 操作性的函數(shù)都是拷貝新的對(duì)象
針對(duì)第三點(diǎn)间驮,我們看幾個(gè)實(shí)際的函數(shù):
replace:返回的是new String
public String replace(char oldChar, char newChar) {
if (oldChar != newChar) {
...
return new String(buf, true);
...
}
return this;
}
substring: 返回的是new String
public String substring(int beginIndex, int endIndex) {
...
return ((beginIndex == 0) && (endIndex == value.length)) ? this
: new String(value, beginIndex, subLen);
}
編譯器對(duì)于String的優(yōu)化
現(xiàn)在編譯器會(huì)對(duì)String的操作做些基本的優(yōu)化,下面用代碼舉例:
編譯前的Java代碼
String s1 = "H" + "i";
final String s2 = "H";
String s3 = s2 + "i";
String s4 = s1 + s2;
編譯后的class進(jìn)行反編譯
String s1 = "Hi";
String s2 = "H";
String s3 = "Hi";
String s4 = s1 + "H";