String有長度限制嗎怜庸?是多少当犯?

在我及我旁邊的朋友面試經(jīng)歷來看,這個問題幾乎沒有問到過休雌,這兩天看到公眾號【JAVA葵花寶典】里的一篇文章的談到了這個面試題灶壶,于是就收藏分享一下。

前言

java中的字符串有長度限制(當(dāng)文件比較大時杈曲,將固定文件轉(zhuǎn)碼成base64的形式用字符串存儲驰凛,在運行時需要的時候再轉(zhuǎn)換回來),那這個規(guī)范限制到底是怎么樣的担扑,話不多說看下文恰响。

String

首先要知道String的長度限制我們就需要知道String是怎么存儲字符串的,String其實是使用一個char類型的數(shù)組來存儲字符串中的字符的涌献。


存儲String的容器

這段代碼是存儲字符串的容器

那么String既然是數(shù)組形式的存儲胚宦,那數(shù)組會有長度的限制嗎?是的有限制,但是是在有前提條件下的枢劝,我們看看String中返回length的方法

String 類中的length方法

由此看到返回值類型是int類型井联,就java中定義數(shù)組是可以給數(shù)組指定長度的,當(dāng)然不指定的話默認(rèn)會根據(jù)數(shù)組元素來定

int[] arr1? = new int[20];? // 定義一個長度為20的數(shù)組

int[] arr2 = {1, 2, 3, 4, 5};? // 此數(shù)組的長度為5

整數(shù)在java中是有限制的您旁,我們通過源碼來看看int類型對應(yīng)的包裝類Integer可以看到烙常,其長度最大限制為2^31-1,那么說明了數(shù)組的長度是0~2^31-1鹤盒,那么計算一下就是(2^31-1 = 2147483647 = 4GB)


Integer的取值范圍

看到這我們嘗試通過編碼來驗證一下上述觀點


以字面量形式定義字符串

以上是通過定義字面量的形式構(gòu)造的10萬個字符的字符串蚕脏,編譯之后虛擬機提示報錯,說我們的字符串長度過長侦锯,不是說好了可以存21億個嗎驼鞭?為什么才10萬個就報錯了呢?

其實這里涉及到了JVM編譯規(guī)范的限制了尺碰,其實JVM在編譯時挣棕,如果我們將字符串定義成了字面量的形式,編譯時JVM是會將其存放在常量池中葱蝗,這時候JVM對這個常量池存儲String類型做出了限制穴张,接下來我們先看下手冊是如何說的细燎。


java虛擬機規(guī)范截圖

常量池中两曼,每個 cp_info 項的格式必須相同,它們都以一個表示 cp_info 類型的單字節(jié) “tag”項開頭玻驻。后面 info[]項的內(nèi)容 由tag 的類型所決定悼凑。


java虛擬機規(guī)范手冊常量類型表

我們可以看到 String類型的表示是 CONSTANT_String ,我們來看下CONSTANT_String具體是如何定義的璧瞬。


這里定義的 u2 string_index 表示的是常量池的有效索引户辫,其類型是CONSTANT_Utf8_info 結(jié)構(gòu)體表示的,這里我們需要注意的是其中定義的length我們看下面這張圖嗤锉。歷史文章:200期階段匯總


在class文件中u2表示的是無符號數(shù)占2個字節(jié)單位渔欢,我們知道1個字節(jié)占8位,2個字節(jié)就是16位 瘟忱,那么2個字節(jié)能表示的范圍就是2^16- 1 = 65535 奥额。范中class文件格式對u1、u2的定義的解釋做了一下摘要:

這里對java虛擬機規(guī)摘要部分

1访诱、class文件中文件內(nèi)容類型解釋

定義一組私有數(shù)據(jù)類型來表示 Class 文件的內(nèi)容垫挨,它們包括 u1,u2 和 u4触菜,分別代 表了 1九榔、2 和 4 個字節(jié)的無符號數(shù)。

每個 Class 文件都是由 8 字節(jié)為單位的字節(jié)流組成,所有的 16 位哲泊、32 位和 64 位長度的數(shù) 據(jù)將被構(gòu)造成 2 個剩蟀、4 個和 8 個 8 字節(jié)單位來表示。

2切威、程序異常處理的有效范圍解釋

start_pc 和 end_pc 兩項的值表明了異常處理器在 code[]數(shù)組中的有效范圍喻旷。

start_pc 必須是對當(dāng)前 code[]數(shù)組中某一指令的操作碼的有效索引,end_pc 要 么是對當(dāng)前 code[]數(shù)組中某一指令的操作碼的有效索引牢屋,要么等于 code_length 的值且预,即當(dāng)前 code[]數(shù)組的長度。start_pc 的值必須比 end_pc 小烙无。

當(dāng)程序計數(shù)器在范圍[start_pc, end_pc)內(nèi)時锋谐,異常處理器就將生效。即設(shè) x 為 異常句柄的有效范圍內(nèi)的值截酷,x 滿足:start_pc ≤ x < end_pc涮拗。

實際上,end_pc 值本身不屬于異常處理器的有效范圍這點屬于 Java 虛擬機歷史上 的一個設(shè)計缺陷:如果 Java 虛擬機中的一個方法的 code 屬性的長度剛好是 65535 個字節(jié)迂苛,并且以一個 1 個字節(jié)長度的指令結(jié)束三热,那么這條指令將不能被異常處理器 所處理。

不過編譯器可以通過限制任何方法三幻、實例初始化方法或類初始化方法的code[]數(shù)組最大長度為 65534就漾,這樣可以間接彌補這個 BUG。

注意:這里對個人認(rèn)為比較重要的點做了標(biāo)記念搬,首先第一個加粗說白了就是說數(shù)組有效范圍就是【0-65565】但是第二個加粗的地方又解釋了抑堡,因為虛擬機還需要1個字節(jié)的指令作為結(jié)束,所以其實真正的有效范圍是【0-65564】朗徊,這里要注意這里的范圍僅限編譯時期首妖,如果你是運行時拼接的字符串是可以超出這個范圍的。

接下來我們通過一個小實驗來測試一下我們構(gòu)建一個長度為65534的字符串爷恳,看看是否就能編譯通過有缆。歷史文章:200期階段匯總

首先通過一個for循環(huán)構(gòu)建65534長度的字符串,在控制臺打印后温亲,我們通過自己度娘的一個在線字符統(tǒng)計工具計算了一下確實是65534個字符棚壁,如下:



然后我們將字符復(fù)制后以定義字面量的形式賦值給字符串,可以看到我們選擇這些字符右下角顯示的確實是65534铸豁,于是乎運行了一波灌曙,果然成功了。



看到這里我們來總結(jié)一下:

問:字符串有長度限制嗎节芥?是多少在刺?

答:首先字符串的內(nèi)容是由一個字符數(shù)組 char[] 來存儲的逆害,由于數(shù)組的長度及索引是整數(shù),且String類中返回字符串長度的方法length() 的返回值也是int 蚣驼,所以通過查看java源碼中的類Integer我們可以看到Integer的最大范圍是2^31 -1,由于數(shù)組是從0開始的魄幕,所以數(shù)組的最大長度可以使【0~2^31】通過計算是大概4GB。

但是通過翻閱java虛擬機手冊對class文件格式的定義以及常量池中對String類型的結(jié)構(gòu)體定義我們可以知道對于索引定義了u2颖杏,就是無符號占2個字節(jié)纯陨,2個字節(jié)可以表示的最大范圍是2^16 -1 = 65535。

其實是65535留储,但是由于JVM需要1個字節(jié)表示結(jié)束指令翼抠,所以這個范圍就為65534了。超出這個范圍在編譯時期是會報錯的获讳,但是運行時拼接或者賦值的話范圍是在整形的最大范圍阴颖。

結(jié)尾

此次分享到這里就結(jié)束了,希望可以幫到大家丐膝,拿下大廠offer量愧。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市帅矗,隨后出現(xiàn)的幾起案子偎肃,更是在濱河造成了極大的恐慌,老刑警劉巖浑此,帶你破解...
    沈念sama閱讀 212,454評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件累颂,死亡現(xiàn)場離奇詭異,居然都是意外死亡尤勋,警方通過查閱死者的電腦和手機喘落,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,553評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來最冰,“玉大人,你說我怎么就攤上這事稀火∨冢” “怎么了?”我有些...
    開封第一講書人閱讀 157,921評論 0 348
  • 文/不壞的土叔 我叫張陵凰狞,是天一觀的道長篇裁。 經(jīng)常有香客問我,道長赡若,這世上最難降的妖魔是什么达布? 我笑而不...
    開封第一講書人閱讀 56,648評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮逾冬,結(jié)果婚禮上黍聂,老公的妹妹穿的比我還像新娘躺苦。我一直安慰自己,他們只是感情好产还,可當(dāng)我...
    茶點故事閱讀 65,770評論 6 386
  • 文/花漫 我一把揭開白布匹厘。 她就那樣靜靜地躺著,像睡著了一般脐区。 火紅的嫁衣襯著肌膚如雪愈诚。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,950評論 1 291
  • 那天牛隅,我揣著相機與錄音炕柔,去河邊找鬼。 笑死媒佣,一個胖子當(dāng)著我的面吹牛汗唱,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播丈攒,決...
    沈念sama閱讀 39,090評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼哩罪,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了巡验?” 一聲冷哼從身側(cè)響起际插,我...
    開封第一講書人閱讀 37,817評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎显设,沒想到半個月后框弛,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,275評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡捕捂,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,592評論 2 327
  • 正文 我和宋清朗相戀三年瑟枫,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片指攒。...
    茶點故事閱讀 38,724評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡慷妙,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出允悦,到底是詐尸還是另有隱情膝擂,我是刑警寧澤,帶...
    沈念sama閱讀 34,409評論 4 333
  • 正文 年R本政府宣布隙弛,位于F島的核電站架馋,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏全闷。R本人自食惡果不足惜叉寂,卻給世界環(huán)境...
    茶點故事閱讀 40,052評論 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望总珠。 院中可真熱鬧屏鳍,春花似錦勘纯、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,815評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至降淮,卻和暖如春超埋,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背佳鳖。 一陣腳步聲響...
    開封第一講書人閱讀 32,043評論 1 266
  • 我被黑心中介騙來泰國打工霍殴, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人系吩。 一個月前我還...
    沈念sama閱讀 46,503評論 2 361
  • 正文 我出身青樓来庭,卻偏偏與公主長得像,于是被迫代替她去往敵國和親穿挨。 傳聞我的和親對象是個殘疾皇子月弛,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,627評論 2 350

推薦閱讀更多精彩內(nèi)容