Java高級(jí)面試 —— Java String可以有多長(zhǎng)撵术?

1. 題目剖析

Java String可以有多長(zhǎng)?相信大部分人不會(huì)太關(guān)注這個(gè)問題话瞧,甚至可能有些人會(huì)認(rèn)為String要多長(zhǎng)可以有多長(zhǎng)嫩与,很明顯這是不實(shí)際的想法。假設(shè)現(xiàn)在有這樣一個(gè)場(chǎng)景:

   byte[] jsonBytes = readTaskFromFile();
   String json = new String(jsonBytes);
   Task entity = new Gson().fromJson(json, Task.class);

這段代碼看似沒什么問題交排,但是一旦文件存儲(chǔ)內(nèi)容的字節(jié)長(zhǎng)度超過String運(yùn)行時(shí)所能承受的長(zhǎng)度划滋,這里的json就不是一個(gè)完整的json字符串埃篓,這樣在使用gson做反序列化時(shí)架专,必然會(huì)因?yàn)閖son格式不正確導(dǎo)致反序列化失敗,拋出異常案狠。

2. 問題拆分

2.1 String可容納的字節(jié)有多少?

當(dāng)我們?cè)诜椒ɡ镎{(diào)用場(chǎng)景里的代碼是灿椅,其臨時(shí)變量是存儲(chǔ)在Java堆中的,String類型的長(zhǎng)度理論上取決于傳入的byte數(shù)組的長(zhǎng)度。

在創(chuàng)建byte數(shù)組時(shí),要求new []傳入的必須是一個(gè)整型類型的數(shù)據(jù),也就是說byte[]數(shù)組的最大長(zhǎng)度為Integer.MAX_VALUE,但是,我們從ArrayList的源碼可以看出,數(shù)組可分配的最大長(zhǎng)度應(yīng)該是Integer.MAX_VALUE - 8,否則會(huì)拋出OutOfMemoryError: Requested array size exceeds VM limit錯(cuò)誤:

   /**
     * The maximum size of array to allocate.
     * Some VMs reserve some header words in an array.
     * Attempts to allocate larger arrays may result in
     * OutOfMemoryError: Requested array size exceeds VM limit
     */
   private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;

但是實(shí)際上排嫌,如果真的執(zhí)行了下面的代碼:

   byte[] bytes = new byte[Integer.MAX_VALUE - 8];

還會(huì)拋出錯(cuò)誤java.lang.OutOfMemoryError: Java heap space,那是受到了Java堆可分配的內(nèi)存大小限制并徘,如何在編譯器里修改Java虛擬機(jī)堆棧的大小,這里就不多說扰魂,主要是想說明其實(shí)還有這樣一個(gè)限制因素存在麦乞。

當(dāng)String變量是一個(gè)類中的全局變量時(shí),其變量是存在在Java方法區(qū)里的劝评,這時(shí)String類型可存儲(chǔ)的字節(jié)長(zhǎng)度取決于.class描述全局String類型變量的數(shù)據(jù)結(jié)構(gòu)姐直。

例如:

   private final static String LONG_STRING = "aaaa.....";

當(dāng).java文件編譯成.class文件時(shí),其類中的靜態(tài)String數(shù)據(jù)是以以下數(shù)據(jù)結(jié)構(gòu)去存儲(chǔ)的:

   CONSTANT_Utf8_info {
       u1 tag;
       u2 length;   // 0 ~ 65535
       u1 bytes[length];
   }

u2是表示一個(gè)2個(gè)字節(jié)的數(shù)據(jù)類型蒋畜,這也就意味著允許的最大長(zhǎng)度為65535声畏。

2.2 String可容納的字符數(shù)有多少?

前面我們都是從String可存儲(chǔ)的字節(jié)數(shù)去考慮的百侧,現(xiàn)在從可存儲(chǔ)的字符數(shù)去考慮砰识,假如字符是以u(píng)tf-8編碼的能扒,其實(shí)這個(gè)問題可以直接轉(zhuǎn)換成:

一個(gè)字符使用utf-8編碼對(duì)應(yīng)多少個(gè)字節(jié)數(shù)佣渴?

Unicode bit數(shù) UTF-8 byte數(shù) 常見字符類型
0000 ~ 007F 0~7 0XXX XXXX 1 拉丁字母
0080 ~07FF 8~11 110X XXXX、10XX XXXX 2
0800 ~FFFF 12~16 1110XXXX初斑、10XX XXXX辛润、10XX XXXX 3 中文字符
1 0000 ~ 1F FFFF 17~21 1111 0XXX、10XX XXXX见秤、10XX XXXX砂竖、10XX XXXX 4 表情符號(hào)

所以,如果一個(gè)String類型可容納的字符數(shù)鹃答,應(yīng)該是這樣的:

字符類型 在Java棧中的大小 在Java堆中的大小
Latin字母 65535 Integer.MAX_VALUE - 8
中文 65535 / 3 (Integer.MAX_VALUE - 8) / 3

3. 總結(jié)

面試官問這個(gè)問題時(shí)乎澄,是希望你除了Java基礎(chǔ)深厚外,還希望你對(duì)Java虛擬機(jī)對(duì)類型的存儲(chǔ)有一定的了解测摔,另外就是希望從你的回答中置济,看出你有積極的探索欲望。有時(shí)候锋八,往往看似簡(jiǎn)單的提問浙于,其期待的結(jié)果往往涉及很多重要的知識(shí)理解。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末挟纱,一起剝皮案震驚了整個(gè)濱河市羞酗,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌紊服,老刑警劉巖檀轨,帶你破解...
    沈念sama閱讀 219,188評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件胸竞,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡裤园,警方通過查閱死者的電腦和手機(jī)撤师,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,464評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來拧揽,“玉大人剃盾,你說我怎么就攤上這事∮偻啵” “怎么了痒谴?”我有些...
    開封第一講書人閱讀 165,562評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)铡羡。 經(jīng)常有香客問我积蔚,道長(zhǎng),這世上最難降的妖魔是什么烦周? 我笑而不...
    開封第一講書人閱讀 58,893評(píng)論 1 295
  • 正文 為了忘掉前任尽爆,我火速辦了婚禮,結(jié)果婚禮上读慎,老公的妹妹穿的比我還像新娘漱贱。我一直安慰自己,他們只是感情好夭委,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,917評(píng)論 6 392
  • 文/花漫 我一把揭開白布幅狮。 她就那樣靜靜地躺著,像睡著了一般株灸。 火紅的嫁衣襯著肌膚如雪崇摄。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,708評(píng)論 1 305
  • 那天慌烧,我揣著相機(jī)與錄音逐抑,去河邊找鬼。 笑死屹蚊,一個(gè)胖子當(dāng)著我的面吹牛厕氨,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播淑翼,決...
    沈念sama閱讀 40,430評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼腐巢,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了玄括?” 一聲冷哼從身側(cè)響起冯丙,我...
    開封第一講書人閱讀 39,342評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后胃惜,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體泞莉,經(jīng)...
    沈念sama閱讀 45,801評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,976評(píng)論 3 337
  • 正文 我和宋清朗相戀三年船殉,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了鲫趁。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,115評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡利虫,死狀恐怖挨厚,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情糠惫,我是刑警寧澤疫剃,帶...
    沈念sama閱讀 35,804評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站硼讽,受9級(jí)特大地震影響巢价,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜固阁,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,458評(píng)論 3 331
  • 文/蒙蒙 一壤躲、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧备燃,春花似錦碉克、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,008評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽法瑟。三九已至冀膝,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間霎挟,已是汗流浹背窝剖。 一陣腳步聲響...
    開封第一講書人閱讀 33,135評(píng)論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留酥夭,地道東北人赐纱。 一個(gè)月前我還...
    沈念sama閱讀 48,365評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像熬北,于是被迫代替她去往敵國和親疙描。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,055評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 一讶隐、基礎(chǔ)知識(shí):1起胰、JVM、JRE和JDK的區(qū)別:JVM(Java Virtual Machine):java虛擬機(jī)...
    殺小賊閱讀 2,383評(píng)論 0 4
  • 小編費(fèi)力收集:給你想要的面試集合 1.C++或Java中的異常處理機(jī)制的簡(jiǎn)單原理和應(yīng)用巫延。 當(dāng)JAVA程序違反了JA...
    八爺君閱讀 4,592評(píng)論 1 114
  • 第6章類文件結(jié)構(gòu) 6.1 概述 6.2 無關(guān)性基石 6.3 Class類文件的結(jié)構(gòu) java虛擬機(jī)不和包括java...
    kennethan閱讀 934評(píng)論 0 2
  • 國家電網(wǎng)公司企業(yè)標(biāo)準(zhǔn)(Q/GDW)- 面向?qū)ο蟮挠秒娦畔?shù)據(jù)交換協(xié)議 - 報(bào)批稿:20170802 前言: 排版 ...
    庭說閱讀 10,988評(píng)論 6 13
  • Win7下如何打開DOS控制臺(tái)效五? a:開始--所有程序--附件--命令提示符 b:開始--搜索程序和文件--cmd...
    逍遙嘆6閱讀 1,599評(píng)論 4 12