spilt的坑

之前對于string.spilt()的用法沒有做過仔細(xì)研究,線上的項目已經(jīng)上線很久,查看error日志,發(fā)現(xiàn)了ArrayIndexOutOfBoundsException(數(shù)組越界).百思不得其解,追蹤相應(yīng)代碼也沒有發(fā)現(xiàn)有明顯異常,spilt()用法看著沒有明顯錯誤,所有的報文解析中,在一個小時內(nèi)只出現(xiàn)了這么兩筆訂單查詢報錯.很是詭異.于是拿著訂單號,追蹤全部日志.
根據(jù)正常和異常返回日志,進行現(xiàn)場復(fù)原.debug時,發(fā)現(xiàn)了異常.

自己寫了一個小demo復(fù)原:
字符串中包含編程語言信息,其中每個語言通過"|",進行分割.形如"java|C|C#|C++|Python",spilt數(shù)組應(yīng)該有5個對象.我們對字符串進行稍加改動,形如java|C||C#|C++|Python,java|C||C#|C++|Python||,spitl在對字符串進行分割的時候就有些許不同了.

        String str0 = "java|C|C#|C++|Python";
        String str1 = "java|C||C#|C++|Python";
        String str2 = "java|C||C#|C++|Python||";
        String[] lans1 = str0.split("\\|");
        String[] lans2 = str1.split("\\|");
        String[] lans3 = str2.split("\\|");
        System.out.println("lans1.length: "+lans1.length);
        System.out.println("lans2.length: "+lans2.length);
        System.out.println("lans3.length: "+lans3.length);
        System.out.println("Spilt的坑");

我們預(yù)估lans1.length = 5;lans2.length =6;lans3.length =8


輸出結(jié)果

可以看到實際輸出并不是如我們預(yù)計.為什么呢?半路出家學(xué)java,這個地方咋整呢,ctrl + click 看下源碼吧.

    public String[] split(String regex) {
        return split(regex, 0); //這個地方的"0",作為默認(rèn)參數(shù)傳入,此事必有蹊蹺.
    }

regex不用解釋,就是進行分割的正則表達.
我們深入public String[] split(String regex, int limit)看下第二個參數(shù)有什么作用.

    public String[] split(String regex, int limit) {
        /* fastpath if the regex is a
         (1)one-char String and this character is not one of the
            RegEx's meta characters ".$|()[{^?*+\\", or
         (2)two-char String and the first char is the backslash and
            the second is not the ascii digit or ascii letter.
         */
        char ch = 0;
        if (((regex.value.length == 1 &&
             ".$|()[{^?*+\\".indexOf(ch = regex.charAt(0)) == -1) ||
             (regex.length() == 2 &&
              regex.charAt(0) == '\\' &&
              (((ch = regex.charAt(1))-'0')|('9'-ch)) < 0 &&
              ((ch-'a')|('z'-ch)) < 0 &&
              ((ch-'A')|('Z'-ch)) < 0)) &&
            (ch < Character.MIN_HIGH_SURROGATE ||
             ch > Character.MAX_LOW_SURROGATE))
        {
            int off = 0;
            int next = 0;
            boolean limited = limit > 0;
            ArrayList<String> list = new ArrayList<>();
            while ((next = indexOf(ch, off)) != -1) {
                if (!limited || list.size() < limit - 1) {
                    list.add(substring(off, next));
                    off = next + 1;
                } else {    // last one
                    //assert (list.size() == limit - 1);
                    list.add(substring(off, value.length));
                    off = value.length;
                    break;
                }
            }
            // If no match was found, return this
            if (off == 0)
                return new String[]{this};

            // Add remaining segment
            if (!limited || list.size() < limit)
                list.add(substring(off, value.length));

            // Construct result
            int resultSize = list.size();
            if (limit == 0) {
                while (resultSize > 0 && list.get(resultSize - 1).length() == 0) {
                    resultSize--;
                }
            }
            String[] result = new String[resultSize];
            return list.subList(0, resultSize).toArray(result);
        }
        return Pattern.compile(regex).split(this, limit);
    }

先不看if條件語句,我們的重點是判斷一下第二參數(shù)的作用,(if條件判斷很復(fù)雜,沒看懂呀)
結(jié)論就是:

  • imit > 0 ,模式最多使用n-1次撑瞧,數(shù)組長度不會大于n棵譬,而且數(shù)組的最后一項將包含所有超出最后匹配的定界符的輸入。
  • limit <=0, 模式會使用盡可能多的次數(shù)预伺,而且數(shù)組是任意長度订咸。如果limit = 0,那么最后的空字符串會被丟棄

建議使用Guava中的Spilter中的方法扭屁。

List<String> params = Splitter.on("|").splitToList(response);
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末算谈,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子料滥,更是在濱河造成了極大的恐慌然眼,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,376評論 6 491
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件葵腹,死亡現(xiàn)場離奇詭異高每,居然都是意外死亡,警方通過查閱死者的電腦和手機践宴,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,126評論 2 385
  • 文/潘曉璐 我一進店門鲸匿,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人阻肩,你說我怎么就攤上這事带欢。” “怎么了烤惊?”我有些...
    開封第一講書人閱讀 156,966評論 0 347
  • 文/不壞的土叔 我叫張陵乔煞,是天一觀的道長。 經(jīng)常有香客問我柒室,道長渡贾,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,432評論 1 283
  • 正文 為了忘掉前任雄右,我火速辦了婚禮空骚,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘擂仍。我一直安慰自己囤屹,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,519評論 6 385
  • 文/花漫 我一把揭開白布防楷。 她就那樣靜靜地躺著牺丙,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上冲簿,一...
    開封第一講書人閱讀 49,792評論 1 290
  • 那天粟判,我揣著相機與錄音,去河邊找鬼峦剔。 笑死档礁,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的吝沫。 我是一名探鬼主播呻澜,決...
    沈念sama閱讀 38,933評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼惨险!你這毒婦竟也來了羹幸?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,701評論 0 266
  • 序言:老撾萬榮一對情侶失蹤辫愉,失蹤者是張志新(化名)和其女友劉穎栅受,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體恭朗,經(jīng)...
    沈念sama閱讀 44,143評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡屏镊,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,488評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了痰腮。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片而芥。...
    茶點故事閱讀 38,626評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖膀值,靈堂內(nèi)的尸體忽然破棺而出棍丐,到底是詐尸還是另有隱情,我是刑警寧澤沧踏,帶...
    沈念sama閱讀 34,292評論 4 329
  • 正文 年R本政府宣布骄酗,位于F島的核電站,受9級特大地震影響悦冀,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜睛琳,卻給世界環(huán)境...
    茶點故事閱讀 39,896評論 3 313
  • 文/蒙蒙 一盒蟆、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧师骗,春花似錦历等、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,742評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春寡夹,著一層夾襖步出監(jiān)牢的瞬間处面,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,977評論 1 265
  • 我被黑心中介騙來泰國打工菩掏, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留魂角,地道東北人。 一個月前我還...
    沈念sama閱讀 46,324評論 2 360
  • 正文 我出身青樓智绸,卻偏偏與公主長得像野揪,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子瞧栗,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,494評論 2 348

推薦閱讀更多精彩內(nèi)容

  • 前言 最先接觸編程的知識是在大學(xué)里面迹恐,大學(xué)里面學(xué)了一些基礎(chǔ)的知識挣惰,c語言,java語言系草,單片機的匯編語言等通熄;大學(xué)畢...
    oceanfive閱讀 3,048評論 0 7
  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn)找都,斷路器唇辨,智...
    卡卡羅2017閱讀 134,629評論 18 139
  • 1. Java基礎(chǔ)部分 基礎(chǔ)部分的順序:基本語法,類相關(guān)的語法能耻,內(nèi)部類的語法赏枚,繼承相關(guān)的語法,異常的語法晓猛,線程的語...
    子非魚_t_閱讀 31,598評論 18 399
  • 一饿幅、Java 簡介 Java是由Sun Microsystems公司于1995年5月推出的Java面向?qū)ο蟪绦蛟O(shè)計...
    子非魚_t_閱讀 4,160評論 1 44
  • 這部迪士尼動畫是因為女兒拙泽,看了數(shù)不清多少遍慷垮,但每次女兒還是喜歡看歉铝,我依然會陪著看送丰。 女兒喜歡里面的姐姐会油,每次出去看...
    長弓心悅閱讀 307評論 0 0