字符串反轉(zhuǎn)string源碼實(shí)現(xiàn)

public AbstractStringBuilder reverse() {
        boolean hasSurrogates = false;
        int n = count - 1;
        for (int j = (n-1) >> 1; j >= 0; j--) {
            int k = n - j;
            char cj = value[j];
            char ck = value[k];
            value[j] = ck;
            value[k] = cj;
           //判斷字符是否為Unicode字符逗威,16位Unicode字符會占2位
            if (Character.isSurrogate(cj) ||
                Character.isSurrogate(ck)) {
                hasSurrogates = true;
            }
        }
        if (hasSurrogates) {
           //對Unicode字符進(jìn)行判定恒界,互換i和i+1位置
          //String 對象以UTF-16保存 Unicode 字符鹉梨,需要用2個(gè)字符表示一個(gè)超大字符集的漢字鳖枕,這這種表示方式稱之為 Surrogate蝶怔,第一個(gè)字符叫 Surrogate High伟叛,第二個(gè)就是 Surrogate Low勃教,因反轉(zhuǎn)導(dǎo)致字單元char位置互換淤击,保持字符正確需全局遍歷將High和low位置修改正確
            reverseAllValidSurrogatePairs();
        }
        return this;
    }
private void reverseAllValidSurrogatePairs() {
        for (int i = 0; i < count - 1; i++) {
            char c2 = value[i];
            if (Character.isLowSurrogate(c2)) {
                char c1 = value[i + 1];
                if (Character.isHighSurrogate(c1)) {
                    value[i++] = c1;
                    value[i] = c2;
                }
            }
        }
    }
public static boolean isSurrogate(char ch) {
        return ch >= MIN_SURROGATE && ch < (MAX_SURROGATE + 1);
    }
public static boolean isLowSurrogate(char ch) {
        return ch >= MIN_LOW_SURROGATE && ch < (MAX_LOW_SURROGATE + 1);
    }
public static boolean isHighSurrogate(char ch) {
        // Help VM constant-fold; MAX_HIGH_SURROGATE + 1 == MIN_LOW_SURROGATE
        return ch >= MIN_HIGH_SURROGATE && ch < (MAX_HIGH_SURROGATE + 1);
    }

一個(gè)完整的 Unicode 字符叫代碼點(diǎn)CodePoint,而一個(gè) Java char 叫 代碼單元 code unit故源。String 對象以UTF-16保存 Unicode 字符污抬,需要用2個(gè)字符表示一個(gè)超大字符集的漢字,這這種表示方式稱之為 Surrogate心软,第一個(gè)字符叫 Surrogate High壕吹,第二個(gè)就是 Surrogate Low。具體需要注意的事宜如下:

  1. 判斷一個(gè)char是否是Surrogate區(qū)的字符删铃,用Character的 isHighSurrogate()/isLowSurrogate()方法即可判斷耳贬。從兩個(gè)Surrogate High/Low 字符,返回一個(gè)完整的 Unicode CodePoint 用 Character.toCodePoint()/codePointAt()方法猎唁。
  2. 一個(gè)Code Point咒劲,可能需要一個(gè)也可能需要兩個(gè)char表示,因此不能直接使用 CharSequence.length()方法直接返回一個(gè)字符串到底有多少個(gè)漢字诫隅,而需要用String.codePointCount()/Character.codePointCount()腐魂。
  3. 要定位字符串中的第N個(gè)字符,不能直接將N作為偏移量逐纬,而需要從字符串頭部依次遍歷得到蛔屹,需要用String/Character.offsetByCodePoints() 方法。
  4. 從字符串的當(dāng)前字符豁生,找到上一個(gè)字符兔毒,也不能直接用offset-- 實(shí)現(xiàn),而需要用 String.codePointBefore()/Character.codePointBefore()甸箱,或用 String/Character.offsetByCodePoints()
  5. 從當(dāng)前字符育叁,找下一個(gè)字符,不能直接用 offset++實(shí)現(xiàn)芍殖,需要判斷當(dāng)前 CodePoint的長度后豪嗽,再計(jì)算得到,或用String/Character.offsetByCodePoints()。

參考: 文章

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末龟梦,一起剝皮案震驚了整個(gè)濱河市隐锭,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌变秦,老刑警劉巖成榜,帶你破解...
    沈念sama閱讀 216,372評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異蹦玫,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)刘绣,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,368評論 3 392
  • 文/潘曉璐 我一進(jìn)店門樱溉,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人纬凤,你說我怎么就攤上這事福贞。” “怎么了停士?”我有些...
    開封第一講書人閱讀 162,415評論 0 353
  • 文/不壞的土叔 我叫張陵挖帘,是天一觀的道長。 經(jīng)常有香客問我恋技,道長拇舀,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,157評論 1 292
  • 正文 為了忘掉前任蜻底,我火速辦了婚禮骄崩,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘薄辅。我一直安慰自己要拂,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,171評論 6 388
  • 文/花漫 我一把揭開白布站楚。 她就那樣靜靜地躺著,像睡著了一般窿春。 火紅的嫁衣襯著肌膚如雪拉一。 梳的紋絲不亂的頭發(fā)上谁尸,一...
    開封第一講書人閱讀 51,125評論 1 297
  • 那天,我揣著相機(jī)與錄音良蛮,去河邊找鬼抽碌。 笑死,一個(gè)胖子當(dāng)著我的面吹牛货徙,可吹牛的內(nèi)容都是我干的左权。 我是一名探鬼主播,決...
    沈念sama閱讀 40,028評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼痴颊,長吁一口氣:“原來是場噩夢啊……” “哼赏迟!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起蠢棱,我...
    開封第一講書人閱讀 38,887評論 0 274
  • 序言:老撾萬榮一對情侶失蹤锌杀,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后泻仙,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體糕再,經(jīng)...
    沈念sama閱讀 45,310評論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,533評論 2 332
  • 正文 我和宋清朗相戀三年玉转,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了突想。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,690評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡究抓,死狀恐怖猾担,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情刺下,我是刑警寧澤绑嘹,帶...
    沈念sama閱讀 35,411評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站怠李,受9級特大地震影響圾叼,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜捺癞,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,004評論 3 325
  • 文/蒙蒙 一夷蚊、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧髓介,春花似錦惕鼓、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,659評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至一膨,卻和暖如春呀邢,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背豹绪。 一陣腳步聲響...
    開封第一講書人閱讀 32,812評論 1 268
  • 我被黑心中介騙來泰國打工价淌, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 47,693評論 2 368
  • 正文 我出身青樓蝉衣,卻偏偏與公主長得像括尸,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子病毡,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,577評論 2 353