JDK源碼閱讀筆記--String

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence,
               Constable, ConstantDesc

String實(shí)現(xiàn)了5個接口鸠信,Serializable和Comparable比較好理解,后面三個比較難理解

CharSequence

字節(jié)序列唠摹,提供只讀的魂务,統(tǒng)一的訪問自己序列方法。

int length(); 
char charAt(int index);
CharSequence subSequence(int start, int end);
public String toString();

這些方法的作用都比較好理解考阱。
接口中還提供了幾個默認(rèn)方法

1.public default IntStream chars()

java8添加翠忠,返回Int流。之所以是Int類型是因?yàn)閖ava字符串采用的編碼格式是utf-16或Latin,單個字符可能最大時32位

public default IntStream chars() {
        class CharIterator implements PrimitiveIterator.OfInt {
            int cur = 0;

            public boolean hasNext() {
                return cur < length();
            }

            public int nextInt() {
                if (hasNext()) {
                    return charAt(cur++);
                } else {
                    throw new NoSuchElementException();
                }
            }

            @Override
            public void forEachRemaining(IntConsumer block) {
                for (; cur < length(); cur++) {
                    block.accept(charAt(cur));
                }
            }
        }

        return StreamSupport.intStream(() ->
                Spliterators.spliterator(
                        new CharIterator(),
                        length(),
                        Spliterator.ORDERED),
                Spliterator.SUBSIZED | Spliterator.SIZED | Spliterator.ORDERED,
                false);
    }

其中有一個內(nèi)部類乞榨,實(shí)現(xiàn)PrimitiveIterator.OfInt ,Int迭代器秽之。
forEachRemaining的意思是對剩下的未迭代的元素繼續(xù)迭代,不同于forEach每次調(diào)用重新迭代吃既,所有元素只會迭代一次考榨。

public static Spliterator.OfInt spliterator(PrimitiveIterator.OfInt iterator,
                                                long size,
                                                int characteristics)

Int分割器,第一個參數(shù)Int迭代器鹦倚,第二次參數(shù)是長度河质,第三個參數(shù)是迭代特性。

public static final int ORDERED    = 0x00000010;//表示元素是有序的
public static final int DISTINCT   = 0x00000001;//表示元素不重復(fù)
public static final int SORTED     = 0x00000004;//表示元素是按一定規(guī)律進(jìn)行排列(有指定比較器)
public static final int SIZED      = 0x00000040;//是否確定大小
public static final int NONNULL    = 0x00000100;//表示迭代器中沒有null元素
public static final int IMMUTABLE  = 0x00000400;//表示元素不可變
public static final int CONCURRENT = 0x00001000;//表示迭代器可以多線程操作

[參考]https://blog.csdn.net/m0_37664906/article/details/80360388

public default IntStream codePoints()

獲取code point流
由于uft-16由一個或兩個16位的碼組成震叙,code point實(shí)際是區(qū)分及定位字符的點(diǎn)掀鹅。比如一個16*4位數(shù)據(jù),是4個字節(jié)媒楼?3個或者2個?內(nèi)部通過比較等邏輯區(qū)分后輸出

public static int compare(CharSequence cs1, CharSequence cs2)

靜態(tài)比較方法

public static int compare(CharSequence cs1, CharSequence cs2) {
        // 判斷地址是否相等
        if (Objects.requireNonNull(cs1) == Objects.requireNonNull(cs2)) {
            return 0;
        }
        // 是否類型相同乐尊,并調(diào)用compareTo方法
        if (cs1.getClass() == cs2.getClass() && cs1 instanceof Comparable) {
            return ((Comparable<Object>) cs1).compareTo(cs2);
        }
        // 以最短的序列為基準(zhǔn),一個個比較
        for (int i = 0, len = Math.min(cs1.length(), cs2.length()); i < len; i++) {
            char a = cs1.charAt(i);
            char b = cs2.charAt(i);
            if (a != b) {
                return a - b;
            }
        }

       // 直接比較長度
        return cs1.length() - cs2.length();
    }

Constable, ConstantDesc

Constable代表這個類型是可以房子常量池中的
ConstantDesc 代表常量的描述信息划址,猜測類似于類的信息或者索引信息等
String,Integer,Long,Float,Double的常量描述就是自身扔嵌,其他類型由自己的實(shí)現(xiàn)

coder COMPACT_STRINGS

java9之后,為了節(jié)省字符串的空間夺颤,默認(rèn)開啟字符串壓縮痢缎,也就是用byte(8位)保存字母。COMPACT_STRINGS默認(rèn)開啟拂共。coder由兩個值:LATIN1牺弄,UTF16。UTF16是肯定沒有開啟壓縮的宜狐。
具體參考:http://www.reibang.com/p/8a9b2c60e569

String(char[] value, int off, int len, Void sig) {
        if (len == 0) {
            this.value = "".value;
            this.coder = "".coder;
            return;
        }
        if (COMPACT_STRINGS) {
            byte[] val = StringUTF16.compress(value, off, len);
            if (val != null) {
                this.value = val;
                this.coder = LATIN1;
                return;
            }
        }
        this.coder = UTF16;
        this.value = StringUTF16.toBytes(value, off, len);
    }

先判斷是否開啟壓縮势告,如果開啟則先通過UTF16壓縮成byte蛇捌,如果成功則修改coder為LATIN1,否則關(guān)閉壓縮,coder為UTF16.

length

public int length() {
        return value.length >> coder();
    }
@Native static final byte LATIN1 = 0;
@Native static final byte UTF16  = 1;

16位的utf16是LATIN的2倍咱台,所以直接右移1位络拌。
但是UTF16是變長的,所以類似于emoji的字符串計算的時候會感覺會出現(xiàn)問題回溺。這個是怎么解決的春贸?

壓縮字符串

String中的各種操作都需要判斷coder,再采用不同的處理方法遗遵。
如果兩個字符串的編碼格式相同萍恕,處理比較容易。如果不同车要,則需要先轉(zhuǎn)換成UTF16允粤,再處理,多了一步轉(zhuǎn)換的過程翼岁,可能會影響性能类垫。例

public String concat(String str) {
        if (str.isEmpty()) {
            return this;
        }
        if (coder() == str.coder()) {
            byte[] val = this.value;
            byte[] oval = str.value;
            int len = val.length + oval.length;
            byte[] buf = Arrays.copyOf(val, len);
            System.arraycopy(oval, 0, buf, val.length, oval.length);
            return new String(buf, coder);
        }
        int len = length();
        int olen = str.length();
        byte[] buf = StringUTF16.newBytesFor(len + olen);
        getBytes(buf, 0, UTF16);
        str.getBytes(buf, len, UTF16);
        return new String(buf, UTF16);
    }

多了一步StringUTF16.newBytesFor(len + olen)的過程。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末琅坡,一起剝皮案震驚了整個濱河市悉患,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌榆俺,老刑警劉巖售躁,帶你破解...
    沈念sama閱讀 217,542評論 6 504
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異谴仙,居然都是意外死亡迂求,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,822評論 3 394
  • 文/潘曉璐 我一進(jìn)店門晃跺,熙熙樓的掌柜王于貴愁眉苦臉地迎上來揩局,“玉大人,你說我怎么就攤上這事掀虎×瓒ⅲ” “怎么了?”我有些...
    開封第一講書人閱讀 163,912評論 0 354
  • 文/不壞的土叔 我叫張陵烹玉,是天一觀的道長驰怎。 經(jīng)常有香客問我,道長二打,這世上最難降的妖魔是什么县忌? 我笑而不...
    開封第一講書人閱讀 58,449評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上症杏,老公的妹妹穿的比我還像新娘装获。我一直安慰自己,他們只是感情好厉颤,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,500評論 6 392
  • 文/花漫 我一把揭開白布穴豫。 她就那樣靜靜地躺著,像睡著了一般逼友。 火紅的嫁衣襯著肌膚如雪精肃。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,370評論 1 302
  • 那天帜乞,我揣著相機(jī)與錄音司抱,去河邊找鬼。 笑死挖函,一個胖子當(dāng)著我的面吹牛状植,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播怨喘,決...
    沈念sama閱讀 40,193評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼振定!你這毒婦竟也來了必怜?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,074評論 0 276
  • 序言:老撾萬榮一對情侶失蹤后频,失蹤者是張志新(化名)和其女友劉穎梳庆,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體卑惜,經(jīng)...
    沈念sama閱讀 45,505評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡膏执,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,722評論 3 335
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了露久。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片更米。...
    茶點(diǎn)故事閱讀 39,841評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖毫痕,靈堂內(nèi)的尸體忽然破棺而出征峦,到底是詐尸還是另有隱情,我是刑警寧澤消请,帶...
    沈念sama閱讀 35,569評論 5 345
  • 正文 年R本政府宣布栏笆,位于F島的核電站,受9級特大地震影響臊泰,放射性物質(zhì)發(fā)生泄漏蛉加。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,168評論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望针饥。 院中可真熱鬧厂抽,春花似錦、人聲如沸打厘。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,783評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽户盯。三九已至嵌施,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間莽鸭,已是汗流浹背吗伤。 一陣腳步聲響...
    開封第一講書人閱讀 32,918評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留硫眨,地道東北人足淆。 一個月前我還...
    沈念sama閱讀 47,962評論 2 370
  • 正文 我出身青樓,卻偏偏與公主長得像礁阁,于是被迫代替她去往敵國和親巧号。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,781評論 2 354