day_3
2019/5/30 星期四 16:21:48
字符編碼
**Unicode**用3個(gè)字節(jié)(6個(gè)16進(jìn)制數(shù)來表示一個(gè)字符)第一個(gè)字節(jié)表示平面,總共只有00到10共17個(gè)平面, 其他表示字符的碼值,ASCII碼對應(yīng)下圖第一行(128),中文的utf-8碼用三個(gè)字節(jié)表示.(對應(yīng)第三行).
因此utf-8就是Unicode的一種實(shí)現(xiàn),指用一個(gè)或多個(gè)8位變量(構(gòu)成的數(shù)組)來表示Unicode編碼,而對應(yīng)的utf-16就是用一個(gè)或多個(gè)16位值表示Unicode編碼,相應(yīng)的utf-32就是用32位值來表示,因此用1個(gè)基本類型變量就可以表示.
> 這里的基本數(shù)據(jù)類型的所占字節(jié)是不同的,Java中byte是1字節(jié),short是2字節(jié),char也是2字節(jié),int是4字節(jié),long是8字節(jié).而C中,unsigned char是1字節(jié), unsigned int是2字節(jié).
![我是描述](https://ws1.sinaimg.cn/large/6e53563fly1g3jgsulxhnj20mr0d6gm2.jpg)