1 ASCII:American Standard Code for Information Interchange
-
0~32
:用作控制字符 -
00000000-01111111
:其他字符
2 GB2312標(biāo)準(zhǔn)
-
00000000 00000000
:大概能存儲(chǔ)7000左右漢字
2.1 GBK:GB2312的拓展
- 擴(kuò)展大概多出20000左右字符,包含繁體字、假名掰茶、羅馬字符
2.2 GB18030:包含很多少數(shù)名族字符
3 ISO:國(guó)際標(biāo)準(zhǔn)化組織
UCS:Universal Multi-Octet Coded Character Set
UCS俗稱Unicode
4 UTF:Unicode Transfer Format
- UTF有UTF8和UTF16,最常用的是UTF8部逮,指的是每八位傳輸
- UTF8表示一個(gè)字符用多少個(gè)字節(jié)不固定
- 舉例:
- 如果一個(gè)字符只占一個(gè)字節(jié),表示
0xxxxxxx
- 如果一個(gè)字符占兩個(gè)字節(jié),表示
110xxxxx 10xxxxxx
- 如果一個(gè)字符占三個(gè)字節(jié)夭织,表示
1110xxxx 10xxxxxx 10xxxxxx
- 如果一個(gè)字符占四個(gè)字節(jié)赌结,表示
11111xxx 10xxxxxx 10xxxxxx 10xxxxxx
- 如果一個(gè)字符只占一個(gè)字節(jié),表示
--
5 正確的寫(xiě)入寫(xiě)出方式
image.png