ASCII刊殉、Unicode殉摔、UTF-8
ASCII
ASCII(American Standard Code for Information Interchange,美國(guó)信息交換標(biāo)準(zhǔn)代碼)是基于拉丁字母的一套電腦編碼系統(tǒng)记焊,主要用于顯示現(xiàn)代英語(yǔ)和其他西歐語(yǔ)言逸月。它是現(xiàn)今最通用的單字節(jié)編碼系統(tǒng)。
美國(guó)標(biāo)準(zhǔn)信息交換代碼是由美國(guó)國(guó)家標(biāo)準(zhǔn)學(xué)會(huì) (American National Standard Institute , ANSI) 制定的亚亲,標(biāo)準(zhǔn)的單字節(jié)字符編碼方案彻采,用于基于文本的數(shù)據(jù)。起始于 50 年代后期捌归,在 1967 年定案肛响。它最初是美國(guó)國(guó)家標(biāo)準(zhǔn),供不同計(jì)算機(jī)在相互通信時(shí)用作共同遵守的西文字符編碼標(biāo)準(zhǔn)惜索,它已被國(guó)際標(biāo)準(zhǔn)化組織(International Organization for Standardization, ISO)定為國(guó)際標(biāo)準(zhǔn)特笋,稱為 ISO 646 標(biāo)準(zhǔn)。適用于所有拉丁文字字母巾兆。
ASCII 碼采用指定 7 位或 8 位二進(jìn)制組合來(lái)表示 128 或 256 種字符猎物。
7 位 ASCII 碼 | 8 位 ASCII 碼 | |
---|---|---|
名稱 | 基礎(chǔ) ASCII 碼 | 基礎(chǔ) ASCII 碼 + 擴(kuò)展 ASCII 碼(后 128 個(gè)) |
范圍 | 0x00 - 0x7F (0 - 127) | 0x00 - 0xFF(0 - 255) |
說(shuō)明 | 理論上只用到 7 位,一個(gè)字節(jié)的最高位有特殊用途(不一定為 0) | 前面 128 個(gè)兼容 7 位 ASCII角塑,在 7 位基礎(chǔ)上最高位補(bǔ) 0 |
標(biāo)準(zhǔn) ASCII 碼:標(biāo)準(zhǔn) ASCII 碼每個(gè)字符采用 8 bit(1 byte)傳輸蔫磨,在 7 為 ASCII 碼基礎(chǔ)上,最高位用于奇偶校驗(yàn)圃伶。
奇校驗(yàn):代碼一個(gè)字節(jié)中 1 的個(gè)數(shù)必須是奇數(shù)個(gè)堤如。以 7 位 ASCII 碼的奇校驗(yàn)為例蒲列,如果 7 位中有奇數(shù)個(gè) 1,最高位補(bǔ) 0搀罢;如果 7 位中有偶數(shù)個(gè) 1蝗岖,最高位補(bǔ) 1。
偶校驗(yàn):代碼一個(gè)字節(jié)中 1 的個(gè)數(shù)必須是偶數(shù)個(gè)榔至。以 7 位 ASCII 碼的奇校驗(yàn)為例抵赢,如果 7 位中有奇數(shù)個(gè) 1,最高位補(bǔ) 1唧取;如果 7 位中有偶數(shù)個(gè) 1铅鲤,最高位補(bǔ) 0。
后來(lái)擴(kuò)展 ASCII 碼不再作為國(guó)標(biāo)(國(guó)際標(biāo)準(zhǔn))兵怯。
一般我們所說(shuō)的 ASCII 碼是 8 位 ASCII 前 128 個(gè)(高位補(bǔ) 0)彩匕。
Unicode
ASCII 碼只能表示少量的字符(8 bit 最多 256 個(gè))。
其它語(yǔ)言顯然無(wú)法用一個(gè)字節(jié)來(lái)存儲(chǔ)(常用中文都超過(guò) 3000 了)媒区。
為了統(tǒng)一全球所有語(yǔ)言的所有字符驼仪,顯然需要提出一種新的標(biāo)準(zhǔn)。
通用字符集(Universal Character Set, UCS)袜漩,有兩種標(biāo)準(zhǔn)字符集 UCS-2 绪爸、UCS-4。分別表示 2 個(gè)字節(jié)定長(zhǎng)字符編碼和 4 個(gè)字節(jié)定長(zhǎng)字符編碼宙攻。
Unicode 編碼采用 2 字節(jié)(16 bit)表示一個(gè)字符奠货,對(duì)于以前的 ASCII 碼則高字節(jié)全部補(bǔ) 0 進(jìn)行處理。
最多能支持 65536 個(gè)字符座掘。
弊端:
- Unicode 編碼與 ASCII 碼完全不兼容递惋。對(duì)于以前的 ASCII 碼文件,無(wú)法區(qū)分是 ASCII 碼字符還是 Unicode 字符溢陪。
- 可支持的字符依然較少萍虽,雖然比起 ASCII 碼最多 256 個(gè),最多 65536 個(gè)字符已經(jīng)屬于很多了形真。但依然無(wú)法囊括全球所有國(guó)家的字符杉编。(中國(guó)漢字就超過(guò) 30000 ,雖然常用的不多咆霜,但是總有人取生僻字邓馒,你說(shuō)這個(gè)該不該顯示呢?)
- 采用 4 字符定長(zhǎng)編碼蛾坯,可以囊括更多國(guó)家的字符光酣。但是隨著而來(lái)的會(huì)造成不必要的空間浪費(fèi)。(一個(gè)純 ASCII 碼英文文檔脉课,采用 UCS-4 后體積增大 3 倍救军,顯然這種做法很不可雀睦馈)。
UTF-8
由于不兼容 ASCII 碼缤言,可支持字符不足,存在較大的空間浪費(fèi)视事。使得 Unicode 編碼的推廣受到嚴(yán)重的限制胆萧。
為了解決以上問(wèn)題,推出了 UTF-8 變長(zhǎng)字符編碼標(biāo)準(zhǔn)俐东,可以使用 1 ~ 6 個(gè)字節(jié)表示一個(gè)字符跌穗。
根據(jù)編碼的頭部來(lái)區(qū)分屬于什么編碼,兼容了 ASCII 碼虏辫, Unicode 編碼蚌吸。
與 Unicode 編碼的對(duì)應(yīng)關(guān)系為:
bit 數(shù) | Unicode / UCS-4 | UTF-8 二進(jìn)制 | byte 數(shù) |
---|---|---|---|
0 - 7 | 0000 0000 - 0000 007F | 0xxxxxxx | 1 |
8 - 11 | 0000 0080 - 0000 07FF | 110xxxxx 10xxxxxx | 2 |
12 - 16 | 0000 0800 - 0000 FFFF | 1110xxxx 10xxxxxx 10xxxxxx | 3 |
17 - 21 | 0001 0000 - 0010 FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx | 4 |
22 - 26 | 0020 0000 - 03FF FFFF | 111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx | 5 |
27 - 31 | 0400 0000 - 7FFF FFFF | 1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx | 6 |
按照上標(biāo)可以兼容 Unicode 編碼。
而 1 字節(jié) UTF-8 的編碼規(guī)則可以兼容 ASCII 碼砌庄。
附錄 I :ASCII 碼字符列表
Bin(二進(jìn)制) | Oct(八進(jìn)制) | Dec(十進(jìn)制) | Hex(十六進(jìn)制) | 縮寫 / 字符 | 解釋 |
---|---|---|---|---|---|
0000 0000 | 00 | 0 | 0x00 | NUL(null) | 空字符 |
0000 0001 | 01 | 1 | 0x01 | SOH(start of headline) | 標(biāo)題開(kāi)始 |
0000 0010 | 02 | 2 | 0x02 | STX (start of text) | 正文開(kāi)始 |
0000 0011 | 03 | 3 | 0x03 | ETX (end of text) | 正文結(jié)束 |
0000 0100 | 04 | 4 | 0x04 | EOT (end of transmission) | 傳輸結(jié)束 |
0000 0101 | 05 | 5 | 0x05 | ENQ (enquiry) | 請(qǐng)求 |
0000 0110 | 06 | 6 | 0x06 | ACK (acknowledge) | 收到通知 |
0000 0111 | 07 | 7 | 0x07 | BEL (bell) | 響鈴 |
0000 1000 | 010 | 8 | 0x08 | BS (backspace) | 退格 |
0000 1001 | 011 | 9 | 0x09 | HT (horizontal tab) | 水平制表符 |
0000 1010 | 012 | 10 | 0x0A | LF (NL line feed, new line) | 換行鍵 |
0000 1011 | 013 | 11 | 0x0B | VT (vertical tab) | 垂直制表符 |
0000 1100 | 014 | 12 | 0x0C | FF (NP form feed, new page) | 換頁(yè)鍵 |
0000 1101 | 015 | 13 | 0x0D | CR (carriage return) | 回車鍵 |
0000 1110 | 016 | 14 | 0x0E | SO (shift out) | 不用切換 |
0000 1111 | 017 | 15 | 0x0F | SI (shift in) | 啟用切換 |
0001 0000 | 020 | 16 | 0x10 | DLE (data link escape) | 數(shù)據(jù)鏈路轉(zhuǎn)義 |
0001 0001 | 021 | 17 | 0x11 | DC1 (device control 1) | 設(shè)備控制 1 |
0001 0010 | 022 | 18 | 0x12 | DC2 (device control 2) | 設(shè)備控制 2 |
0001 0011 | 023 | 19 | 0x13 | DC3 (device control 3) | 設(shè)備控制 3 |
0001 0100 | 024 | 20 | 0x14 | DC4 (device control 4) | 設(shè)備控制 4 |
0001 0101 | 025 | 21 | 0x15 | NAK (negative acknowledge) | 拒絕接收 |
0001 0110 | 026 | 22 | 0x16 | SYN (synchronous idle) | 同步空閑 |
0001 0111 | 027 | 23 | 0x17 | ETB (end of trans. block) | 結(jié)束傳輸塊 |
0001 1000 | 030 | 24 | 0x18 | CAN (cancel) | 取消 |
0001 1001 | 031 | 25 | 0x19 | EM (end of medium) | 媒介結(jié)束 |
0001 1010 | 032 | 26 | 0x1A | SUB (substitute) | 代替 |
0001 1011 | 033 | 27 | 0x1B | ESC (escape) | 換碼 (溢出) |
0001 1100 | 034 | 28 | 0x1C | FS (filator) | 文件分隔符 |
0001 1101 | 035 | 29 | 0x1D | GS (group separator) | 分組符 |
0001 1110 | 036 | 30 | 0x1E | RS (record separator) | 記錄分隔符 |
0001 1111 | 037 | 31 | 0x1F | US (unit separator) | 單元分隔符 |
0010 0000 | 040 | 32 | 0x20 | (space) | 空格 |
0010 0001 | 041 | 33 | 0x21 | ! | 嘆號(hào) |
0010 0010 | 042 | 34 | 0x22 | " | 雙引號(hào) |
0010 0011 | 043 | 35 | 0x23 | # | 井號(hào) |
0010 0100 | 044 | 36 | 0x24 | $ | 美元符 |
0010 0101 | 045 | 37 | 0x25 | % | 百分號(hào) |
0010 0110 | 046 | 38 | 0x26 | & | 和號(hào) |
0010 0111 | 047 | 39 | 0x27 | ' | 閉單引號(hào) |
0010 1000 | 050 | 40 | 0x28 | ( | 開(kāi)括號(hào) |
0010 1001 | 051 | 41 | 0x29 | ) | 閉括號(hào) |
0010 1010 | 052 | 42 | 0x2A | * | 星號(hào) |
0010 1011 | 053 | 43 | 0x2B | + | 加號(hào) |
0010 1100 | 054 | 44 | 0x2C | , | 逗號(hào) |
0010 1101 | 055 | 45 | 0x2D | - | 減號(hào) / 破折號(hào) |
0010 1110 | 056 | 46 | 0x2E | . | 句號(hào) |
0010 1111 | 057 | 47 | 0x2F | / | 斜杠 |
0011 0000 | 060 | 48 | 0x30 | 0 | 數(shù)字 0 |
0011 0001 | 061 | 49 | 0x31 | 1 | 數(shù)字 1 |
0011 0010 | 062 | 50 | 0x32 | 2 | 數(shù)字 2 |
0011 0011 | 063 | 51 | 0x33 | 3 | 數(shù)字 3 |
0011 0100 | 064 | 52 | 0x34 | 4 | 數(shù)字 4 |
0011 0101 | 065 | 53 | 0x35 | 5 | 數(shù)字 5 |
0011 0110 | 066 | 54 | 0x36 | 6 | 數(shù)字 6 |
0011 0111 | 067 | 55 | 0x37 | 7 | 數(shù)字 7 |
0011 1000 | 070 | 56 | 0x38 | 8 | 數(shù)字 8 |
0011 1001 | 071 | 57 | 0x39 | 9 | 數(shù)字 9 |
0011 1010 | 072 | 58 | 0x3A | : | 冒號(hào) |
0011 1011 | 073 | 59 | 0x3B | ; | 分號(hào) |
0011 1100 | 074 | 60 | 0x3C | < | 小于 |
0011 1101 | 075 | 61 | 0x3D | = | 等號(hào) |
0011 1110 | 076 | 62 | 0x3E | > | 大于 |
0011 1111 | 077 | 63 | 0x3F | ? | 問(wèn)號(hào) |
0100 0000 | 0100 | 64 | 0x40 | @ | 電子郵件符號(hào) |
0100 0001 | 0101 | 65 | 0x41 | A | 大寫字母 A |
0100 0010 | 0102 | 66 | 0x42 | B | 大寫字母 B |
0100 0011 | 0103 | 67 | 0x43 | C | 大寫字母 C |
0100 0100 | 0104 | 68 | 0x44 | D | 大寫字母 D |
0100 0101 | 0105 | 69 | 0x45 | E | 大寫字母 E |
0100 0110 | 0106 | 70 | 0x46 | F | 大寫字母 F |
0100 0111 | 0107 | 71 | 0x47 | G | 大寫字母 G |
0100 1000 | 0110 | 72 | 0x48 | H | 大寫字母 H |
0100 1001 | 0111 | 73 | 0x49 | I | 大寫字母 I |
0100 1010 | 0112 | 74 | 0x4A | J | 大寫字母 J |
0100 1011 | 0113 | 75 | 0x4B | K | 大寫字母 K |
0100 1100 | 0114 | 76 | 0x4C | L | 大寫字母 L |
0100 1101 | 0115 | 77 | 0x4D | M | 大寫字母 M |
0100 1110 | 0116 | 78 | 0x4E | N | 大寫字母 N |
0100 1111 | 0117 | 79 | 0x4F | O | 大寫字母 O |
0101 0000 | 0120 | 80 | 0x50 | P | 大寫字母 P |
0101 0001 | 0121 | 81 | 0x51 | Q | 大寫字母 Q |
0101 0010 | 0122 | 82 | 0x52 | R | 大寫字母 R |
0101 0011 | 0123 | 83 | 0x53 | S | 大寫字母 S |
0101 0100 | 0124 | 84 | 0x54 | T | 大寫字母 T |
0101 0101 | 0125 | 85 | 0x55 | U | 大寫字母 U |
0101 0110 | 0126 | 86 | 0x56 | V | 大寫字母 V |
0101 0111 | 0127 | 87 | 0x57 | W | 大寫字母 W |
0101 1000 | 0130 | 88 | 0x58 | X | 大寫字母 X |
0101 1001 | 0131 | 89 | 0x59 | Y | 大寫字母 Y |
0101 1010 | 0132 | 90 | 0x5A | Z | 大寫字母 Z |
0101 1011 | 0133 | 91 | 0x5B | [ | 開(kāi)方括號(hào) |
0101 1100 | 0134 | 92 | 0x5C | \ | 反斜杠 |
0101 1101 | 0135 | 93 | 0x5D | ] | 閉方括號(hào) |
0101 1110 | 0136 | 94 | 0x5E | ^ | 脫字符 |
0101 1111 | 0137 | 95 | 0x5F | _ | 下劃線 |
0110 0000 | 0140 | 96 | 0x60 | ` | 開(kāi)單引號(hào) |
0110 0001 | 0141 | 97 | 0x61 | a | 小寫字母 a |
0110 0010 | 0142 | 98 | 0x62 | b | 小寫字母 b |
0110 0011 | 0143 | 99 | 0x63 | c | 小寫字母 c |
0110 0100 | 0144 | 100 | 0x64 | d | 小寫字母 d |
0110 0101 | 0145 | 101 | 0x65 | e | 小寫字母 e |
0110 0110 | 0146 | 102 | 0x66 | f | 小寫字母 f |
0110 0111 | 0147 | 103 | 0x67 | g | 小寫字母 g |
0110 1000 | 0150 | 104 | 0x68 | h | 小寫字母 h |
0110 1001 | 0151 | 105 | 0x69 | i | 小寫字母 i |
0110 1010 | 0152 | 106 | 0x6A | j | 小寫字母 j |
0110 1011 | 0153 | 107 | 0x6B | k | 小寫字母 k |
0110 1100 | 0154 | 108 | 0x6C | l | 小寫字母 l |
0110 1101 | 0155 | 109 | 0x6D | m | 小寫字母 m |
0110 1110 | 0156 | 110 | 0x6E | n | 小寫字母 n |
0110 1111 | 0157 | 111 | 0x6F | o | 小寫字母 o |
0111 0000 | 0160 | 112 | 0x70 | p | 小寫字母 p |
0111 0001 | 0161 | 113 | 0x71 | q | 小寫字母 q |
0111 0010 | 0162 | 114 | 0x72 | r | 小寫字母 r |
0111 0011 | 0163 | 115 | 0x73 | s | 小寫字母 s |
0111 0100 | 0164 | 116 | 0x74 | t | 小寫字母 t |
0111 0101 | 0165 | 117 | 0x75 | u | 小寫字母 u |
0111 0110 | 0166 | 118 | 0x76 | v | 小寫字母 v |
0111 0111 | 0167 | 119 | 0x77 | w | 小寫字母 w |
0111 1000 | 0170 | 120 | 0x78 | x | 小寫字母 x |
0111 1001 | 0171 | 121 | 0x79 | y | 小寫字母 y |
0111 1010 | 0172 | 122 | 0x7A | z | 小寫字母 z |
0111 1011 | 0173 | 123 | 0x7B | { | 開(kāi)花括號(hào) |
0111 1100 | 0174 | 124 | 0x7C | | | 垂線 |
0111 1101 | 0175 | 125 | 0x7D | } | 閉花括號(hào) |
0111 1110 | 0176 | 126 | 0x7E | ~ | 波浪號(hào) |
0111 1111 | 0177 | 127 | 0x7F | DEL (delete) | 刪除 |
附錄 II :Unicode 編碼字符列表
Unicode 編碼范圍 | 字符類型 |
---|---|
0000-007F | C0 控制符及基本拉丁文 (C0 Control and Basic Latin) |
0080-00FF | C1 控制符及拉丁文補(bǔ)充 - 1 (C1 Control and Latin 1 Supplement) |
0100-017F | 拉丁文擴(kuò)展 - A (Latin Extended-A) |
0180-024F | 拉丁文擴(kuò)展 - B (Latin Extended-B) |
0250-02AF | 國(guó)際音標(biāo)擴(kuò)展 (IPA Extensions) |
02B0-02FF | 空白修飾字母 (Spacing Modifiers) |
0300-036F | 結(jié)合用讀音符號(hào) (Combining Diacritics Marks) |
0370-03FF | 希臘文及科普特文 (Greek and Coptic) |
0400-04FF | 西里爾字母 (Cyrillic) |
0500-052F | 西里爾字母補(bǔ)充 (Cyrillic Supplement) |
0530-058F | 亞美尼亞語(yǔ) (Armenian) |
0590-05FF | 希伯來(lái)文 (Hebrew) |
0600-06FF | 阿拉伯文 (Arabic) |
0700-074F | 敘利亞文 (Syriac) |
0750-077F | 阿拉伯文補(bǔ)充 (Arabic Supplement) |
0780-07BF | 馬爾代夫語(yǔ) (Thaana) |
07C0-07FF | 西非書(shū)面語(yǔ)言 (N'Ko) |
0800-085F | 阿維斯塔語(yǔ)及巴列維語(yǔ) (Avestan and Pahlavi) |
0860-087F | Mandaic |
0880-08AF | 撒馬利亞語(yǔ) (Samaritan) |
0900-097F | 天城文書(shū) (Devanagari) |
0980-09FF | 孟加拉語(yǔ) (Bengali) |
0A00-0A7F | 錫克教文 (Gurmukhi) |
0A80-0AFF | 古吉拉特文 (Gujarati) |
0B00-0B7F | 奧里亞文 (Oriya) |
0B80-0BFF | 泰米爾文 (Tamil) |
0C00-0C7F | 泰盧固文 (Telugu) |
0C80-0CFF | 卡納達(dá)文 (Kannada) |
0D00-0D7F | 德拉維族語(yǔ) (Malayalam) |
0D80-0DFF | 僧伽羅語(yǔ) (Sinhala) |
0E00-0E7F | 泰文 (Thai) |
0E80-0EFF | 老撾文 (Lao) |
0F00-0FFF | 藏文 (Tibetan) |
1000-109F | 緬甸語(yǔ) (Myanmar) |
10A0-10FF | 格魯吉亞語(yǔ) (Georgian) |
1100-11FF | 朝鮮文 (Hangul Jamo) |
1200-137F | 埃塞俄比亞語(yǔ) (Ethiopic) |
1380-139F | 埃塞俄比亞語(yǔ)補(bǔ)充 (Ethiopic Supplement) |
13A0-13FF | 切羅基語(yǔ) (Cherokee) |
1400-167F | 統(tǒng)一加拿大土著語(yǔ)音節(jié) (Unified Canadian Aboriginal Syllabics) |
1680-169F | 歐甘字母 (Ogham) |
16A0-16FF | 如尼文 (Runic) |
1700-171F | 塔加拉語(yǔ) (Tagalog) |
1720-173F | Hanunóo |
1740-175F | Buhid |
1760-177F | 塔格班瓦文 (Tagbanwa) |
1780-17FF | 高棉語(yǔ) (Khmer) |
1800-18AF | 蒙古文 (Mongolian) |
18B0-18FF | Cham |
1900-194F | Limbu |
1950-197F | 德宏泰語(yǔ) (Tai Le) |
1980-19DF | 新傣仂語(yǔ) (New Tai Lue) |
19E0-19FF | 高棉語(yǔ)記號(hào) (Kmer Symbols) |
1A00-1A1F | Buginese |
1A20-1A5F | Batak |
1A80-1AEF | Lanna |
1B00-1B7F | 巴厘語(yǔ) (Balinese) |
1B80-1BB0 | 巽他語(yǔ) (Sundanese) |
1BC0-1BFF | Pahawh Hmong |
1C00-1C4F | 雷布查語(yǔ) (Lepcha) |
1C50-1C7F | 桑塔利文 (Ol Chiki) |
1C80-1CDF | 曼尼普爾語(yǔ) (Meithei/Manipuri) |
1D00-1D7F | 語(yǔ)音學(xué)擴(kuò)展 (Phonetic Extensions) |
1D80-1DBF | 語(yǔ)音學(xué)擴(kuò)展補(bǔ)充 (Phonetic Extensions Supplement) |
1DC0-1DFF | 結(jié)合用讀音符號(hào)補(bǔ)充 (Combining Diacritics Marks Supplement) |
1E00-1EFF | 拉丁文擴(kuò)充附加 (Latin Extended Additional) |
1F00-1FFF | 希臘語(yǔ)擴(kuò)充 (Greek Extended) |
2000-206F | 常用標(biāo)點(diǎn) (General Punctuation) |
2070-209F | 上標(biāo)及下標(biāo) (Superscripts and Subscripts) |
20A0-20CF | 貨幣符號(hào) (Currency Symbols) |
20D0-20FF | 組合用記號(hào) (Combining Diacritics Marks for Symbols) |
2100-214F | 字母式符號(hào) (Letterlike Symbols) |
2150-218F | 數(shù)字形式 (Number Form) |
2190-21FF | 箭頭 (Arrows) |
2200-22FF | 數(shù)學(xué)運(yùn)算符 (Mathematical Operator) |
2300-23FF | 雜項(xiàng)工業(yè)符號(hào) (Miscellaneous Technical) |
2400-243F | 控制圖片 (Control Pictures) |
2440-245F | 光學(xué)識(shí)別符 (Optical Character Recognition) |
2460-24FF | 封閉式字母數(shù)字 (Enclosed Alphanumerics) |
2500-257F | 制表符 (Box Drawing) |
2580-259F | 方塊元素 (Block Element) |
25A0-25FF | 幾何圖形 (Geometric Shapes) |
2600-26FF | 雜項(xiàng)符號(hào) (Miscellaneous Symbols) |
2700-27BF | 印刷符號(hào) (Dingbats) |
27C0-27EF | 雜項(xiàng)數(shù)學(xué)符號(hào) - A (Miscellaneous Mathematical Symbols-A) |
27F0-27FF | 追加箭頭 - A (Supplemental Arrows-A) |
2800-28FF | 盲文點(diǎn)字模型 (Braille Patterns) |
2900-297F | 追加箭頭 - B (Supplemental Arrows-B) |
2980-29FF | 雜項(xiàng)數(shù)學(xué)符號(hào) - B (Miscellaneous Mathematical Symbols-B) |
2A00-2AFF | 追加數(shù)學(xué)運(yùn)算符 (Supplemental Mathematical Operator) |
2B00-2BFF | 雜項(xiàng)符號(hào)和箭頭 (Miscellaneous Symbols and Arrows) |
2C00-2C5F | 格拉哥里字母 (Glagolitic) |
2C60-2C7F | 拉丁文擴(kuò)展 - C (Latin Extended-C) |
2C80-2CFF | 古埃及語(yǔ) (Coptic) |
2D00-2D2F | 格魯吉亞語(yǔ)補(bǔ)充 (Georgian Supplement) |
2D30-2D7F | 提非納文 (Tifinagh) |
2D80-2DDF | 埃塞俄比亞語(yǔ)擴(kuò)展 (Ethiopic Extended) |
2E00-2E7F | 追加標(biāo)點(diǎn) (Supplemental Punctuation) |
2E80-2EFF | CJK 部首補(bǔ)充 (CJK Radicals Supplement) |
2F00-2FDF | 康熙字典部首 (Kangxi Radicals) |
2FF0-2FFF | 表意文字描述符 (Ideographic Description Characters) |
3000-303F | CJK 符號(hào)和標(biāo)點(diǎn) (CJK Symbols and Punctuation) |
3040-309F | 日文平假名 (Hiragana) |
30A0-30FF | 日文片假名 (Katakana) |
3100-312F | 注音字母 (Bopomofo) |
3130-318F | 朝鮮文兼容字母 (Hangul Compatibility Jamo) |
3190-319F | 象形字注釋標(biāo)志 (Kanbun) |
31A0-31BF | 注音字母擴(kuò)展 (Bopomofo Extended) |
31C0-31EF | CJK 筆畫(huà) (CJK Strokes) |
31F0-31FF | 日文片假名語(yǔ)音擴(kuò)展 (Katakana Phonetic Extensions) |
3200-32FF | 封閉式 CJK 文字和月份 (Enclosed CJK Letters and Months) |
3300-33FF | CJK 兼容 (CJK Compatibility) |
3400-4DBF | CJK 統(tǒng)一表意符號(hào)擴(kuò)展 A (CJK Unified Ideographs Extension A) |
4DC0-4DFF | 易經(jīng)六十四卦符號(hào) (Yijing Hexagrams Symbols) |
4E00-9FBF | CJK 統(tǒng)一表意符號(hào) (CJK Unified Ideographs) |
A000-A48F | 彝文音節(jié) (Yi Syllables) |
A490-A4CF | 彝文字根 (Yi Radicals) |
A500-A61F | Vai |
A660-A6FF | 統(tǒng)一加拿大土著語(yǔ)音節(jié)補(bǔ)充 (Unified Canadian Aboriginal Syllabics Supplement) |
A700-A71F | 聲調(diào)修飾字母 (Modifier Tone Letters) |
A720-A7FF | 拉丁文擴(kuò)展 - D (Latin Extended-D) |
A800-A82F | Syloti Nagri |
A840-A87F | 八思巴字 (Phags-pa) |
A880-A8DF | Saurashtra |
A900-A97F | 爪哇語(yǔ) (Javanese) |
A980-A9DF | Chakma |
AA00-AA3F | Varang Kshiti |
AA40-AA6F | Sorang Sompeng |
AA80-AADF | Newari |
AB00-AB5F | 越南傣語(yǔ) (Vi?t Thái) |
AB80-ABA0 | Kayah Li |
AC00-D7AF | 朝鮮文音節(jié) (Hangul Syllables) |
D800-DBFF | High-half zone of UTF-16 |
DC00-DFFF | Low-half zone of UTF-16 |
E000-F8FF | 自行使用區(qū)域 (Private Use Zone) |
F900-FAFF | CJK 兼容象形文字 (CJK Compatibility Ideographs) |
FB00-FB4F | 字母表達(dá)形式 (Alphabetic Presentation Form) |
FB50-FDFF | 阿拉伯表達(dá)形式 A (Arabic Presentation Form-A) |
FE00-FE0F | 變量選擇符 (Variation Selector) |
FE10-FE1F | 豎排形式 (Vertical Forms) |
FE20-FE2F | 組合用半符號(hào) (Combining Half Marks) |
FE30-FE4F | CJK 兼容形式 (CJK Compatibility Forms) |
FE50-FE6F | 小型變體形式 (Small Form Variants) |
FE70-FEFF | 阿拉伯表達(dá)形式 B (Arabic Presentation Form-B) |
FF00-FFEF | 半型及全型形式 (Halfwidth and Fullwidth Form) |
FFF0-FFFF | 特殊 (Specials) |