什么是字符集恕稠?
特定類型字符的集合琅绅。例如:ASCII是英語字符集,GB2312鹅巍、GBK千扶、GB18030是中文字符集,BIG5是繁體中文自己集骆捧,Unicode是通用字符集澎羞,包含了世界上幾乎所有已知的字符。
什么是編碼敛苇?
對字符集的編碼方式妆绞。例如對于Unicode是通用字符集有三種編碼方式:UTF-8、UTF-16枫攀、UTF-32括饶。UTF-8使用1-4個字節(jié)編碼、UTF-16使用2-4個字節(jié)編碼脓豪、UTF-32使用固定四個字節(jié)編碼(浪費空間)巷帝。
MySQL支持的編碼方式?
MySQL 支持很多種字符編碼的方式扫夜,比如 UTF-8楞泼、GB2312、GBK笤闯、BIG5堕阔。
MySQL 對 UTF-8 的實現(xiàn)方式?
- utf8:utf8編碼只支持1-3個字節(jié)颗味。 在 utf8 編碼中超陆,中文是占 3 個字節(jié)。其他數(shù)字、英文时呀、符號占一個字節(jié)张漂。但 emoji 符號占 4 個字節(jié),一些較復雜的文字谨娜、繁體字也是 4 個字節(jié)航攒。
- utf8mb4:UTF-8 的完整實現(xiàn)。最多支持使用 4 個字節(jié)表示字符趴梢,因此漠畜,可以用來存儲 emoji 符號。