1.查看數(shù)據(jù)庫服務(wù)器的支持的字符集
SHOW CHARACTER SET;
查看支持的字符集.png
幾乎所有的字符集數(shù)據(jù)庫服務(wù)器都支持聪廉,問題在于數(shù)據(jù)庫服務(wù)器器按哪種字符集解釋收到的請求和按哪種字符集將數(shù)據(jù)編碼發(fā)送給客戶端。
查看當(dāng)前的字符集設(shè)置
SHOW VARIABLES LIKE 'character_set%'
查看字符集相關(guān)設(shè)置.png
- character_set_client 表示的數(shù)據(jù)庫服務(wù)器默認(rèn)
客戶端傳遞的數(shù)據(jù)所使用的字符集
,如果字符集和客戶端不一致會導(dǎo)致無法向服務(wù)器插入數(shù)據(jù)醉拓,比如當(dāng)客戶端采用gbk,這里設(shè)置為utf8的時候,因為對中文的解析不同導(dǎo)致解析失敗幸海,gbk一個漢字兩個字節(jié)慨丐,utf8是3個字節(jié) - character_set_database 表示當(dāng)前默認(rèn)的存儲內(nèi)容的字符集這里非常重要坡脐,默認(rèn)情況表的字符集和這里相同。建立表的時候沒有特別指定字符集就會依靠這里設(shè)置房揭,比如現(xiàn)在的是latin1存入中文是錯誤备闲。
- character_set_results 表示數(shù)據(jù)庫將數(shù)據(jù)返回給
客戶端的數(shù)據(jù)的編碼字符集
,
這部分主要影響客戶端的顯示捅暴,用select 命令從數(shù)據(jù)庫讀取數(shù)據(jù)恬砂,如果字符集不一致,客戶端中文顯示異常蓬痒。
- 設(shè)置方式
- set 字段名稱 = 屬性值;當(dāng)前回話有效
- 通過修改配置文件泻骤,我用的是Navicat編輯的。
字符集確定了數(shù)據(jù)的編碼格式梧奢,校對集用于數(shù)據(jù)比較的方式
- _bin: binary,二進制比較, 取出二進制位,一位一位的比較, 區(qū)分大小寫
- _cs: case sensitive,大小寫敏感, 區(qū)分大小寫
- _ci: case insensitice,大小寫不敏感,不區(qū)分大小寫
校對集只有在數(shù)據(jù)進行比較的時候才會生效狱掂,比如根據(jù)某個字段進行排序。
在應(yīng)用數(shù)據(jù)交互過程中很難保證所有的字符集都是一致的亲轨,所以有時會出現(xiàn)亂碼問題趋惨。比如在網(wǎng)頁上會出現(xiàn)中文亂碼,是因為瀏覽器解析網(wǎng)頁時所用的默認(rèn)字符集和編碼所用的字符集不一致惦蚊。所以在html頁面頭部需要加上下面的代碼顯示告訴瀏覽器編碼格式用的時UTF8
<meta charset="UTF-8">/* html*/
header('Content-Type:text/html; charset= utf-8'); /*php*/
結(jié)論基本上出現(xiàn)亂碼的問題器虾,都是因為解析數(shù)據(jù)的時候不知道待解析的數(shù)據(jù)用的編碼是格式才出現(xiàn)錯誤的,如果能夠顯示的指明數(shù)據(jù)的格式傳遞數(shù)據(jù)的時候都按照相同的編碼就不會出現(xiàn)亂碼了养筒。