UTF-8:Unicode TransformationFormat-8bit,用以解決國際上字符的一種編碼看疙,對(duì)中文使用8位(一個(gè)字節(jié))聘惦、英文使用24位(三個(gè)字節(jié))編碼,對(duì)于英文字符較多的論壇則用UTF-8 節(jié)省空間。
UTF-8包含全世界所有國家需要用到的字符厘熟,通用性強(qiáng)匹厘。
UTF-8編碼的文字可以在各國支持UTF-8字符集的瀏覽器上顯示嘀趟。如果是UTF-8編碼,則在外國人的英文IE上也能顯示中文愈诚,他們無需下載IE的中文語言支持包她按。
GBK是國家標(biāo)準(zhǔn)GB2312基礎(chǔ)上擴(kuò)容后兼容GB2312的標(biāo)準(zhǔn)。
GBK的文字編碼用雙字節(jié)表示炕柔,即不論中酌泰、英文字符均使用雙字節(jié)表示,為了區(qū)分中文匕累,將其最高位都設(shè)定成1陵刹。
GBK包含全部中文字符,是國家編碼欢嘿,通用性比UTF8差衰琐,不過UTF8占用的數(shù)據(jù)庫比GBK大。
如果外國人訪問你的GBK網(wǎng)頁炼蹦,需要下載中文語言包支持羡宙。
GBK、GB2312等與UTF8之間都必須通過Unicode編碼才能相互轉(zhuǎn)換:
GBK掐隐、GB2312--Unicode--UTF8
UTF8--Unicode--GBK狗热、GB2312