計(jì)算機(jī)常用編碼
ASCII編碼
- 最早的最重要的最基本的英美文字的字符集
- 只使用最低7位表示字符,剩余的128位留作拓展
- 采用順序儲(chǔ)存方式儲(chǔ)存字符
ISO-8859-*
- 使用ASCII剩余的碼位進(jìn)行拓展
- ISO-8859-1專門對英語的拓展
- Tomcat 默認(rèn)采用ISO-88591>UTF-8
GBK[936]
- 包括簡繁字體
- 包括GB2312字集圆裕、BIG5字集
- GBK編碼是GB2312編碼的超集囚巴,向下完全兼容GB2312
- GBK支持希臘字母解阅、日文假名字母案铺、俄語字母等字符弧呐,但不支持韓語中的表音字符(非漢字字符)管引。
UTF-8
- 英文使用8位(一個(gè)字節(jié))士败,中文使用24位(3個(gè)字節(jié))
- UTF-8包含全世界所有國家需要用到的字符,是國際編碼
ANSI
- ANSI不是一種具體的編碼
- 由系統(tǒng)默認(rèn)的編碼決定,如果系統(tǒng)默認(rèn)的編碼gbk那ANSI就是gbk
- 查看系統(tǒng)默認(rèn)編碼在DOS命令窗口輸入 chcp
ASCII碼表
常用09谅将,AZ,az對應(yīng)的ASCII碼分別為4857漾狼,6590,97122
0 -- 48
A -- 65
a -- 97
亂碼產(chǎn)生原因
- 計(jì)算機(jī)中文件的存儲(chǔ)是以二進(jìn)制的形式保存饥臂,在保存到硬盤上時(shí),計(jì)算機(jī)會(huì)將內(nèi)存中的文件,按照特定的格式[編碼方式]轉(zhuǎn)換為二進(jìn)制文件,保存到硬盤中逊躁。
- 當(dāng)文件再次打開時(shí),計(jì)算機(jī)會(huì)把硬盤中的二進(jìn)制文件加載到內(nèi)存,按照特定的格式,重新編碼成可讀的普通文件;
- 重新編碼時(shí),系統(tǒng)會(huì)搜索當(dāng)前系統(tǒng)中,對于不同后綴名文件的默認(rèn)打開方式[每種打開方式包含的編碼不一定相同],如果默認(rèn)的打開方式中包含的編碼方式與原編碼格式相同,則文件可以正常打開,沒有亂碼;
- 如果默認(rèn)打開方式中的編碼不包含,或者沒有全部包含,則會(huì)出現(xiàn)亂碼
亂碼的解決方式
- 在保存文件時(shí),確定編輯保存的編碼方式
- 在打開文件時(shí),要根據(jù)不同的文件后綴名,選擇對應(yīng)的打開方式