java常見(jiàn)編碼
- unicode 兩個(gè)字節(jié) 包含世界上幾乎所有的字符
- gb2312/GBK 兩個(gè)字節(jié) 兼容ACSII 前127位為ASCII后面為中文字符
- ASCII 1個(gè)字節(jié)
- utf-8 是一種針對(duì)Unicode的可變長(zhǎng)度字符編碼恳谎,也是一種前綴碼肴捉。它可以用來(lái)表示Unicode標(biāo)準(zhǔn)中的任何字符朝蜘,且其編碼中的第一個(gè)字節(jié)仍與ASCII兼容,這使得原來(lái)處理ASCII字符的軟件無(wú)須或只須做少部分修改
java中亂碼的根源
一個(gè)漢字在不同編碼中的表示
WX20171024-145120@2x.png
實(shí)質(zhì)是同樣的byte[]在不同編碼方式中表示不同的字符