編碼轉(zhuǎn)換是指將一種編碼轉(zhuǎn)成另外一種編碼件炉,比如 utf-8 to gbk。?
為何需要編碼轉(zhuǎn)換呢矮湘??因?yàn)椴煌僮飨到y(tǒng)編碼不同斟冕, utf-8在win上沒(méi)辦法直接看,因?yàn)閣indows是GBK編碼的板祝,得轉(zhuǎn)成gbk宫静。 反過(guò)來(lái)如果你的GBK字符相在Linux\Mac上正常顯示走净,就得轉(zhuǎn)成utf-8編碼券时。?
編碼&解碼
>>> s.encode("utf-8")? # 編碼
b'\xe5\xb0\x8f\xe7\x8c\xbf\xe5\x9c\x88'
>>> s_utf8=s.encode("utf-8")
>>>
>>> s_utf8.decode("utf-8")? #解碼
'小猿圈'
在py3里,內(nèi)存里的字符串是以u(píng)nicode編碼的伏伯,unicode的其中一個(gè)特性就是跟
所有語(yǔ)言編碼都有映射關(guān)系橘洞。所以你的utf-8格式的文件,在windows電腦上若是不能看说搅,就可以把utf-8先解碼成unicode,再由unicode編碼成gbk就可以了炸枣。
注意,不管在Windows or Mac or Linux上,你的pycharm IDE都可以支持各種文件編碼适肠,所以即使是utf-8的文件霍衫,在windows下的pycharm里也可以正常顯示