編碼轉(zhuǎn)換
平常在寫python代碼時經(jīng)常遇到輸出亂碼刑峡,unicode屏轰、gbk公荧、utf-8等等什么時候該用哪個確實很煩。多數(shù)情況在頭部聲明了coding:utf-8似乎并沒起作用微渠?
其實不是這樣的搭幻。講講我自己對于 decode 和 encode 的理解吧
decode 與 encode
decode 將某種編碼解碼成 unicode
encode 將 unicode 編碼成某種編碼
在我的理解中 unicode 相當于中間碼。當需要把使用 gbk 編碼的網(wǎng)頁源碼用python程序輸出時其文本往往是亂碼逞盆,這時候可以先把 gbk decode成unicode檀蹋,再把 unicode encode成 utf-8
html.decode('gbk').encode('utf-8')