Beautiful Soup自動將輸入文檔轉(zhuǎn)換為Unicode編碼浸策,輸出文檔轉(zhuǎn)換為utf-8編碼奏司。你不需要考慮編碼方式瓷叫,除非文檔沒有指定一個編碼方式拢军,這時贮尉,Beautiful Soup就不能自動識別編碼方式了。然后朴沿,你僅僅需要說明一下原始編碼方式就可以了猜谚。
python想要使用漢字,需要在腳本最前面添加#coding:utf-8或者#coding=utf-8赌渣,漢字使用的編碼為utf-8魏铅,否則會出現(xiàn)錯誤)
不要用控制臺顯示你的爬取東西,控制臺的文本功能非常弱坚芜,根本不能正確顯示爬取的大量文本览芳。