下載:http://download.csdn.net/download/aqwd2008/4256178
官方地址:http://pypi.python.org/pypi/chardet
如果采用源代碼安裝方法蚣抗,有可能會提示缺少setuptools這個模塊。因此這里我們采用另外一種更為方便的安裝方法瓮下,不論你選擇哪種安裝包翰铡,將它解壓得到其中的文件夾【chardet】將這個文件夾復制到【python安裝根目錄\Lib\site-packages】下,確保這個位置可以被python引用到讽坏。如果不能被引用到請加入環(huán)境變量锭魔。
測試網(wǎng)頁編碼
importurllib
rawdata = urllib.urlopen('http://gs.amac.org.cn/amac-infodisc/res/pof/manager/138.html').read()
importchardet
fencoding= chardet.detect(rawdata)
print fencoding
另外一個高級的代碼
importurllib
fromchardet.universaldetectorimportUniversalDetector
usock?=?urllib.urlopen('http://www.baidu.com/')
#創(chuàng)建一個檢測對象
detector?=?UniversalDetector()
for line in usock.readlines():
#分塊進行測試,直到達到閾值
detector.feed(line)
ifdetector.done:break
#關閉檢測對象
detector.close()
usock.close()
#輸出檢測結(jié)果
printdetector.result
運行結(jié)果:
{'confidence':0.99,'encoding':'GB2312'}