通過urllib2+resquest爬蟲百度貼吧網(wǎng)址,并保存至該工作目錄下
一歧胁、示例代碼
代碼解析:
1.首先定義一個baidu_tieba的函數(shù):def baidu_tieba()
2.抓取的網(wǎng)頁給重新命名并保存在工作目錄下:
name = string.zfill(i,5) +'.html';
url = urllib2.Request(baurl)
m = urllib2.urlopen(url).read()
f.write(m)
3.手動輸入網(wǎng)址、網(wǎng)頁的頁數(shù)等raw_input()
4.調(diào)用baidu_tieba的函數(shù):def baidu_tieba()運行程序并查看運行結(jié)果