urllib2.HTTPError: HTTP Error 403: Forbidden

<span style="font-size:18px;">應(yīng)用例子:

#coding:utf-8  
import urllib2  

request = urllib2.Request('http://blog.csdn.net/nevasun')  

#在請求加上頭信息,偽裝成瀏覽器訪問  
request.add_header('User-      Agent','Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6')  

opener = urllib2.build_opener()  
f= opener.open(request)  
print f.read().decode('utf-8')  
</span>  `

在終端運(yùn)行提示urllib2.HTTPError: HTTP Error 403: Forbidden晴氨,怎么回事呢鹰祸?
這是由于網(wǎng)站禁止爬蟲,可以在請求加上頭信息,偽裝成瀏覽器訪問种冬。添加和修改:
[python] headers = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}
req = urllib2.Request("http://blog.csdn.net/nevasun", headers=headers) 再試一下镣丑,HTTP Error 403沒有了,但是中文全都是亂碼娱两。又是怎么回事莺匠?

這是由于網(wǎng)站是utf-8編碼的,需要轉(zhuǎn)換成本地系統(tǒng)的編碼格式:
import sys, urllib2
headers = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}
req = urllib2.Request("http://blog.csdn.net/nevasun", headers=headers)
content = urllib2.urlopen(req).read()
# UTF-8
type = sys.getfilesystemencoding()

   # local encode format  print content.decode("UTF-8").encode(type)  
  # convert encode format import sys, urllib2

OK十兢,大功告成趣竣,可以抓取中文頁面了。下一步就是在GAE上做個(gè)簡單的應(yīng)用了~

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末旱物,一起剝皮案震驚了整個(gè)濱河市遥缕,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌宵呛,老刑警劉巖单匣,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異宝穗,居然都是意外死亡户秤,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進(jìn)店門逮矛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來虎忌,“玉大人,你說我怎么就攤上這事橱鹏。” “怎么了堪藐?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵莉兰,是天一觀的道長。 經(jīng)常有香客問我礁竞,道長糖荒,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任模捂,我火速辦了婚禮捶朵,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘狂男。我一直安慰自己综看,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布岖食。 她就那樣靜靜地躺著红碑,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上析珊,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天羡鸥,我揣著相機(jī)與錄音,去河邊找鬼忠寻。 笑死惧浴,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的奕剃。 我是一名探鬼主播衷旅,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼祭饭!你這毒婦竟也來了芜茵?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤倡蝙,失蹤者是張志新(化名)和其女友劉穎九串,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體寺鸥,經(jīng)...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡猪钮,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了胆建。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片烤低。...
    茶點(diǎn)故事閱讀 37,997評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖笆载,靈堂內(nèi)的尸體忽然破棺而出扑馁,到底是詐尸還是另有隱情,我是刑警寧澤凉驻,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布腻要,位于F島的核電站,受9級特大地震影響涝登,放射性物質(zhì)發(fā)生泄漏雄家。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一胀滚、第九天 我趴在偏房一處隱蔽的房頂上張望趟济。 院中可真熱鬧,春花似錦咽笼、人聲如沸顷编。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽勾效。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間层宫,已是汗流浹背杨伙。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留萌腿,地道東北人限匣。 一個(gè)月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像毁菱,于是被迫代替她去往敵國和親米死。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內(nèi)容