Python requests請求頁面返回亂碼問題

序言

有時(shí)候在通過Python爬取網(wǎng)頁數(shù)據(jù)的時(shí)候瓢娜,比如抖音挂洛、快手等短視頻數(shù)據(jù);網(wǎng)頁會(huì)返回亂碼;這種亂碼數(shù)據(jù)眠砾,不管是gb2312虏劲、utf-8、gbk、亦或者使用gbk的超集gb18030等編碼都毫無用處柒巫±ぃ看下圖。
image.png
原因出在一個(gè)參數(shù)上 'accept-encoding': 'gzip, deflate, br'

gzip是一種數(shù)據(jù)格式堡掏;默認(rèn)且目前僅使用deflate算法壓縮data部分应结,這種方法常用于壓縮傳輸。

image.png

普通瀏覽器在訪問網(wǎng)頁時(shí)泉唁,之所以要添加 'accept-encoding': 'gzip, deflate, br' 鹅龄;是因?yàn)椋瑸g覽器對于從服務(wù)器中返回的對應(yīng)的gzip壓縮的網(wǎng)頁亭畜,會(huì)自動(dòng)解壓縮扮休,所以,在requests的時(shí)候贱案,添加對應(yīng)的請求頭肛炮,來表明自己接收壓縮后的數(shù)據(jù)止吐。

而在上面的代碼中宝踪,如果也添加此頭的信息,結(jié)果就是碍扔,返回的是壓縮后的數(shù)據(jù)瘩燥,沒有解碼,直接將壓縮后的數(shù)據(jù)當(dāng)做普通的html文本來處理不同,所以顯示出來的內(nèi)容厉膀,就是亂碼了。(看到這里是不是有種恍然大悟??)

如果還不理解再直白點(diǎn):就是服務(wù)器數(shù)據(jù)返回給客戶端時(shí)候已經(jīng)被gzip壓縮了二拐,而你的程序里面沒有自動(dòng)解壓而已服鹅。

解決方案


1、注釋掉 百新;

2企软、可以弄個(gè)解壓算法把亂碼的數(shù)據(jù)進(jìn)行解壓,即可得到正常的HTML返回結(jié)果饭望。


在這個(gè)浮躁的時(shí)代仗哨;竟然還有人能堅(jiān)持篇篇原創(chuàng);
如果本文對你學(xué)習(xí)有所幫助-可以點(diǎn)贊??+ 關(guān)注铅辞!將持續(xù)更新更多新的文章厌漂。
支持原創(chuàng)。感謝斟珊!
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末苇倡,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌旨椒,老刑警劉巖胜嗓,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異钩乍,居然都是意外死亡辞州,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進(jìn)店門寥粹,熙熙樓的掌柜王于貴愁眉苦臉地迎上來变过,“玉大人,你說我怎么就攤上這事涝涤∶恼” “怎么了?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵阔拳,是天一觀的道長崭孤。 經(jīng)常有香客問我,道長糊肠,這世上最難降的妖魔是什么辨宠? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮货裹,結(jié)果婚禮上嗤形,老公的妹妹穿的比我還像新娘。我一直安慰自己弧圆,他們只是感情好赋兵,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著搔预,像睡著了一般霹期。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上拯田,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天历造,我揣著相機(jī)與錄音,去河邊找鬼勿锅。 笑死帕膜,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的溢十。 我是一名探鬼主播垮刹,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼张弛!你這毒婦竟也來了荒典?” 一聲冷哼從身側(cè)響起酪劫,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎寺董,沒想到半個(gè)月后覆糟,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡遮咖,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年滩字,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片御吞。...
    茶點(diǎn)故事閱讀 39,977評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡麦箍,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出陶珠,到底是詐尸還是另有隱情挟裂,我是刑警寧澤,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布揍诽,位于F島的核電站诀蓉,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏暑脆。R本人自食惡果不足惜渠啤,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望饵筑。 院中可真熱鬧埃篓,春花似錦、人聲如沸根资。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽玄帕。三九已至,卻和暖如春想邦,著一層夾襖步出監(jiān)牢的瞬間裤纹,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工丧没, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留鹰椒,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓呕童,卻偏偏與公主長得像漆际,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個(gè)殘疾皇子夺饲,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內(nèi)容