scrapy豆瓣登錄響應(yīng)結(jié)果亂碼問題

在使用scrapy登錄豆瓣時蜘澜，發(fā)現(xiàn)其返回結(jié)果為亂碼响疚，使用各種方式對其response進(jìn)行轉(zhuǎn)碼，均無效装诡，spider代碼如下：

import scrapy

class DoubanSpider(scrapy.Spider):
    name = 'douban'
    allowed_domains = ['www.douban.com/people/210172987/']
    start_urls = ['https://www.douban.com/people/210172987/']

    def start_requests(self):
        url = "https://accounts.douban.com/j/mobile/login/basic"
        data = {
            "name":"138xxxxxx",
            "password": "xxxxxx",
            "remember": "false",
        }
        yield scrapy.FormRequest(url=url, formdata=data, callback=self.parse_login)

    def parse_login(self, response):
        print(response.text)

亂碼如下：

Jietu20200203-135349.jpg

測試發(fā)現(xiàn)postman下結(jié)果是正常鸦采，經(jīng)對比咕幻，發(fā)現(xiàn)其返回正文內(nèi)容編碼為br，如：Content-Encoding: br

br 指的是 Brotli咱旱，是一種全新的數(shù)據(jù)格式，無損壓縮吐限，壓縮比極高（比gzip高的）。

默認(rèn)環(huán)境沒有提供br編碼的支持诸典，因此亂碼。

其解決方法：

把默認(rèn)header中的Accept-Encoding中的br去除
提供br壓縮格式支持舀寓。

解決方法一：把默認(rèn)header中的Accept-Encoding中的br去除肌蜻，結(jié)果如：

DEFAULT_REQUEST_HEADERS = {
    'Accept': 'application/json,text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',
    'Accept-Language': 'zh-cn',
    'Accept-Encoding': 'gzip, deflate',
    'Connection': 'keep-alive',
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_2) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/13.0.4 Safari/605.1.15'
}

解決方法二：提供br壓縮格式支持：安裝Brotli蒋搜，
通過 pip安裝即可，

pip install Brotli

因為默認(rèn)scrapy中間件scrapy.downloadermiddlewares.httpcompression.HttpCompressionMiddleware對壓縮內(nèi)容提供了支持(包括br格式)豆挽，但環(huán)境默認(rèn)沒有提供br格式的解壓包導(dǎo)致。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市娘侍，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌僵缺，老刑警劉巖踩叭，帶你破解...
沈念sama閱讀 222,252評論 6贊 516
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件容贝，死亡現(xiàn)場離奇詭異之景，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)锻狗，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,886評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來油额，“玉大人潦嘶，你說我怎么就攤上這事〉嘟” “怎么了？”我有些...
開封第一講書人閱讀 168,814評論 0贊 361
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵幔睬，是天一觀的道長互妓。經(jīng)常有香客問我，道長澈蚌，這世上最難降的妖魔是什么灼狰？我笑而不...
開封第一講書人閱讀 59,869評論 1贊 299
?港島之戀（遺憾婚禮）
正文為了忘掉前任交胚，我火速辦了婚禮，結(jié)果婚禮上蝴簇，老公的妹妹穿的比我還像新娘。我一直安慰自己旁钧，他們只是感情好互拾，可當(dāng)我...
茶點故事閱讀 68,888評論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布颜矿。她就那樣靜靜地躺著寄猩，像睡著了一般田篇。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上泊柬，一...
開封第一講書人閱讀 52,475評論 1贊 312
城市分裂傳說
那天彬呻，我揣著相機(jī)與錄音，去河邊找鬼闸氮。笑死蒲跨，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的或悲。我是一名探鬼主播，決...
沈念sama閱讀 41,010評論 3贊 422
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼翎蹈，長吁一口氣：“原來是場噩夢啊……” “哼男公！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起澄阳，我...
開封第一講書人閱讀 39,924評論 0贊 277
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤碎赢，失蹤者是張志新（化名）和其女友劉穎速梗，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體镀琉，經(jīng)...
沈念sama閱讀 46,469評論 1贊 319
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡屋摔，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 38,552評論 3贊 342
?白月光啟示錄
正文我和宋清朗相戀三年替梨，在試婚紗的時候發(fā)現(xiàn)自己被綠了装黑。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片弓熏。...
茶點故事閱讀 40,680評論 1贊 353
活死人
序言：一個原本活蹦亂跳的男人離奇死亡挽鞠，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出信认，到底是詐尸還是另有隱情嫁赏，我是刑警寧澤，帶...
沈念sama閱讀 36,362評論 5贊 351
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布款熬，位于F島的核電站攘乒，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏则酝。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 42,037評論 3贊 335
男人毒藥：我在死后第九天來索命
文/蒙蒙一喂链、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧妥泉，春花似錦椭微、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,519評論 0贊 25
一樁弒父案蝇率，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至刽沾，卻和暖如春本慕，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背侧漓。一陣腳步聲響...
開封第一講書人閱讀 33,621評論 1贊 274
情欲美人皮
我被黑心中介騙來泰國打工锅尘，沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人布蔗。一個月前我還...
沈念sama閱讀 49,099評論 3贊 378
代替公主和親
正文我出身青樓藤违，卻偏偏與公主長得像浪腐，于是被迫代替她去往敵國和親顿乒。傳聞我的和親對象是個殘疾皇子议街，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 45,691評論 2贊 361

scrapy豆瓣登錄響應(yīng)結(jié)果亂碼問題

推薦閱讀更多精彩內(nèi)容