(2018-05-21.Python從Zero到One)5泊交、(爬蟲)scrapy實戰(zhàn)項目__1.5.6(實戰(zhàn)項目六)三種scrapy模擬登錄策略

注意:模擬登陸時儿奶,必須保證settings.py里的 COOKIES_ENABLED (Cookies中間件) 處于開啟狀態(tài)

COOKIES_ENABLED = True 或 # COOKIES_ENABLED = False

策略一:直接POST數(shù)據(jù)(比如需要登陸的賬戶信息)

只要是需要提供post數(shù)據(jù)的眷射,就可以用這種方法镇辉。下面示例里post的數(shù)據(jù)是賬戶密碼:

# -*- coding: utf-8 -*-
import scrapy


class Renren1Spider(scrapy.Spider):
    name = "renren1"
    allowed_domains = ["renren.com"]

    def start_requests(self):
        url = 'http://www.renren.com/PLogin.do'
        # FormRequest 是Scrapy發(fā)送POST請求的方法
        yield scrapy.FormRequest(
                url = url,
                formdata = {"email" : "mr_mao_hacker@163.com", "password" : "axxxxxxxe"},
                callback = self.parse_page)

    def parse_page(self, response):
        with open("mao2.html", "w") as filename:
            filename.write(response.body)

策略二:標準的模擬登陸步驟

正統(tǒng)模擬登錄方法:
首先發(fā)送登錄頁面的get請求词身,獲取到頁面里的登錄必須的參數(shù)(比如說zhihu登陸界面的 _xsrf)
然后和賬戶密碼一起post到服務(wù)器厅目,登錄成功

# -*- coding: utf-8 -*-
import scrapy



class Renren2Spider(scrapy.Spider):
    name = "renren2"
    allowed_domains = ["renren.com"]
    start_urls = (
        "http://www.renren.com/PLogin.do",
    )

    # 處理start_urls里的登錄url的響應(yīng)內(nèi)容,提取登陸需要的參數(shù)(如果需要的話)
    def parse(self, response):
        # 提取登陸需要的參數(shù)
        #_xsrf = response.xpath("http://_xsrf").extract()[0]

        # 發(fā)送請求參數(shù),并調(diào)用指定回調(diào)函數(shù)處理
        yield scrapy.FormRequest.from_response(
                response,
                formdata = {"email" : "mr_mao_hacker@163.com", "password" : "axxxxxxxe"},#, "_xsrf" = _xsrf},
                callback = self.parse_page
            )

    # 獲取登錄成功狀態(tài)损敷,訪問需要登錄后才能訪問的頁面
    def parse_page(self, response):
        url = "http://www.renren.com/422167102/profile"
        yield scrapy.Request(url, callback = self.parse_newpage)

    # 處理響應(yīng)內(nèi)容
    def parse_newpage(self, response):
        with open("xiao.html", "w") as filename:
            filename.write(response.body)

策略三:直接使用保存登陸狀態(tài)的Cookie模擬登陸

如果實在沒辦法了葫笼,可以用這種方法模擬登錄,雖然麻煩一點拗馒,但是成功率100%

# -*- coding: utf-8 -*-
import scrapy

class RenrenSpider(scrapy.Spider):
    name = "renren"
    allowed_domains = ["renren.com"]
    start_urls = (
        'http://www.renren.com/111111',
        'http://www.renren.com/222222',
        'http://www.renren.com/333333',
    )

    cookies = {
    "anonymid" : "ixrna3fysufnwv",
    "_r01_" : "1",
    "ap" : "327550029",
    "JSESSIONID" : "abciwg61A_RvtaRS3GjOv",
    "depovince" : "GW",
    "springskin" : "set",
    "jebe_key" : "f6fb270b-d06d-42e6-8b53-e67c3156aa7e%7Cc13c37f53bca9e1e7132d4b58ce00fa3%7C1484060607478%7C1%7C1486198628950",
    "t" : "691808127750a83d33704a565d8340ae9",
    "societyguester" : "691808127750a83d33704a565d8340ae9",
    "id" : "327550029",
    "xnsid" : "f42b25cf",
    "loginfrom" : "syshome"
    }

    # 可以重寫Spider類的start_requests方法路星,附帶Cookie值,發(fā)送POST請求
    def start_requests(self):
        for url in self.start_urls:
            yield scrapy.FormRequest(url, cookies = self.cookies, callback = self.parse_page)

    # 處理響應(yīng)內(nèi)容
    def parse_page(self, response):
        print "===========" + response.url
        with open("deng.html", "w") as filename:
            filename.write(response.body)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末诱桂,一起剝皮案震驚了整個濱河市洋丐,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌挥等,老刑警劉巖友绝,帶你破解...
    沈念sama閱讀 218,755評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異肝劲,居然都是意外死亡迁客,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,305評論 3 395
  • 文/潘曉璐 我一進店門辞槐,熙熙樓的掌柜王于貴愁眉苦臉地迎上來掷漱,“玉大人,你說我怎么就攤上這事榄檬〔贩叮” “怎么了?”我有些...
    開封第一講書人閱讀 165,138評論 0 355
  • 文/不壞的土叔 我叫張陵丙号,是天一觀的道長先朦。 經(jīng)常有香客問我,道長犬缨,這世上最難降的妖魔是什么喳魏? 我笑而不...
    開封第一講書人閱讀 58,791評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮怀薛,結(jié)果婚禮上刺彩,老公的妹妹穿的比我還像新娘。我一直安慰自己枝恋,他們只是感情好创倔,可當我...
    茶點故事閱讀 67,794評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著焚碌,像睡著了一般畦攘。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上十电,一...
    開封第一講書人閱讀 51,631評論 1 305
  • 那天知押,我揣著相機與錄音叹螟,去河邊找鬼。 笑死台盯,一個胖子當著我的面吹牛罢绽,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播静盅,決...
    沈念sama閱讀 40,362評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼良价,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蒿叠?” 一聲冷哼從身側(cè)響起明垢,我...
    開封第一講書人閱讀 39,264評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎市咽,沒想到半個月后袖外,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,724評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡魂务,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,900評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了卒稳。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片炒考。...
    茶點故事閱讀 40,040評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡盗温,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出孤紧,到底是詐尸還是另有隱情,我是刑警寧澤拒秘,帶...
    沈念sama閱讀 35,742評論 5 346
  • 正文 年R本政府宣布号显,位于F島的核電站,受9級特大地震影響躺酒,放射性物質(zhì)發(fā)生泄漏押蚤。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,364評論 3 330
  • 文/蒙蒙 一羹应、第九天 我趴在偏房一處隱蔽的房頂上張望揽碘。 院中可真熱鬧,春花似錦园匹、人聲如沸雳刺。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,944評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽掖桦。三九已至,卻和暖如春供汛,著一層夾襖步出監(jiān)牢的瞬間枪汪,已是汗流浹背涌穆。 一陣腳步聲響...
    開封第一講書人閱讀 33,060評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留料饥,地道東北人蒲犬。 一個月前我還...
    沈念sama閱讀 48,247評論 3 371
  • 正文 我出身青樓,卻偏偏與公主長得像岸啡,于是被迫代替她去往敵國和親原叮。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,979評論 2 355

推薦閱讀更多精彩內(nèi)容