selenium+phantomjs模擬登錄京東后臺(tái)并且保存cookies

做爬蟲的同學(xué)應(yīng)該經(jīng)常遇到登錄驗(yàn)證的問題,在這里我使用phantomejs模擬登錄并且保存cookies损晤,方便再次登錄脆粥。廢話不多說砌溺,直接切入正題。

  • 模擬登錄
def login(username, password, driver=None):
    url = 'https://www.jd.com/productDetail.html'
    driver.get(url)
    driver.find_element_by_xpath('//input[@id="loginname"]').send_keys(username)
    logger.info ('已輸入賬號(hào)')
    driver.find_element_by_xpath('//input[@id="nloginpwd"]').send_keys(password)
    logger.info ('已輸入密碼')
    driver.find_element_by_xpath('//a[@id="loginsubmit"]').click()
    logger.info ('已點(diǎn)擊登錄按鈕')
    return driver
  • 從網(wǎng)上獲取cookies
    def get_cookies_from_network():
        driver = login(username, password, driver)
        # 獲取cookies保存到本地并且返回此cookies
        cookies = driver.get_cookies()
        cookie_dict = {}
        logger.info(cookies)
        for cookie in cookies:
            if 'name' in cookie.keys() and 'value' in cookie.keys():
                cookie_dict[cookie['name']] = cookie['value']
        logger.info(cookie_dict)
        with open('cookies.txt', 'w') as f:
            # 保存cookies到本地
            f.write(json.dumps(cookies))
            logger.info("保存cookis成功.")
        return cookie_dict
  • 從本地緩存獲取cookies
    def get_cookies_from_cache():
        cookies_dict = {}
        if os.path.exists('cookies.txt'):
            # 如果本地有cookies文件变隔,則讀取本地cookies规伐,否則返回空
            with open('cookies.txt', 'r') as f:
                for i in json.loads(f.read()):
                    if 'name' in i.keys() and 'value' in i.keys():
                        if 'expiry' in i.keys():
                            expiry_date = int(i['expiry'])
                            # 判斷cookies是否過期,過期則返回空
                            if expiry_date > (int)(time.time()):
                                cookies_dict[i['name']] = i['value']
                            else:
                                logger.info('過期啦:{}'.format(i['name']))
                                return {}
                        else:
                            cookies_dict[i['name']] = i['value']
        else:
            return cookies_dict
        logger.info(cookies_dict)
        return cookies_dict
  • 獲取cookies時(shí)匣缘,優(yōu)先訪問本地的cookies猖闪,如果cookies過期則再次獲取。
    def get_cookies():
        # 先從本地獲取cookies
        cookie_dict = get_cookies_from_cache()
        if not cookie_dict:
            # 從本地返回的cookies為空則從網(wǎng)上獲取cookies
            cookie_dict = self.get_cookies_from_network()
        return cookie_dict
  • 帶著cookies登錄網(wǎng)站
    def get_content(driver=None):
        #獲取cookies
        cookies = get_cookies()
        # 先訪問一遍目標(biāo)網(wǎng)站
        driver.get(url)
        # 刪除當(dāng)前的cookies
        driver.delete_all_cookies()
        for k,v in cookies.items():
            # 添加cookies
            driver.add_cookie({'name': k, 'value': v})
        time.sleep(1)
        logger.info('get url again')
        # 再次訪問目標(biāo)網(wǎng)站肌厨,模擬登錄成功
        driver.get(self.url)
        logger.info(driver.page_source)

之后在cookies過期前可以以登錄狀態(tài)訪問網(wǎng)頁

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末培慌,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子柑爸,更是在濱河造成了極大的恐慌吵护,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,561評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件表鳍,死亡現(xiàn)場(chǎng)離奇詭異馅而,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)譬圣,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,218評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門瓮恭,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人厘熟,你說我怎么就攤上這事屯蹦。” “怎么了盯漂?”我有些...
    開封第一講書人閱讀 157,162評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵颇玷,是天一觀的道長。 經(jīng)常有香客問我就缆,道長帖渠,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,470評(píng)論 1 283
  • 正文 為了忘掉前任竭宰,我火速辦了婚禮空郊,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘切揭。我一直安慰自己狞甚,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,550評(píng)論 6 385
  • 文/花漫 我一把揭開白布廓旬。 她就那樣靜靜地躺著哼审,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上涩盾,一...
    開封第一講書人閱讀 49,806評(píng)論 1 290
  • 那天十气,我揣著相機(jī)與錄音,去河邊找鬼春霍。 笑死砸西,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的址儒。 我是一名探鬼主播芹枷,決...
    沈念sama閱讀 38,951評(píng)論 3 407
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼莲趣!你這毒婦竟也來了鸳慈?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,712評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤喧伞,失蹤者是張志新(化名)和其女友劉穎蝶涩,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體絮识,經(jīng)...
    沈念sama閱讀 44,166評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,510評(píng)論 2 327
  • 正文 我和宋清朗相戀三年嗽上,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了次舌。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,643評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡兽愤,死狀恐怖彼念,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情浅萧,我是刑警寧澤逐沙,帶...
    沈念sama閱讀 34,306評(píng)論 4 330
  • 正文 年R本政府宣布,位于F島的核電站洼畅,受9級(jí)特大地震影響吩案,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜帝簇,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,930評(píng)論 3 313
  • 文/蒙蒙 一徘郭、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧丧肴,春花似錦残揉、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,745評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春镇草,著一層夾襖步出監(jiān)牢的瞬間眶痰,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,983評(píng)論 1 266
  • 我被黑心中介騙來泰國打工陶夜, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留凛驮,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 46,351評(píng)論 2 360
  • 正文 我出身青樓条辟,卻偏偏與公主長得像黔夭,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子羽嫡,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,509評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢(shì)1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 171,769評(píng)論 25 707
  • 從三月份找實(shí)習(xí)到現(xiàn)在本姥,面了一些公司,掛了不少杭棵,但最終還是拿到小米婚惫、百度、阿里魂爪、京東先舷、新浪、CVTE滓侍、樂視家的研發(fā)崗...
    時(shí)芥藍(lán)閱讀 42,212評(píng)論 11 349
  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理蒋川,服務(wù)發(fā)現(xiàn),斷路器撩笆,智...
    卡卡羅2017閱讀 134,633評(píng)論 18 139
  • http協(xié)議有http0.9捺球,http1.0,http1.1和http2三個(gè)版本夕冲,但是現(xiàn)在瀏覽器使用的是htt...
    一現(xiàn)_閱讀 1,855評(píng)論 0 3
  • 親愛的你們氮兵,即將來到大學(xué),你們一定有過無數(shù)種的期待吧歹鱼。不論如何泣栈,我都要告訴你,大學(xué)將是你人生的一筆寶貴的財(cái)富弥姻,而作...
    呀咪的夏天閱讀 208評(píng)論 0 3