Python爬蟲——selenium模擬登陸新浪微博(網(wǎng)頁)

上一篇文章Python爬蟲——新浪微博(網(wǎng)頁版)中提到cookie過期問題袍祖,想了一下可以通過selenium+chrome模擬登陸獲取登陸成功后的cookies拧篮,然后構(gòu)造字典返回牢裳,這樣在主程序進(jìn)行判斷如果抓不到正確的數(shù)據(jù)阶祭,就重新模擬登陸獲取新的cookies并返回(個人想法,測試可行)
URL入口+xpath定位
URL:http://weibo.com/login.php

輸入框位置

** selenium+chrome**
這里如果沒有安裝相關(guān)的包岛蚤,可以自行百度解決環(huán)境問題番川,主程序主要使用selenium相關(guān)的函數(shù)去模擬點(diǎn)擊和輸入事件到涂,最后獲取登錄后的cookies脊框,廢話不多說,直接上代碼供大家參考践啄。
模擬登錄Demo

import time
from selenium import webdriver

class COOKIE(object):
    url = 'http://weibo.com/login.php'
    def __init__(self):
        self.browser = webdriver.Chrome()
    def getcookie(self):
        self.browser.get(self.url)
        self.browser.implicitly_wait(15)
        self.browser.find_element_by_xpath('//*[@id="loginname"]').clear()
        self.browser.find_element_by_xpath('//*[@id="loginname"]').send_keys('你的用戶名')
        self.browser.find_element_by_xpath('//*[@id="pl_login_form"]/div/div[3]/div[2]/div/input').clear()
        time.sleep(1)
        self.browser.find_element_by_xpath('//*[@id="pl_login_form"]/div/div[3]/div[2]/div/input').send_keys('密碼')
        time.sleep(1)
        self.browser.find_element_by_xpath('//*[@id="pl_login_form"]/div/div[3]/div[6]/a').click()
        cookie_dic={}
        cookies = self.browser.get_cookies()
        self.browser.close()
        for cookie in cookies:
            if cookie.has_key('name') and cookie.has_key('value'):
                cookie_dic[cookie['name'].encode('utf-8')]=cookie['value'].encode('utf-8')
        return cookie_dic

遇到的問題

  • 1.為什么沒使用無界面的phantomjs浇雹,測試的時候使用的是chrome。并且成功返回了cookies屿讽,之后更換phantomjs后昭灵,出現(xiàn)找不到填充的位置的問題,之前以為是請求頭等問題伐谈,添加之后仍然不可行烂完,所以暫時采用chrome。
  • 2.程序中間加了強(qiáng)制等待诵棵,這是因?yàn)榭衮迹绻患舆@個的話可能出現(xiàn)登錄不成功的情況(可能于網(wǎng)速有關(guān)系吧),所以最好還是加上履澳,時間自行調(diào)整嘶窄。

selenium使用案例
想對selenium進(jìn)一步了解的可以自行查相關(guān)的資料,然后就是在模擬登錄的時候要找到正確URL入口和賬戶和密碼的輸入框的位置奇昙,這里給一個58同城登錄的示例作為參考护侮。

58同城登錄界面

很顯然我們用工具去抓的時候敌完,給我的位置是第一個密碼框的位置储耐,但是這個位置是填充不進(jìn)去值的,接著看下邊同樣也是密碼輸入框滨溉,但是display:none(隱藏了)什湘,然后我就想如果定位到這個位置能否成功填充密碼,經(jīng)測試果然可以晦攒,我們可以更改這個網(wǎng)頁元素屬性來看一下有怎樣的變化闽撤。

更改屬性后

我們可以看到我講display的none屬性去掉后,主頁面多了一個密碼框脯颜,所以這個才是真正的密碼填充框哟旗,只不過一開始隱藏了。
總結(jié)
selenium模擬登錄這塊還是要找到正確的URL入口和正確的輸入框位置栋操,解決了這些差不多就可以完成模擬登錄一個網(wǎng)站闸餐。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市矾芙,隨后出現(xiàn)的幾起案子舍沙,更是在濱河造成了極大的恐慌,老刑警劉巖剔宪,帶你破解...
    沈念sama閱讀 211,743評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件拂铡,死亡現(xiàn)場離奇詭異壹无,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)感帅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,296評論 3 385
  • 文/潘曉璐 我一進(jìn)店門斗锭,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人失球,你說我怎么就攤上這事拒迅。” “怎么了她倘?”我有些...
    開封第一講書人閱讀 157,285評論 0 348
  • 文/不壞的土叔 我叫張陵璧微,是天一觀的道長。 經(jīng)常有香客問我硬梁,道長前硫,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,485評論 1 283
  • 正文 為了忘掉前任荧止,我火速辦了婚禮屹电,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘跃巡。我一直安慰自己危号,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,581評論 6 386
  • 文/花漫 我一把揭開白布素邪。 她就那樣靜靜地躺著外莲,像睡著了一般。 火紅的嫁衣襯著肌膚如雪兔朦。 梳的紋絲不亂的頭發(fā)上偷线,一...
    開封第一講書人閱讀 49,821評論 1 290
  • 那天,我揣著相機(jī)與錄音沽甥,去河邊找鬼声邦。 笑死,一個胖子當(dāng)著我的面吹牛摆舟,可吹牛的內(nèi)容都是我干的亥曹。 我是一名探鬼主播,決...
    沈念sama閱讀 38,960評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼恨诱,長吁一口氣:“原來是場噩夢啊……” “哼媳瞪!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起胡野,我...
    開封第一講書人閱讀 37,719評論 0 266
  • 序言:老撾萬榮一對情侶失蹤材失,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后硫豆,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體龙巨,經(jīng)...
    沈念sama閱讀 44,186評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡笼呆,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,516評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了旨别。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片诗赌。...
    茶點(diǎn)故事閱讀 38,650評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖秸弛,靈堂內(nèi)的尸體忽然破棺而出铭若,到底是詐尸還是另有隱情,我是刑警寧澤递览,帶...
    沈念sama閱讀 34,329評論 4 330
  • 正文 年R本政府宣布叼屠,位于F島的核電站,受9級特大地震影響绞铃,放射性物質(zhì)發(fā)生泄漏镜雨。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,936評論 3 313
  • 文/蒙蒙 一儿捧、第九天 我趴在偏房一處隱蔽的房頂上張望荚坞。 院中可真熱鬧,春花似錦菲盾、人聲如沸颓影。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,757評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽诡挂。三九已至,卻和暖如春疗我,著一層夾襖步出監(jiān)牢的瞬間咆畏,已是汗流浹背南捂。 一陣腳步聲響...
    開封第一講書人閱讀 31,991評論 1 266
  • 我被黑心中介騙來泰國打工吴裤, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人溺健。 一個月前我還...
    沈念sama閱讀 46,370評論 2 360
  • 正文 我出身青樓麦牺,卻偏偏與公主長得像,于是被迫代替她去往敵國和親鞭缭。 傳聞我的和親對象是個殘疾皇子剖膳,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,527評論 2 349

推薦閱讀更多精彩內(nèi)容