淘寶爬蟲 之 登陸驗證(二)

淘寶作為一大電商網(wǎng)站倘是,反爬措施還是相當(dāng)?shù)耐晟频模谖业奈恼轮?淘寶爬蟲 之 登陸驗證(一)是以cookie驗證的,這次用selenium模擬登陸随闪,用過selenium登陸淘寶的應(yīng)該知道登陸頁面對selenium的檢測是很嚴(yán)格的,只要一打開就會被檢測到骚勘,網(wǎng)上也有說用其他登陸方式登陸的(支付寶登陸)铐伴,我試過,可行俏讹,不過今天說的是正常的賬號密碼登陸当宴。

from selenium import webdriver

from selenium.webdriver import ActionChains

import time

#打開一個瀏覽器對象

driver = webdriver.Chrome()

#打開淘寶登陸頁面

driver.get('https://login.taobao.com/member/login.jhtml')

#模擬點擊到賬號密碼登陸

driver.find_element_by_id("J_Quick2Static").click()

#輸入賬號密碼

driver.find_element_by_id("TPL_username_1").send_keys("賬號")

password = driver.find_element_by_id("TPL_password_1").send_keys("密碼")

time.sleep(1)

#模擬滑塊滑動

slider = driver.find_element_by_xpath("http://*[@id='nc_1_n1z']")

# 平行移動鼠標(biāo)

action = ActionChains(driver)

action.drag_and_drop_by_offset(slider,500,0).perform()

#模擬點擊登陸

driver.find_element_by_id("J_SubmitStatic").click()

運行這段代碼會出現(xiàn)一個滑塊,無論怎么滑泽疆,手動滑都會被檢測到户矢,因為當(dāng)你用selenium打開的時候就會被淘寶后端驗證出來是個機器人,那么如何解決呢殉疼?當(dāng)然是找到淘寶是怎么驗證的了梯浪,經(jīng)過在網(wǎng)上查找各種資料(技術(shù)大牛還是很多的),在開發(fā)者模式下輸入window.navigator.webdriver會發(fā)現(xiàn)selenium打開的瀏覽器和正常的瀏覽器打開的有所不同瓢娜。

1-1

1-1就是selenium打開的瀏覽器挂洛,為true,但是正常瀏覽器打開的并不是true眠砾,淘寶應(yīng)該就是通過這個方法檢測selenium的虏劲。

1-2

正常瀏覽器打開的是undefined或者false脏嚷,那么如何修改呢的猛?

下面我說的是一個抓包工具 fiddler甥温,用它將登陸頁面的js替換掉米碰,換成我們修改過的js文件,將window.navigator.webdriver的值改變吻育,就可以繞過淘寶檢測了念秧。

首先找到淘寶登陸頁面的js

1-3

將里面的js代碼保存起來,在我們保存起來的js代碼中加入我們自己的代碼布疼。

Object.defineProperties(navigator,{

????webdriver:{

????????get:() =>false

? ? }

})


1-4

然后就是替換了摊趾,打開我們的fiddler,先運行一下我們剛才無法登陸的代碼游两,在fiddler中找到登陸頁面的js砾层,將這個js代碼拖動到右邊,3的位置就是我們自己js的路徑

1-5

替換好js文件之后就可以運行了贱案,就會發(fā)現(xiàn)登陸的滑塊檢測已經(jīng)不會出現(xiàn)了肛炮,,因為滑塊不會出現(xiàn)了宝踪,所以代碼需要改變一下侨糟,

from seleniumimport webdriver

import time

#打開一個瀏覽器對象

driver = webdriver.Chrome()

#打開淘寶登陸頁面

driver.get('https://login.taobao.com/member/login.jhtml')

#模擬點擊到賬號密碼登陸

driver.find_element_by_id("J_Quick2Static").click()

#輸入賬號密碼

driver.find_element_by_id("TPL_username_1").send_keys("賬號")

password = driver.find_element_by_id("TPL_password_1").send_keys("密碼")

time.sleep(1)

#模擬點擊登陸

driver.find_element_by_id("J_SubmitStatic").click()

可以登陸成功了,再看一次window.navigator.webdriver瘩燥,發(fā)現(xiàn)它已經(jīng)變成了false了

1-6

帶上selenium自動登陸頁面的cookie就可以爬取數(shù)據(jù)了

獲取cookies后要轉(zhuǎn)換到相應(yīng)的字典格式秕重,才能正常訪問,

需要cookies中的name和value屬性再組成一個cooies字典厉膀,然后requests.get帶上cookies就可以正常請求頁面了


純代碼解決模式溶耘,建議多種方法一起用

參考一:https://www.cnblogs.com/cloudbird/p/10524611.html

設(shè)置開發(fā)者模式

options = webdriver.ChromeOptions()

# 此步驟很重要,設(shè)置為開發(fā)者模式服鹅,防止被各大網(wǎng)站識別出來使用了Selenium

options.add_experimental_option('excludeSwitches', ['enable-automation'])

driver = webdriver.Chrome(options=options)

如果不行了凳兵,想辦法改一下chromedriver源代碼

參考二:http://www.reibang.com/p/368be2cc6ca1

最后瀏覽器仍然存在問題的話

driver.execute_script('Object.defineProperties(navigator,{webdriver:{get:()=>false}})')

修改瀏覽器的webdriver

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市企软,隨后出現(xiàn)的幾起案子庐扫,更是在濱河造成了極大的恐慌,老刑警劉巖仗哨,帶你破解...
    沈念sama閱讀 210,978評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件聚蝶,死亡現(xiàn)場離奇詭異,居然都是意外死亡藻治,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,954評論 2 384
  • 文/潘曉璐 我一進店門巷挥,熙熙樓的掌柜王于貴愁眉苦臉地迎上來桩卵,“玉大人,你說我怎么就攤上這事〕冢” “怎么了胜嗓?”我有些...
    開封第一講書人閱讀 156,623評論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長钩乍。 經(jīng)常有香客問我辞州,道長,這世上最難降的妖魔是什么寥粹? 我笑而不...
    開封第一講書人閱讀 56,324評論 1 282
  • 正文 為了忘掉前任变过,我火速辦了婚禮,結(jié)果婚禮上涝涤,老公的妹妹穿的比我還像新娘媚狰。我一直安慰自己,他們只是感情好阔拳,可當(dāng)我...
    茶點故事閱讀 65,390評論 5 384
  • 文/花漫 我一把揭開白布崭孤。 她就那樣靜靜地躺著,像睡著了一般糊肠。 火紅的嫁衣襯著肌膚如雪辨宠。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,741評論 1 289
  • 那天货裹,我揣著相機與錄音嗤形,去河邊找鬼。 笑死泪酱,一個胖子當(dāng)著我的面吹牛派殷,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播墓阀,決...
    沈念sama閱讀 38,892評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼毡惜,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了斯撮?” 一聲冷哼從身側(cè)響起经伙,我...
    開封第一講書人閱讀 37,655評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎勿锅,沒想到半個月后帕膜,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,104評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡溢十,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年垮刹,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片张弛。...
    茶點故事閱讀 38,569評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡荒典,死狀恐怖酪劫,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情寺董,我是刑警寧澤覆糟,帶...
    沈念sama閱讀 34,254評論 4 328
  • 正文 年R本政府宣布,位于F島的核電站遮咖,受9級特大地震影響滩字,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜御吞,卻給世界環(huán)境...
    茶點故事閱讀 39,834評論 3 312
  • 文/蒙蒙 一麦箍、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧魄藕,春花似錦内列、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,725評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至寝姿,卻和暖如春交排,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背饵筑。 一陣腳步聲響...
    開封第一講書人閱讀 31,950評論 1 264
  • 我被黑心中介騙來泰國打工埃篓, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人根资。 一個月前我還...
    沈念sama閱讀 46,260評論 2 360
  • 正文 我出身青樓架专,卻偏偏與公主長得像,于是被迫代替她去往敵國和親玄帕。 傳聞我的和親對象是個殘疾皇子部脚,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,446評論 2 348

推薦閱讀更多精彩內(nèi)容