爬蟲:瀏覽器指紋識(shí)別及處理方法

指紋識(shí)別原理

  • 在 selenium 抓取數(shù)據(jù)的時(shí)候,會(huì)暴露一些預(yù)定義的 JavaScript 變量喉祭,通過(guò)這些變量可以識(shí)別到用戶是否使用了 selenium 驅(qū)動(dòng);
  • 比較典型的例子泛烙,是 "window.navigator.webdriver",在非selenium環(huán)境下其值為undefined胶惰,而在selenium環(huán)境下,其值為true孵滞;
image.png
  • 除了 navigator,還有一些其它的標(biāo)志性字符串(不同的瀏覽器可能會(huì)有所不同)坊饶,常見的特征串如下所示:

webdriver  
__driver_evaluate  
__webdriver_evaluate  
__selenium_evaluate  
__fxdriver_evaluate  
  
__webdriver_unwrapped  
__selenium_unwrapped  
__fxdriver_unwrapped  
_Selenium_IDE_Recorder  
_selenium  calledSelenium  
_WEBDRIVER_ELEM_CACHE  
ChromeDriverw  
driver-evaluate  
webdriver-evaluate  
selenium-evaluate  
webdriverCommand  
webdriver-evaluate-response  
__webdriverFunc  
__webdriver_script_fn  
__$webdriverAsyncExecutor  
__lastWatirAlert  
__lastWatirConfirm  
__lastWatirPrompt  
$chrome_asyncScriptInfo  
$cdc_asdjflasutopfhvcZLmcfl_

反指紋識(shí)別方法

  • webdriver 配置
options = webdriver.ChromeOptions()
options.add_experimental_option("excludeSwitches", ["enable-automation"])
browser = webdriver.Chrome(chrome_options=options)
driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
   "source": """Object.defineProperty(navigator, 'webdriver', {get: () => undefined})""",
})
  • mitmproxy 篡改參數(shù)
# coding: utf-8
# modify_response.py

from mitmproxy import ctx


def response(flow):
    """Modify response data
    """
    if '/js/yoda.' in flow.request.url:
        # Screening selenium detection
        for webdriver_key in ['webdriver', '__driver_evaluate', '__webdriver_evaluate', '__selenium_evaluate',
                              '__fxdriver_evaluate', '__driver_unwrapped', '__webdriver_unwrapped',
                              '__selenium_unwrapped', '__fxdriver_unwrapped', '_Selenium_IDE_Recorder', '_selenium',
                              'calledSelenium', '_WEBDRIVER_ELEM_CACHE', 'ChromeDriverw', 'driver-evaluate',
                              'webdriver-evaluate', 'selenium-evaluate', 'webdriverCommand',
                              'webdriver-evaluate-response', '__webdriverFunc', '__webdriver_script_fn',
                              '__$webdriverAsyncExecutor', '__lastWatirAlert', '__lastWatirConfirm',
                              '__lastWatirPrompt', '$chrome_asyncScriptInfo', '$cdc_asdjflasutopfhvcZLmcfl_']:
            ctx.log.info('Remove "{}" from {}.'.format(webdriver_key, flow.request.url))
            flow.response.text = flow.response.text.replace('"{}"'.format(webdriver_key), '"NO-SUCH-ATTR"')
            print(webdriver_key)
        flow.response.text = flow.response.text.replace('t.webdriver', 'false')
        flow.response.text = flow.response.text.replace('ChromeDriver', '')
mitmdump.exe -p Port number  -s modify_response.py
image.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末蟋滴,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子痘绎,更是在濱河造成了極大的恐慌,老刑警劉巖孤页,帶你破解...
    沈念sama閱讀 206,126評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡魂那,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門涯雅,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人展运,你說(shuō)我怎么就攤上這事±纸” “怎么了贬养?”我有些...
    開封第一講書人閱讀 152,445評(píng)論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)误算。 經(jīng)常有香客問我仰美,道長(zhǎng)儿礼,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,185評(píng)論 1 278
  • 正文 為了忘掉前任蚊夫,我火速辦了婚禮,結(jié)果婚禮上知纷,老公的妹妹穿的比我還像新娘。我一直安慰自己琅轧,他們只是感情好伍绳,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,178評(píng)論 5 371
  • 文/花漫 我一把揭開白布冲杀。 她就那樣靜靜地躺著,像睡著了一般睹酌。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上憋沿,一...
    開封第一講書人閱讀 48,970評(píng)論 1 284
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼甥绿。 笑死,一個(gè)胖子當(dāng)著我的面吹牛共缕,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播图谷,決...
    沈念sama閱讀 38,276評(píng)論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼便贵!你這毒婦竟也來(lái)了菠镇?” 一聲冷哼從身側(cè)響起承璃,我...
    開封第一講書人閱讀 36,927評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎盔粹,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體舷嗡,經(jīng)...
    沈念sama閱讀 43,400評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,883評(píng)論 2 323
  • 正文 我和宋清朗相戀三年进萄,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片中鼠。...
    茶點(diǎn)故事閱讀 37,997評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖兜蠕,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情熊杨,我是刑警寧澤曙旭,帶...
    沈念sama閱讀 33,646評(píng)論 4 322
  • 正文 年R本政府宣布桂躏,位于F島的核電站,受9級(jí)特大地震影響川陆,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,213評(píng)論 3 307
  • 文/蒙蒙 一鳞绕、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧们何,春花似錦、人聲如沸冤竹。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至钟病,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間档悠,已是汗流浹背廊鸥。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評(píng)論 1 260
  • 我被黑心中介騙來(lái)泰國(guó)打工辖所, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人缘回。 一個(gè)月前我還...
    沈念sama閱讀 45,423評(píng)論 2 352
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像典挑,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子您觉,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,722評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容

  • 序言: 前兩天有接收到一下問題,如何拿到瀏覽器指紋中的位置信息和CPU琳水,在這之前完全沒有接觸過(guò)瀏覽器指紋,抱著學(xué)習(xí)...
    Q646431665閱讀 1,048評(píng)論 0 0
  • 一在孝、 指紋識(shí)別接口從Android 6.0開始,Android系統(tǒng)加上了對(duì)指紋識(shí)別的支持私沮。所有指紋識(shí)別的接口都在...
    Qi0907閱讀 1,416評(píng)論 0 1
  • 表情是什么,我認(rèn)為表情就是表現(xiàn)出來(lái)的情緒。表情可以傳達(dá)很多信息造垛。高興了當(dāng)然就笑了魔招,難過(guò)就哭了五辽。兩者是相互影響密不可...
    Persistenc_6aea閱讀 124,164評(píng)論 2 7
  • 16宿命:用概率思維提高你的勝算 以前的我是風(fēng)險(xiǎn)厭惡者,不喜歡去冒險(xiǎn)奔脐,但是人生放棄了冒險(xiǎn)俄周,也就放棄了無(wú)數(shù)的可能髓迎。 ...
    yichen大刀閱讀 6,033評(píng)論 0 4