前端反爬蟲

1 .識別真人和機(jī)器人

后端方面

1 .user-agent+referer檢測
2 .賬號以及cookie驗(yàn)證
3 .驗(yàn)證碼
4 .ip限制頻率
5 .進(jìn)行瀏覽器檢測,如果不是瀏覽器則死掉晨汹。
6 .就是檢查他的機(jī)器性能一定是個(gè)真人用戶豹储。

無限接近真人的爬蟲

1 .puppeter:模擬瀏覽器環(huán)境,效率問題
2 .代理ip
3 .識別驗(yàn)證碼
4 .直接網(wǎng)頁截圖淘这,然后識別圖片中的文字剥扣,你是根本沒法攔截的。

前端方面

font-face拼湊式

1 .font-face定義了字符集铝穷,通過unicode去印射展示钠怯。
2 .font-face加載網(wǎng)絡(luò)字體,我么可以自己創(chuàng)建一套字體曙聂,然后自定義一套字符映射關(guān)系表例如設(shè)置0xefab是映射字符1晦炊,0xeba2是映射字符2,以此類推宁脊。當(dāng)需要顯示字符1時(shí)断国,網(wǎng)頁的源碼只會(huì)是0xefab,被采集的也只會(huì)是 0xefab朦佩,并不是1
3 .但是對于正常的用戶來說則沒有影響并思,因?yàn)闉g覽器會(huì)加載css的font字體為我們渲染好,實(shí)時(shí)顯示在網(wǎng)頁中语稠。
4 .所以我們需要做的是,如何在判斷請求web字體的是機(jī)器人或者是真人,也就是說仙畦,攔截被收斂到了這一個(gè)地方
5 .定期更新一批字體文件和映射表來加大難度
6 .他這個(gè)破解也很簡單输涕,需要一下人工,讀出那個(gè)請求html文件對應(yīng)數(shù)字的unicode,自己把那個(gè)表更新一下慨畸,轉(zhuǎn)換那個(gè)部分可以做成自動(dòng)的莱坎,還是可以用的。自己手動(dòng)看一下1-9對應(yīng)的unicode

backgrodun 偏移顯示

1 .與font的策略類似寸士,美團(tuán)里用到的是background拼湊檐什。數(shù)字其實(shí)是圖片,根據(jù)不同的background偏移弱卡,顯示出不同的字符
2 .實(shí)際上看好像并不是這樣
3 .利用css來混淆視聽乃正,正常用戶可以看到,但是代碼上顯示是錯(cuò)誤的婶博,人可以讀懂瓮具,但是機(jī)器不能讀懂
4 .網(wǎng)頁所見非所得
5 .對返回的數(shù)組進(jìn)行解碼,比如進(jìn)行線性變化https://github.com/FantasticLBP/Anti-WebSpider,這個(gè)是可以從接口方面進(jìn)行杜絕的凡人。
6 .

微信

1 .在原本的內(nèi)容里面添加很多的其他內(nèi)容名党,然后通過css樣式影藏起來
2 .

汽車之家

1 .把關(guān)鍵信息,放在偽元素的content里面挠轴,這樣解析的時(shí)候传睹,就必須拿到偽元素的content,提升了爬蟲難度岸晦。
2 .瀏覽網(wǎng)頁好像是直接顯示的欧啤,但是這有一個(gè)問題,這種html代碼怎么用框架寫啊委煤,vue怎么在css的content里面顯示價(jià)格

去哪兒

1 .隨便顯示一個(gè)四位數(shù)的價(jià)格堂油,然后在用兩個(gè)b標(biāo)簽把錯(cuò)誤的數(shù)字覆蓋,這樣需要結(jié)合css來算他的價(jià)格
2 .雙11的淘寶和jd都沒有做價(jià)格保護(hù)

canvas指紋

1 .在繪制canvas圖片的時(shí)候碧绞,不同機(jī)器府框,不同瀏覽器繪制的圖片特征是相同并且獨(dú)一無二的,這樣的讥邻,只要提取最簡單的md5值便可以唯一標(biāo)識和跟蹤這個(gè)用戶
2 .在圖片格式上迫靖,不同的web瀏覽器使用了不同的圖形處理引擎,不同的圖片導(dǎo)出項(xiàng)兴使,不同的默認(rèn)壓縮等級
3 .在像素級別上系宜,操作系統(tǒng)各自使用了不同的設(shè)置和算法來進(jìn)行抗鋸齒和子像素級別的渲染操作
4 .操作系統(tǒng)的分辨率,瀏覽器版本发魄,安裝瀏覽器插件盹牧,操作系統(tǒng)的分辨率俩垃,下載的字體,所在時(shí)區(qū)和其他信息汰寓。每110萬人中口柳,才會(huì)有一個(gè)人的瀏覽器跟你有一樣的設(shè)置。
瀏覽器http請求中的用戶代理-navigator.userAgent
瀏覽器的語言(中文有滑、英文……)-navigator.language
設(shè)備屏幕的色彩信息-screen.colorDepth
設(shè)備屏幕的寬高-screen.height screen.width
格林威治時(shí)間和本地時(shí)間之間的時(shí)差-Date().getTimezoneOffset()
是否支持sessionStorage-window.sessionStorage
是否支持localStorage-window.localStorage
是否支持indexdDB-window.indexedDB
是否支持-docment.body.addBehavior(IE5的一個(gè)屬性)
是否支持調(diào)用本地?cái)?shù)據(jù)庫-window.openDatabase
瀏覽器所在系統(tǒng)的CPU等級-navigator.cupClass
客戶端的操作系統(tǒng)-navigator.platform
是否支持Do not track功能-navigator.doNotTrack
獲取瀏覽器部分插件信息-flash plugin跃闹、Adobe PDF reader、QuickTime毛好、real players望艺、ShockWave player、Windows media player肌访、Silverlight找默、Skype
canvas指紋
4 .也就是說要充分了解瀏覽器的屬性,才能找到破解指紋的原因。

用vue寫的價(jià)格顯示組件

1 .功能

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末场靴,一起剝皮案震驚了整個(gè)濱河市啡莉,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌旨剥,老刑警劉巖咧欣,帶你破解...
    沈念sama閱讀 212,080評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異轨帜,居然都是意外死亡魄咕,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,422評論 3 385
  • 文/潘曉璐 我一進(jìn)店門蚌父,熙熙樓的掌柜王于貴愁眉苦臉地迎上來哮兰,“玉大人,你說我怎么就攤上這事苟弛『戎停” “怎么了?”我有些...
    開封第一講書人閱讀 157,630評論 0 348
  • 文/不壞的土叔 我叫張陵膏秫,是天一觀的道長右遭。 經(jīng)常有香客問我,道長缤削,這世上最難降的妖魔是什么窘哈? 我笑而不...
    開封第一講書人閱讀 56,554評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮亭敢,結(jié)果婚禮上滚婉,老公的妹妹穿的比我還像新娘。我一直安慰自己帅刀,他們只是感情好让腹,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,662評論 6 386
  • 文/花漫 我一把揭開白布远剩。 她就那樣靜靜地躺著,像睡著了一般哨鸭。 火紅的嫁衣襯著肌膚如雪民宿。 梳的紋絲不亂的頭發(fā)上娇妓,一...
    開封第一講書人閱讀 49,856評論 1 290
  • 那天像鸡,我揣著相機(jī)與錄音,去河邊找鬼哈恰。 笑死只估,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的着绷。 我是一名探鬼主播蛔钙,決...
    沈念sama閱讀 39,014評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼荠医!你這毒婦竟也來了吁脱?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,752評論 0 268
  • 序言:老撾萬榮一對情侶失蹤彬向,失蹤者是張志新(化名)和其女友劉穎兼贡,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體娃胆,經(jīng)...
    沈念sama閱讀 44,212評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡遍希,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,541評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了里烦。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片凿蒜。...
    茶點(diǎn)故事閱讀 38,687評論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖胁黑,靈堂內(nèi)的尸體忽然破棺而出废封,到底是詐尸還是另有隱情,我是刑警寧澤丧蘸,帶...
    沈念sama閱讀 34,347評論 4 331
  • 正文 年R本政府宣布漂洋,位于F島的核電站,受9級特大地震影響触趴,放射性物質(zhì)發(fā)生泄漏氮发。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,973評論 3 315
  • 文/蒙蒙 一冗懦、第九天 我趴在偏房一處隱蔽的房頂上張望爽冕。 院中可真熱鬧,春花似錦披蕉、人聲如沸颈畸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,777評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽眯娱。三九已至礁苗,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間徙缴,已是汗流浹背试伙。 一陣腳步聲響...
    開封第一講書人閱讀 32,006評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留于样,地道東北人疏叨。 一個(gè)月前我還...
    沈念sama閱讀 46,406評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像穿剖,于是被迫代替她去往敵國和親蚤蔓。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,576評論 2 349

推薦閱讀更多精彩內(nèi)容