Web掃描(1)

  • web掃描器的原理

通過分析HTTP(S)的請求和響應(yīng)來發(fā)現(xiàn)安全問題和架構(gòu)缺陷

  • web爬蟲

一種按照一定的規(guī)則自動抓取萬維網(wǎng)資源的程序或者腳本

  • URL完整格式解析

協(xié)議://主機(jī)名[:端口]/路徑/[;參數(shù)][?查詢參數(shù)]#信息片段
eg:http://www.anquanbao.com:80/index.php?id=1#target
協(xié)議:http
主機(jī)名:www.anquanbao.com
端口:80
路徑:index.php
查詢參數(shù):id=1
信息片段:target

  • 網(wǎng)頁的超鏈接

1睁冬、絕對URL的超鏈接:鏈接網(wǎng)絡(luò)上的一個站點现拒、網(wǎng)頁或其他資源
2、相對URL的超鏈接:鏈接同一網(wǎng)站的資源
3花嘶、書簽:鏈接同一網(wǎng)頁的資源
eg:
絕對URL超鏈接:
<a ></a>
相對URL超鏈接:
<a href='index.html'></a>
//以當(dāng)前頁面地址為基點形成超鏈接
index.html表示同一網(wǎng)站的新的頁面
<a href="#top"></a>
同一頁面的超鏈接琳彩,用戶點擊時會跳到同一頁面的top位置

  • HTTP協(xié)議

1誊酌、HTTP請求
請求行部凑、請求報頭、請求正文
2碧浊、HTTP響應(yīng)
響應(yīng)行涂邀、響應(yīng)報頭、響應(yīng)正文

  • HTTP認(rèn)證

1箱锐、Basic認(rèn)證:按照明文信息進(jìn)行傳遞比勉,易劫持
2、Digest認(rèn)證(摘要式):需要通過兩次交互來完成
//都容易被劫持和監(jiān)聽

  • DNS本地緩存

1驹止、將域名和ip的關(guān)系存儲下來浩聋;分為瀏覽器緩存、系統(tǒng)緩存(瀏覽器緩存優(yōu)先)
2臊恋、火狐瀏覽器緩存文件查看:about:cache
谷歌瀏覽器緩存文件查看:chrome://net-internals/#dns
//分別在對應(yīng)的瀏覽器中輸入
3衣洁、系統(tǒng)緩存查看:命令行窗口中輸入ipconfig /displaydns

  • 爬蟲策略

1、廣度優(yōu)先策略
2抖仅、深度優(yōu)先策略
3坊夫、最佳優(yōu)先策略

  • 頁面跳轉(zhuǎn)

1、客戶端跳轉(zhuǎn)
301跳轉(zhuǎn):永久性轉(zhuǎn)移
302跳轉(zhuǎn):臨時性跳轉(zhuǎn)
2撤卢、服務(wù)端跳轉(zhuǎn)
服務(wù)端在收到客戶端的HTTP請求后环凿,由于請求到的頁面和實際處理請求的頁面不同,服務(wù)端會在內(nèi)部進(jìn)行頁面跳轉(zhuǎn)放吩。
//服務(wù)端跳轉(zhuǎn)時智听,客戶端只發(fā)送一次請求,瀏覽器的地址欄不會顯示目標(biāo)地址的URL屎慢;客戶端跳轉(zhuǎn)時,由于是兩次請求忽洛,這時地址欄中會顯示目標(biāo)資源的URL腻惠。(客戶端向服務(wù)端發(fā)出第一次請求并發(fā)生一次跳轉(zhuǎn),得到服務(wù)端的響應(yīng)后根據(jù)響應(yīng)提供的地址發(fā)出第二次請求并進(jìn)行第二次跳轉(zhuǎn)欲虚,最終地址欄的地址為第二次請求的地址)
參考鏈接:小結(jié):“服務(wù)器端跳轉(zhuǎn)”和“客戶端跳轉(zhuǎn)”的區(qū)別

  • URL

1集灌、URL間的關(guān)系
URL重復(fù):完全一樣
URL相似:除了參數(shù)值不一樣外,其余都一樣
URL包含:參數(shù)名包含
2复哆、URL去重

  • 哈希表去重
    建立一個HASH表欣喧,在HASH表中查找新的URL是否存在,不存在就放進(jìn)去梯找,一直遍歷完所有的URL
  • 布隆過濾器
  • 頁面相似算法

1唆阿、編輯距離:根據(jù)兩個字符串由一個轉(zhuǎn)成另一個所需要的最少編輯次數(shù)來比較兩個頁面間的相似度;
//一般來說锈锤,編輯距離越小驯鳖,兩個串間的相似度越大
2闲询、Simhash:為每一個web文檔通過hash的方式生成一個64位的字節(jié)指紋(特征字),根據(jù)特征字的海明距離是不是<n(n一般為3)來判斷兩個文檔的相似度浅辙。
//海明距離:兩個合法代碼對應(yīng)位上編碼的不同位數(shù)扭弧。
eg:10101和00110從第一位開始有5位不同,則海明距離為3.

  • 鏈接

1记舆、靜態(tài)鏈接:擴(kuò)展名主要為:rar鸽捻、zip、ttf泽腮、png御蒲、gif
2、動態(tài)鏈接:擴(kuò)展名主要為:html盛正、shtml删咱、do、asp豪筝、aspx痰滋、php、js

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末续崖,一起剝皮案震驚了整個濱河市敲街,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌严望,老刑警劉巖多艇,帶你破解...
    沈念sama閱讀 222,681評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異像吻,居然都是意外死亡峻黍,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,205評論 3 399
  • 文/潘曉璐 我一進(jìn)店門拨匆,熙熙樓的掌柜王于貴愁眉苦臉地迎上來姆涩,“玉大人,你說我怎么就攤上這事惭每」嵌觯” “怎么了?”我有些...
    開封第一講書人閱讀 169,421評論 0 362
  • 文/不壞的土叔 我叫張陵台腥,是天一觀的道長宏赘。 經(jīng)常有香客問我,道長黎侈,這世上最難降的妖魔是什么察署? 我笑而不...
    開封第一講書人閱讀 60,114評論 1 300
  • 正文 為了忘掉前任,我火速辦了婚禮峻汉,結(jié)果婚禮上箕母,老公的妹妹穿的比我還像新娘储藐。我一直安慰自己,他們只是感情好嘶是,可當(dāng)我...
    茶點故事閱讀 69,116評論 6 398
  • 文/花漫 我一把揭開白布钙勃。 她就那樣靜靜地躺著,像睡著了一般聂喇。 火紅的嫁衣襯著肌膚如雪辖源。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,713評論 1 312
  • 那天希太,我揣著相機(jī)與錄音克饶,去河邊找鬼。 笑死誊辉,一個胖子當(dāng)著我的面吹牛矾湃,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播堕澄,決...
    沈念sama閱讀 41,170評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼邀跃,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蛙紫?” 一聲冷哼從身側(cè)響起拍屑,我...
    開封第一講書人閱讀 40,116評論 0 277
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎坑傅,沒想到半個月后僵驰,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,651評論 1 320
  • 正文 獨居荒郊野嶺守林人離奇死亡唁毒,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,714評論 3 342
  • 正文 我和宋清朗相戀三年蒜茴,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片浆西。...
    茶點故事閱讀 40,865評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡粉私,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出室谚,到底是詐尸還是另有隱情毡鉴,我是刑警寧澤崔泵,帶...
    沈念sama閱讀 36,527評論 5 351
  • 正文 年R本政府宣布秒赤,位于F島的核電站,受9級特大地震影響憎瘸,放射性物質(zhì)發(fā)生泄漏入篮。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 42,211評論 3 336
  • 文/蒙蒙 一幌甘、第九天 我趴在偏房一處隱蔽的房頂上張望潮售。 院中可真熱鬧痊项,春花似錦、人聲如沸酥诽。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,699評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽肮帐。三九已至咖驮,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間训枢,已是汗流浹背托修。 一陣腳步聲響...
    開封第一講書人閱讀 33,814評論 1 274
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留恒界,地道東北人睦刃。 一個月前我還...
    沈念sama閱讀 49,299評論 3 379
  • 正文 我出身青樓,卻偏偏與公主長得像十酣,于是被迫代替她去往敵國和親涩拙。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,870評論 2 361

推薦閱讀更多精彩內(nèi)容