搜索引擎工作原理簡介
搜索引擎工作過程大體上可以分為三個階段:
爬行抓取--預(yù)處理--排名
1.爬行和抓取
1.1蜘蛛
搜索引擎用來爬行和抓取的程序稱為蜘蛛
搜索引擎蜘蛛訪問網(wǎng)站頁面時類似于普通用戶使用瀏覽器。蜘蛛程序發(fā)出頁面訪問請求后焦人,服務(wù)器返回HTML代碼,蜘蛛程序把收到的代碼存入原始頁面數(shù)據(jù)庫腿短。
1.2跟蹤鏈接
為了抓取網(wǎng)上盡量多的頁面,搜索引擎蜘蛛會跟蹤頁面上的鏈接腰鬼,從一個頁面爬行到另一個頁面蛹磺。
最簡單的爬行遍歷策略分為兩種:一是深度優(yōu)化 二是廣度優(yōu)化
1.3如何吸引蜘蛛
網(wǎng)站和頁面權(quán)重高
頁面更新
導(dǎo)入鏈接