搜索引擎有兩個主要功能:爬取和建立索引鸟召,并為用戶提供他們所想要的相關(guān)的網(wǎng)站排名列表蚁袭。
1.爬取并索引
想象一下互聯(lián)網(wǎng)是大城市中的地鐵網(wǎng)絡(luò)黎炉,每一站都是一個唯一的文檔(通常是網(wǎng)頁免姿,有時也是PDF魏宽、JPG或者其他文件)熔恢。搜索引擎需要一種“爬取”整個城市的方法固蚤,并在路上找到所有的站點直到前方?jīng)]有站點汽纤,因此它們使用最優(yōu)的路徑——鏈接删性。
網(wǎng)站的鏈接結(jié)構(gòu)就用來將所有的頁面綁定在一起庆械。鏈接讓搜索引擎的機(jī)器人(常被成為“爬蟲”或者“蜘蛛”)可以訪問到互聯(lián)網(wǎng)上的數(shù)十億個網(wǎng)頁或者其他文檔文件津肛。
一旦搜索引擎找到這些頁面葫辐,它們就抓取提到頁面的代碼搜锰,并且將指定的部分存入海量的數(shù)據(jù)庫中,當(dāng)用戶在搜索的時候在數(shù)據(jù)庫中查詢出結(jié)果并將結(jié)果返回給用戶耿战。要完成將數(shù)據(jù)庫中數(shù)十億的網(wǎng)頁在數(shù)十毫秒內(nèi)將結(jié)果返回是一件非常艱難的任務(wù)蛋叼,各大搜索引擎公司在世界各地都建立了數(shù)據(jù)中心。
這些龐大的存儲設(shè)備使成千上萬的機(jī)器能夠很快的處理大量信息剂陡。當(dāng)用戶在任何一個搜索引擎上進(jìn)行搜索時狈涮,它們能夠立即返回結(jié)果。即使等上一兩秒返回結(jié)果鹏倘,也會讓用戶反感薯嗤,因此搜索引擎必須很快,以盡可能快的速度提供結(jié)果纤泵。
2.相關(guān)性和受歡迎度排序
搜索引擎就像是一個回答問題的機(jī)器骆姐,當(dāng)用戶做搜索的時候,搜索引擎對數(shù)據(jù)庫做了兩件事情:第一捏题,查詢那些相關(guān)的結(jié)果玻褪;第二,排名的順序根據(jù)網(wǎng)頁的受歡迎程度公荧。SEO的過程就是提升頁面的受歡迎程度带射。
那么搜索引擎如何確定這些相關(guān)的頁面的受歡迎程度呢?
對于搜索引擎來說循狰,相關(guān)性來說不僅意味著用正確的詞找到一個頁面窟社。在互聯(lián)網(wǎng)的早期,搜索引擎并沒有比這個簡單的步驟更進(jìn)一步绪钥,搜索結(jié)果的價值很有限灿里。隨著技術(shù)的不斷發(fā)展,聰明的工程師們設(shè)計了更好的方法來匹配搜索結(jié)果程腹。今天可能會有數(shù)百種因素影響著頁面的相關(guān)性匣吊。我們將在今后不斷的告訴大家哪些是重要的因素。
搜索引擎通常認(rèn)為網(wǎng)站、頁面或者文檔越受歡迎色鸳,其所包含的信息就越富有價值社痛。這個假設(shè)在用戶對搜索結(jié)果的滿意度方面已經(jīng)非常成功了。
受歡迎度和相關(guān)性并不是人手工操作的命雀。相反蒜哀,搜索引擎采用數(shù)學(xué)公式(算法)從分析頁面的相關(guān)性,然后按照頁面的受歡迎度來排序咏雌。
這些算法通常包含數(shù)百個變量凡怎,在搜索引擎營銷領(lǐng)域,我們稱之為“排名因素”赊抖。
最后我們來總結(jié)下搜索引擎的工作流程统倒,首先搜索引擎爬取互聯(lián)網(wǎng)中的所有頁面并建立索引,然后更加頁面的相關(guān)性和受歡迎程度來進(jìn)行排序氛雪,當(dāng)用用戶搜索時將最優(yōu)的結(jié)果返回房匆。
本文結(jié)束;
下面為廣告部分:
(文章首發(fā)地址:沈陽依森科技 官網(wǎng)报亩,之后會同步到各大的媒體平臺浴鸿,希望我們的文章能夠?qū)Υ蠹矣兴鶐椭#?/p>