周圍那么多人都不再看好SEO了各聘,但是不知道怎么的寓娩,我就開始走到了SEO這條路上,權(quán)當(dāng)是一個學(xué)習(xí)筆記吧擎浴。把這些basic的知識掌握了员咽,至少不容易被形形色色的代理公司忽悠到吧。
這是第一篇基礎(chǔ)知識—搜索引擎的運作原理
講到SEO(Search Engine Optimization)搜索引擎優(yōu)化贮预,必定是基于自身網(wǎng)站針對搜索引擎的優(yōu)化過程贝室,因而首先需要搞清楚搜索引擎是怎么運作的。所謂知己知彼仿吞,方能做到有的放矢滑频,知其所以然吧。
搜索引擎主要做兩個工作:爬行各個網(wǎng)頁并建立索引唤冈,當(dāng)用戶搜索某個關(guān)鍵詞時以排名的方式將相關(guān)網(wǎng)頁呈現(xiàn)給用戶峡迷。簡言之就兩部分:一是爬行和索引,二提供答案你虹。
一爬行和索引
你可以把世界上千千萬萬的網(wǎng)頁想象成一個用鏈接連接的巨型蜘蛛網(wǎng)(這可能正是萬維網(wǎng)這個中文名字的意義所在)绘搞,搜索引擎的爬蟲(蜘蛛)就在這些網(wǎng)頁間以鏈接為路徑進(jìn)行爬行。當(dāng)然這個爬蟲不是一直在某個網(wǎng)頁上爬行傅物,每次的爬行會有一定的時間間隔夯辖,即爬行頻率。各個搜索引擎的爬行頻率是不同的董饰,這也會解釋為什么有的網(wǎng)頁被搜索引擎A收錄了蒿褂,但是搜索引擎B卻沒有收錄圆米,只是因為還沒有到爬蟲來的時間點而已,這是后話啄栓,此處還不展開娄帖。
一旦爬蟲爬行完某個頁面后搜索引擎會建立一個索引,將選中的某些數(shù)據(jù)存儲在數(shù)據(jù)庫中昙楚,以備將來提供答案時使用近速。想想看那么多的頁面信息要存儲,搜索引擎必定是需要有非常大的數(shù)據(jù)庫需求了桂肌,尤其是如果想短時間之內(nèi)(或許是<0.000000001秒之內(nèi))將結(jié)果呈現(xiàn)給搜索引擎的用戶数焊,那必定是同時要求在世界各地的部署相關(guān)的服務(wù)器的。
二提供答案
搜索引擎在提供答案時會做兩件事:一是將與搜索詞相關(guān)的網(wǎng)頁呈現(xiàn)到結(jié)果頁面崎场,二是對這些相關(guān)網(wǎng)頁進(jìn)行排序,主要依據(jù)就是網(wǎng)頁與搜索詞的相關(guān)性與網(wǎng)頁的受歡迎程度遂蛀。這兩個步驟就是一般在做SEO時需要盡力去影響的步驟谭跨。
所以很自然就會有個問題出來:搜索引擎決定網(wǎng)頁與搜索詞相關(guān)性和受歡迎程度的依據(jù)是什么?
很早之前李滴,搜索引擎主要依據(jù)網(wǎng)頁中包含眾多相關(guān)搜索詞螃宙。如今,相比形形色色的SEO作弊技術(shù)所坯,搜索引擎也逐步發(fā)展出幾百個決定相關(guān)性的因素谆扎。搜索引擎一般會把網(wǎng)頁受歡迎程度作為衡量相關(guān)度的一個重要指標(biāo)。從一定程度上來說芹助,這也是非程煤科學(xué)的衡量標(biāo)準(zhǔn),如果不受歡迎的話自然相關(guān)度也是低的状土。
說到這里就會引入我們聽了很久的算法了(Algorithms)无蜂。搜索引擎當(dāng)然不會簡單的手動決定網(wǎng)頁的相關(guān)性和受歡迎程度,所謂技術(shù)公司當(dāng)然是需要用復(fù)雜的算法來解決這個問題蒙谓,既彰顯高水平斥季,又在一定程度上避免了主觀判斷帶來的影響(甚至被訴訟,可以參見《傲骨賢妻》第4季第3集)累驮。這個算法真的是相當(dāng)復(fù)雜酣倾,而且我們無從得知具體公式,有一件事請肯定的是谤专,搜索引擎用網(wǎng)頁相關(guān)性決定頁面是否出現(xiàn)在搜索結(jié)果中躁锡,用受歡迎程度決定具體網(wǎng)頁在搜索結(jié)果中的排名。
接下來希望有機會了解一下主要的索引與排名的影響因素毒租。