原文出處我的公號(hào):運(yùn)營(yíng)黑客舔哪。
你需要建立有效頁面數(shù)據(jù)庫
之前寫過一篇文章《談點(diǎn) SEO》
關(guān)于 SEO 運(yùn)營(yíng)觀欢顷,我簡(jiǎn)明提到,好的 SEO 工作開展捉蚤,是需要從「需求形成產(chǎn)品」再到「流量獲取及轉(zhuǎn)化」貫穿始終的抬驴。文中有這么一段話:
SEO 運(yùn)營(yíng)觀(傳遞價(jià)值,變現(xiàn)產(chǎn)品)
SEO運(yùn)營(yíng)公式:有效查詢覆蓋 × 有效抓取 × 有效收錄 × 展現(xiàn) × 點(diǎn)擊 × 轉(zhuǎn)化
「有效」界定了目標(biāo)性缆巧,尤其需要對(duì)查詢布持、抓取、收錄做界定陕悬。
一個(gè)公式的成立题暖,常識(shí)是默認(rèn)為任何一個(gè)環(huán)節(jié)都是有效。我之所以在「查詢覆蓋」捉超、「抓取」芙委、「收錄」前面特意加上了「有效」二字。是這三個(gè)環(huán)節(jié)是絕大多數(shù) SEOer 常識(shí)盲區(qū)狂秦。談查詢覆蓋灌侣、抓取、收錄裂问,往往理所當(dāng)然地認(rèn)為是在不加以有效與無效區(qū)分得談總量侧啼。于是,把查詢覆蓋搞得多多的堪簿,把抓取搞得多多的痊乾,把收錄搞的多多的,是用功所在椭更。
這種不對(duì)有效無效做區(qū)分帶來的影響是惡劣的哪审。如同二八定律,一個(gè)網(wǎng)站的有效頁面占據(jù)整個(gè)網(wǎng)站可能的頁面虑瀑,可能只有 20%湿滓,甚至更少。這個(gè)數(shù)據(jù)我沒有做測(cè)量舌狗,但意思很清楚叽奥,大部分頁面是屬于無效頁面的。如果都不加以區(qū)分地去做功課痛侍,那么這些功課可能有 80% 是無效的朝氓。
80% 的無效抓取,無效用功!80% 的無效收錄赵哲,無效用功待德!這只是對(duì)搜索引擎資源的浪費(fèi)。更不好的是枫夺,你的工作對(duì)象 80% 是無效的将宪。
如果網(wǎng)站頁面數(shù)量不超過 1000 個(gè),或者網(wǎng)站結(jié)構(gòu)很簡(jiǎn)單筷屡,就算 80% 的無效涧偷,也浪費(fèi)不了多少時(shí)間與精力簸喂。這不是說小網(wǎng)站不需要做有效與無效區(qū)分毙死,只是做了區(qū)分,帶來好處相對(duì)于中大型站點(diǎn)不那么明顯而已喻鳄。
網(wǎng)站上了一定量級(jí),比如上萬;或者典型頁面較多讼撒,比如超過 10 個(gè)轧坎,這時(shí)候就需要考慮一個(gè)建立有效頁面數(shù)據(jù)庫了。(注:本文不談及有效查詢數(shù)據(jù)庫建立)
建立有效頁面數(shù)據(jù)庫目的
SEO 處理對(duì)象更加清晰明確颜曾,有的放矢纠拔,盡可能規(guī)避無效功課。
有效頁面數(shù)據(jù)庫泛豪,你只需要關(guān)注有效頁面的抓取情況稠诲,有效頁面的收錄情況。你要做的都是針對(duì)有效頁面做頁面增長(zhǎng)诡曙、頁面改進(jìn)臀叙。不屬于有效的頁面的抓取、收錄价卤,都是你要摒棄的劝萤。
搜索引擎分配給你網(wǎng)站的抓取量是相對(duì)恒量的。從常識(shí)出發(fā)慎璧,很容易就理解到建立有效頁面數(shù)據(jù)庫的意義床嫌。
另外,有效頁面數(shù)據(jù)庫的建立胸私,對(duì)新人快速熟悉上手有很好的幫助既鞠,也是團(tuán)隊(duì)良好協(xié)作的一個(gè)基礎(chǔ)。這種好處盖文,在大型網(wǎng)站表現(xiàn)的尤為突出嘱蛋。
有效頁面的定義
定義:有效頁面就是有收錄價(jià)值的頁面。
定義標(biāo)準(zhǔn)
- 有(強(qiáng))排名價(jià)值的。一個(gè)頁面可以過排名獲取流量洒敏,就必然有收錄價(jià)值龄恋。也就是說排名價(jià)值是判定其是否有收錄價(jià)值的充分條件。
典型類型有:網(wǎng)站首頁凶伙、專題頁郭毕、列表頁、詳情頁等函荣。
如:http://www.mafengwo.cn/travel-scenic-spot/mafengwo/10067.html - 無(弱)排名價(jià)值显押,但可以幫助搜索引擎直接或間接抓取其他排名價(jià)值頁面。關(guān)鍵特征:頁面上有大量指向其他頁面的鏈接傻挂,但自身沒有顯著的排名意圖乘碑。
典型類型有:列表頁、索引頁金拒,欄目頁等兽肤。
如:http://www.mafengwo.cn/mdd/ - 無(弱)排名價(jià)值,但可以提升整站權(quán)重绪抛。這類頁面常見于海量文章頁资铡、貼子等。通過 UGC 創(chuàng)造的頁面大多數(shù)可以歸為此類幢码。不過笤休,這些海量的頁面,除了可以極大提高整站權(quán)重症副,其整體排名價(jià)值又往往超過了網(wǎng)站其他所有有效頁面店雅。這是非常有意思的現(xiàn)象。頁面數(shù)量越多的網(wǎng)站瓦糕,這個(gè)表現(xiàn)越明顯——很多你壓根想不到的詞底洗,這些詞大部分只被檢索過一次,帶來的流量超過了整體的一半咕娄。
典型的類型有:詳情頁亥揖。
如:http://www.mafengwo.cn/i/7127948.html
建立有效頁面數(shù)據(jù)庫的流程
關(guān)于有效頁面數(shù)據(jù)庫搭建流程,可以單獨(dú)寫一篇比較長(zhǎng)的文章圣勒。這里做框架性闡述费变。
1 . 確立有效頁面規(guī)則
主體、意圖圣贸、屬性A(可能還有 B挚歧、C、D等)吁峻、記錄A(可能還有 B滑负、C在张、D等)、頁面類型以及 URL矮慕。
仍然拿螞蜂窩的頁面舉例:
http://www.mafengwo.cn/travel-scenic-spot/mafengwo/10067.html
大概可以設(shè)計(jì)下面這個(gè)樣子帮匾。
主體 | 意圖 | 屬性 | 記錄 | URL |
---|---|---|---|---|
目的地 | 攻略 | 國(guó)家 | 菲律賓 | http://www.mafengwo.cn/travel-scenic-spot/mafengwo/10067.html |
拿到一個(gè)有效頁面規(guī)則,其他目的地國(guó)家都同理得到痴鳄。
2 . 拿到字典表
頁面各個(gè)字段參數(shù)與記錄對(duì)應(yīng)關(guān)系構(gòu)成了字典表瘟斜。
大概可以設(shè)計(jì)下面這個(gè)樣子。
主體 | 意圖 | 屬性 | 記錄 | 參數(shù) |
---|---|---|---|---|
目的地 | 攻略 | 國(guó)家 | 菲律賓 | 10067 |
注意:最好加上主體痪寻、意圖螺句、屬性這三個(gè)字段。隨著網(wǎng)站結(jié)構(gòu)復(fù)雜橡类,記錄上完全一樣的詞蛇尚,對(duì)應(yīng)的參數(shù)很可能不一樣。所以需要加上主體猫态、意圖佣蓉、屬性來加以細(xì)分披摄。
3 . 組合「有效頁面」
接下來亲雪,我們要拿到有效頁面了。
有效頁面有三種:
- 應(yīng)當(dāng)有效頁面疚膊。與查詢覆蓋完全匹配的理想頁面义辕,也是我們最終想要拿到的。實(shí)際操作中寓盗,無法一蹴而就得到灌砖。
- 組合有效頁面。通過字典結(jié)合規(guī)則組合得到傀蚌。應(yīng)當(dāng)有效頁面和現(xiàn)存有效頁面都是其子集基显。但是組合有效頁面往往會(huì)出現(xiàn)一個(gè)問題,由于規(guī)則很難以過于精細(xì)善炫,組合出來的會(huì)產(chǎn)生超出查詢覆蓋邊界撩幽。
- 現(xiàn)存有效頁面。網(wǎng)站數(shù)據(jù)庫現(xiàn)有的有效頁面箩艺。這部分頁面有兩個(gè)的局限性表現(xiàn)窜醉。
- 可能各種各樣的原因,比如由于數(shù)據(jù)不全艺谆,會(huì)導(dǎo)致現(xiàn)存有效頁面往往小于應(yīng)當(dāng)有效頁面榨惰。
- 這部分有效頁面是遵循組合規(guī)則生成,也會(huì)出現(xiàn)現(xiàn)存有效頁面超出應(yīng)當(dāng)有效頁面的情況静汤。
三者關(guān)系見下圖:
拿到最終的應(yīng)當(dāng)有效頁面琅催,需要建立在組合有效頁面和現(xiàn)存有效頁面的基礎(chǔ)上居凶。
- 通過規(guī)則和字典,拿到組合有效頁面藤抡。
- 采集或從數(shù)據(jù)庫拿到現(xiàn)存有效頁面排监。
- 結(jié)合組合有效頁面、現(xiàn)存有效頁面以及內(nèi)容數(shù)據(jù)杰捂,補(bǔ)全現(xiàn)存頁面缺少部分舆床,剔除現(xiàn)存頁面超出部分。
有效頁面數(shù)據(jù)庫的應(yīng)用
前面說過嫁佳,最終是要拿到應(yīng)當(dāng)有效頁面數(shù)據(jù)挨队。但從動(dòng)態(tài)的角度來看,應(yīng)當(dāng)有效頁面數(shù)據(jù)是沒有最終靜止形態(tài)蒿往。因此盛垦,有效頁面數(shù)據(jù)的應(yīng)用,除了是為了不斷逼近應(yīng)當(dāng)有效頁面瓤漏,更多的是在逼近過程中的應(yīng)用腾夯。
拿到有效頁面數(shù)據(jù),大家可以盡情的發(fā)揮自己的想象力蔬充,怎么用得效率高蝶俱,怎么用得爽,就怎么來饥漫。只要在整個(gè) SEO 運(yùn)營(yíng)公式的框架下榨呆,結(jié)合實(shí)際情況,可以通過各種各樣的方式利用起來庸队。
在主體积蜻、意圖、屬性彻消、記錄竿拆、URL 的基礎(chǔ)上,繼續(xù)增加想要關(guān)注的字段宾尚。比如 Title丙笋、H1、狀態(tài)碼央勒、關(guān)鍵詞不见、收錄等。
應(yīng)用主要有三個(gè)方面
- 記錄
有的放矢地記錄崔步,每個(gè)版本都可以往回查找稳吮。記錄是復(fù)盤的前提。 - 監(jiān)測(cè)
盡早發(fā)現(xiàn)變化井濒,如內(nèi)容的修改灶似,收錄排名變動(dòng)等列林。 - 優(yōu)化
結(jié)合記錄和監(jiān)測(cè),可以預(yù)知趨勢(shì)酪惭,可以總結(jié)操作得失希痴。基于未來和過去春感,才能做出合理的優(yōu)化判斷砌创。
舉個(gè)監(jiān)測(cè)規(guī)避風(fēng)險(xiǎn)的場(chǎng)景
大中型網(wǎng)站,由于其復(fù)雜性以及數(shù)據(jù)量大鲫懒,一些對(duì) SEO 影響不好的操作嫩实,往往會(huì)等等實(shí)質(zhì)性結(jié)果出來了,才后知后覺窥岩。
比如程序的一個(gè)小操作甲献,導(dǎo)致了某類頁面的 Title 變了個(gè)樣,H1 標(biāo)簽丟失等等颂翼』稳鳎看到這里,真讓人有點(diǎn)怕怕朦乏。
如果某類頁面狀態(tài)碼都變成了 404球及,看到這里,已經(jīng)恐怖如斯了集歇,這 SEO 工作真心沒法搞了桶略。
所以需要一些監(jiān)測(cè)機(jī)制來預(yù)防和提前發(fā)現(xiàn)语淘。前面說到的添加更多需要關(guān)注的字段诲宇,就是形成機(jī)制的若干要點(diǎn)。
最后惶翻,無有效頁面數(shù)據(jù)姑蓝,不優(yōu)化。人話就是吕粗,甭做了纺荧,浪費(fèi)感情。