關于‘詞庫應用’的很多細節(jié)都有些模糊,google下也沒找出靠譜的資料岸军,全是各種挖詞的......索性不如定期總結完善下,最終形成自己的方法論瓦侮。
根據以往實際數據總結艰赞,大部分網站產生流量的關鍵詞60%-70%都是有規(guī)律可循的《抢簦基本都是由‘N個同屬性關鍵詞的集合’和‘N個詞綴’組成方妖。對于內容偏垂直的站來說,把這種詞生成一個個頁面相對容易些罚攀。
如果網站有相關的內容党觅,并且數據表的字段跟詞庫中關鍵詞的屬性能夠直接關聯上,直接調用就行斋泄,若是這些屬性在多個數據表中id還都一樣杯瞻,那生成頁面的內容就更加豐富,但畢竟是理想狀態(tài)是己,大部分都要靠搜索結果生成頁面又兵。
以下是剛整理出來的8萬多職位詞庫,挑出一部分瞅一下:
如上所說卒废,50%-70%的流量詞都是有規(guī)律可循沛厨,以職位詞為例,可以看出是由‘{工作}+{職稱}’組成摔认。
一個'工作'能匹配多個‘職稱'逆皮,反之一個‘職稱’也能匹配多個'工作':
要保險點的話應該有個關鍵詞標準化的過程,因為同屬性同變量的多個詞挑出幾個搜索量高的導入詞庫参袱,因為很多詞說的都是一碼事电谣,如:“10086熱線客服”、“10086接線客服”抹蚀、“10086在線客服”剿牺,反正我感覺都一樣,都是接電話被人罵的环壤。
為了能夠最大化的命中用戶查詢晒来,原則上說,只要頁面大部分內容不一樣郑现,并且有一定內容數量湃崩,就可以生成頁面,這就得遍歷每個詞的搜索結果數量接箫。
但有不少站站內搜索做的并不算理想攒读,很多情況下數量不少但搜出來的內容與查詢詞本身沒多大關聯,所以需要對關鍵詞在站內搜出來的結果設定一個指標辛友,滿足指標的才導入詞庫薄扁。
對招聘行業(yè),職位詞中的‘工作’變量權值比‘職稱’高得多废累,搜‘seo專員’出來‘seo經理’的內容沒多大影響邓梅,但出來‘sem專員’那就很坑爹了
所以需要把‘職稱’提取出來,’職位詞‘刪除提取出來的’職稱‘后做’工作詞‘九默,假設一個頁面能夠展現10條搜索結果震放,當搜索結果中’工作詞‘出現5次以上且包含相同’工作詞‘的多個’職位詞‘的重復搜索結果少于5條的,則可以導入詞庫驼修。