本章主要介紹SEO優(yōu)化工作中,在增加收錄技術(shù)方面需要了解的工作单刁。
本文版權(quán)由“ 北朔潛龍 ”所有灸异,僅供學(xué)習(xí)使用,請(qǐng)勿轉(zhuǎn)載或用于商業(yè)用途羔飞。
九肺樟、增加收錄
? 1、影響收錄的因素
? ? ? 如果你的網(wǎng)站沒(méi)有被收錄逻淌,請(qǐng)檢查你的內(nèi)容質(zhì)量與爬蟲(chóng)抓取量
? 2么伯、爬蟲(chóng)抓取方式
? ? ? 搜索引擎爬蟲(chóng)抓取方式
? 3、模仿
? ? ? (httrack 網(wǎng)站鏡像工具“整站下載器”)http://www.httrack.com/英文卡儒;下載-安裝(中文版本)
? 4田柔、收錄原理
? ? ? 過(guò)程:robots.txt—首頁(yè)—欄目頁(yè)—CSS/JS—內(nèi)容頁(yè)
? 5、爬蟲(chóng)內(nèi)部因素
? ? ? ?A)爬蟲(chóng)內(nèi)部因素
? ? ? ? ? ?1.網(wǎng)站速度影響爬蟲(chóng)訪(fǎng)問(wèn)
? ? ? ? ? ? ? 機(jī)房—DNS服務(wù)器—CDN—出口寬帶—硬件—操作系統(tǒng)—服務(wù)器—軟件—程序
? ? ? ? ? ?2.nofollow標(biāo)簽的使用控制爬蟲(chóng)抓取
? ? ? ? ? ? ? Nofollow是指不追蹤此鏈接
? ? ? ? ? ? ? Nofollow掉每個(gè)頁(yè)面重復(fù)出現(xiàn)的鏈接和對(duì)SEO無(wú)價(jià)值的頁(yè)面骨望,減少爬蟲(chóng)重復(fù)抓取每個(gè)頁(yè)面內(nèi)的鏈接硬爆,提高爬蟲(chóng)抓取效率增強(qiáng)對(duì)重復(fù)頁(yè)面的抓取。
? ? ? ? ? ? ? 使用方法:rel=“nofollow”舉例“京東商城”使用火狐瀏覽器插件“Highfight nofollow links”查看
? ? ? ? ? 3.其他影響爬蟲(chóng)抓取的因素
? ? ? ? ? ? ?防火墻規(guī)則擎鸠,防攻擊設(shè)計(jì)缀磕,防止采集設(shè)置規(guī)則;一個(gè)網(wǎng)站訪(fǎng)問(wèn)N次后,自動(dòng)斷開(kāi)袜蚕,爬蟲(chóng)被拒糟把。
? ? ? ? ? ? ?分隔硬盤(pán):在服務(wù)器下安裝多個(gè)虛擬機(jī),硬盤(pán)轉(zhuǎn)速慢牲剃,爬蟲(chóng)訪(fǎng)問(wèn)不到網(wǎng)頁(yè)遣疯,多個(gè)返回碼;一個(gè)鏈接返回多個(gè)返回碼颠黎,搜索引擎是不會(huì)抓取的另锋。
? 6、爬蟲(chóng)外部因素
? ? ? ?A)外部鏈接
? ? ? ? ? ?外鏈的作用有兩個(gè)狭归,一個(gè)是吸引爬蟲(chóng)來(lái)抓取夭坪,另一個(gè)是提升排名,相關(guān)性过椎、流通性室梅、廣泛性(給每個(gè)網(wǎng)頁(yè)加外鏈,不要全部指向首頁(yè))
? ? ? B)文章
? ? ? ? ? ?文章的原創(chuàng)度疚宇,更新頻率及獨(dú)特性亡鼠,原創(chuàng)文章一定收錄,只是時(shí)間問(wèn)題敷待。
? ? ? C)權(quán)重
? ? ? ? ? ?權(quán)重是指搜索引擎對(duì)你的網(wǎng)站的信任程度间涵,權(quán)重高的網(wǎng)站爬蟲(chóng)數(shù)量多,抓取及時(shí)榜揖,權(quán)重高的網(wǎng)站有爬蟲(chóng)長(zhǎng)期“隱居”勾哩。
? ? ? D)網(wǎng)站地圖
? ? ? ? ? 網(wǎng)站地圖促進(jìn)爬蟲(chóng)抓取,是增進(jìn)收錄的重要因素
? ? ? E)PR值
? ? ? ? ? PR值是谷歌對(duì)于網(wǎng)站質(zhì)量的衡量標(biāo)準(zhǔn)举哟,但是PR對(duì)SEO的作用非常小思劳,有些參考價(jià)值,但是意義并不是很大妨猩。
? 7潜叛、爬蟲(chóng)外部因素
? ? ? A)爬蟲(chóng)抓取頁(yè)面的過(guò)程中是可以看到網(wǎng)頁(yè)URL、Html代碼 和 head信息
? ? ? B)URL規(guī)范化
? ? ? ? ? 1.靜態(tài)化壶硅、唯一化
? ? ? ? ? ? ?http://www.seojiaoxue.com/?P=9
? ? ? ? ? ? ?http://www.seojiaoxue.com/9.html
? ? ? ? ? ? 網(wǎng)站中同一網(wǎng)頁(yè)威兜,只對(duì)應(yīng)一個(gè)URL
? ? ? ? ? ? 1.1如果網(wǎng)站上多重URL都能訪(fǎng)問(wèn)同樣的內(nèi)容,會(huì)有如下危險(xiǎn)
? ? ? ? ? ? 1.1.1搜索引擎會(huì)選一種標(biāo)準(zhǔn)庐椒,可能會(huì)與正版不同
? ? ? ? ? ? 1.1.2用戶(hù)可能為同一網(wǎng)頁(yè)的不同URL推薦牡属,多重URL形式分散了該網(wǎng)頁(yè)的權(quán)重
? ? ? ? ? ? 1.2如果你的網(wǎng)站上已存在多重URL形式,建議按以下方式處理
? ? ? ? ? ? 1.2.1在系統(tǒng)中只使用正常形式的URL扼睬,不讓用戶(hù)接觸到非正常形式的URL
? ? ? ? ? ? 1.2.2不把session ID統(tǒng)計(jì)代碼等不必要的內(nèi)容放到URL中
? ? ? ? ? ? 1.2.3不同形式的URL:301永久跳轉(zhuǎn)正常形式
? ? ? ? ? ? 1.2.4防止用戶(hù)輸錯(cuò)啟用備用域名,301永久跳轉(zhuǎn)到主域名
? ? ? ? ? ? 1.2.5使用robots.txt禁止baiduspider抓取不想向用戶(hù)展示的形式
? 2.URL中帶有拼音/英文在排名上有優(yōu)勢(shì)
? ? ? C)W3C標(biāo)準(zhǔn)
? ? ? ? ? ? Html代碼符合標(biāo)準(zhǔn),結(jié)構(gòu)層窗宇、表現(xiàn)層措伐、行為層標(biāo)簽的完整性,用開(kāi)源程序就好了军俊。
? ? ? D)Heal信息的正確性(服務(wù)器)
? ? ? ? ? ?抓包工具h(yuǎn)ttpwatck(下載侥加、安裝、使用)
? ? ? D)Accept
? ? ? ? ? 指不能夠接受返回?cái)?shù)據(jù)的規(guī)范*/*表示所有
? ? ? ? ? Accept-language ??????????zh-cn
? ? ? ? ? 表示能夠接受的返回?cái)?shù)據(jù)語(yǔ)言
? ? ? ? ? ?Accept-encoding ??????????gzip.deflate
? ? ? ? ? ?Accept-encoding表明了瀏覽器可接受的除了純文本之外的內(nèi)容編碼的類(lèi)型粪躬,比如zip壓縮文件的壓縮內(nèi)容
? ? ? ? ? Last-modified ????fri ????04 ??????jan 2008 ??????01:01:00 ?????gmt
? ? ? ? ? 指定被請(qǐng)求資源上次被修改的日期和時(shí)間節(jié)省寬帶担败,減少重復(fù)抓取
? ? ? ? ? Server ??????????Apache
? ? ? ? ? 一種標(biāo)明WEB服務(wù)器軟件及其版本號(hào)的頭標(biāo)
? ? ? ? ? Content-length
? ? ? ? ? 內(nèi)容長(zhǎng)度通過(guò)文字長(zhǎng)度判斷是否更新過(guò)但是不準(zhǔn),如果文字一樣就無(wú)法判斷了
? ? ? E)內(nèi)容與收錄
? ? ? ? ? ?1.原創(chuàng)性
? ? ? ? ? ?1.1原創(chuàng)文章一定會(huì)收錄镰官,但只是時(shí)間問(wèn)題
? ? ? ? ? ?1.2原創(chuàng)性是影響網(wǎng)站權(quán)重的很重要的因素提前,其他因素沒(méi)有原創(chuàng)性重要
? ? ? ? ? ?1.3原創(chuàng)影響權(quán)重,權(quán)重影響收錄泳唠,收錄影響排名狈网,排名影響流量
? ? ? ? ? ? 2.重復(fù)性
? ? ? ? ? ? 2.1轉(zhuǎn)載或采集的頁(yè)面內(nèi)容和之前頁(yè)面都一樣,URL不統(tǒng)一也是重復(fù)笨腥,網(wǎng)頁(yè)的相似度高就算重復(fù)頁(yè)面拓哺,頁(yè)面重復(fù)SEO負(fù)頁(yè)面。
? ? ? ? ? ? 2.2重復(fù)頁(yè)面與總頁(yè)面比例要低于30%脖母,網(wǎng)站大量重復(fù)會(huì)被懲罰士鸥,避免重復(fù)的方法。
? ? ? ? ? ? 2.2.1在網(wǎng)站的正文部分多調(diào)用些隨機(jī)調(diào)用增加文章內(nèi)容
? ? ? ? ? ? 2.2.2URL唯一化谆级,解決重復(fù)性最高境界就是原創(chuàng)
? ? ? ? ? ? 3.排名模型
? ? ? ? ? ? 3.1真有排名秘籍嗎烤礁?有多少人知道搜索引擎算法?
? ? ? ? ? ? 3.1.1沒(méi)有秘籍哨苛,沒(méi)有人知道全部的算法鸽凶,工程師,SE給客戶(hù)最好的搜索結(jié)果建峭,給用戶(hù)最好的價(jià)值玻侥,搜索引擎給我們排名,流量是被搜索引擎給我們的數(shù)據(jù)和SEO經(jīng)驗(yàn)亿蒸,總結(jié)出了SEO排名模版凑兰。
? ? ? ? ? ? 4.定義
? ? ? ? ? ? 4.1基于對(duì)搜索引擎的排名特種和算法一集SEO經(jīng)驗(yàn)分析得出一個(gè)排名的原理,這個(gè)原理就是SEO模型
? ? ? ? ? ?4.2操作
? ? ? ? ? ?4.2.1網(wǎng)站結(jié)構(gòu)符合:內(nèi)容也的相關(guān)推薦板塊
? ? ? ? ? ?4.2.2內(nèi)鏈和外鏈
? ? ? ? ? ?4.2.3其他:SEO頻道和錨文本等
? ? ? ? ? ?5.注意
? ? ? ? ? ?5.1網(wǎng)頁(yè)都是相關(guān)性的(信任投票)注意質(zhì)量
? ? ? ? ? ?5.2相關(guān)網(wǎng)頁(yè)數(shù)量很多