百度索引量是每個(gè)站長(zhǎng)都很關(guān)注的數(shù)據(jù),索引量的多少以為這參與百度網(wǎng)頁(yè)排名數(shù)據(jù)量的多少荆几。()今天早上在百度站長(zhǎng)平臺(tái)查看了一下索引數(shù)據(jù),令我大吃一驚,索引量在一夜之間減少了588棒呛,由之前的1187變成了599。當(dāng)然域携,在這個(gè)過(guò)程中簇秒,我在數(shù)據(jù)統(tǒng)計(jì)后臺(tái)看到的百度來(lái)路流量并沒(méi)有減少的跡象。按照百度官方的說(shuō)法秀鞭,這種情況站長(zhǎng)不用太在意趋观。
在向下探討之前,先來(lái)看幾個(gè)基礎(chǔ)知識(shí)锋边。
百度索引量是什么?百度的索引量是百度蜘蛛抓取網(wǎng)站的頁(yè)面數(shù);
百度索引量和收錄量的區(qū)別?百度索引是百度蜘蛛抓取網(wǎng)頁(yè)內(nèi)容建立的搜索候選頁(yè)面皱坛,這些候選頁(yè)面是未來(lái)增加網(wǎng)站收錄和更新網(wǎng)站頁(yè)面快照必須要有的。百度索引量在百度站長(zhǎng)平臺(tái)后臺(tái)查詢(xún)豆巨,收錄量直接使用site:(域名)
為什么索引量會(huì)大幅度下滑剩辟,這個(gè)問(wèn)題朱海濤并不專(zhuān)業(yè)。看過(guò)站長(zhǎng)社區(qū)版主老呂的一篇文章贩猎,分析的相當(dāng)詳細(xì)熊户。對(duì)比了下,唯一的可能性就是robots.txt文件吭服。前幾天我在robots.txt文件總增加了一句"Disallow: /*?*"嚷堡,禁止收錄一切包含問(wèn)號(hào)的鏈接,來(lái)屏蔽動(dòng)態(tài)鏈接艇棕。
除此之外蝌戒,空間服務(wù)商還在.htaccess文件中增加一句代碼 "deny from 220.181.158.218".空間上設(shè)置這句代碼是防止網(wǎng)站惡意流量的。我查詢(xún)了下沼琉,這個(gè)ip地址對(duì)應(yīng)有可能是百度蜘蛛北苟,不知道空間商在幫助我屏蔽惡意訪(fǎng)問(wèn)流量的時(shí)候是否有考慮到這方面的因素。
不管怎樣打瘪,保險(xiǎn)起見(jiàn)粹淋,還是需要去站長(zhǎng)反饋中心去反饋下問(wèn)題。站長(zhǎng)反饋的時(shí)候注意描述清楚瑟慈,并且截圖說(shuō)明問(wèn)題桃移。百度站長(zhǎng)平臺(tái)申訴反饋地址: http://zhanzhang.baidu.com/feedback
下面是百度站長(zhǎng)平臺(tái)社區(qū)版主老呂的文章,詳細(xì)說(shuō)明了索引量為什么會(huì)下降的原因葛碧,并且給出了解決方法借杰,值得每個(gè)站長(zhǎng)認(rèn)真的閱讀一遍。
索引量是流量的基礎(chǔ)进泼,索引量數(shù)據(jù)的每一個(gè)變動(dòng)都撥動(dòng)著站長(zhǎng)敏感的神經(jīng)蔗衡,“索引量下降之后該如何著手分析”一直是各位討論的熱門(mén)話(huà)題。這次站長(zhǎng)社區(qū)版主老呂又拔刀相助了乳绕,看看史上最全的百度索引量下降原因分析及解決方案吧
一绞惦、百度索引下降分析簡(jiǎn)圖
二、導(dǎo)致百度索引量下降的常見(jiàn)原因——網(wǎng)站方原因
1洋措、內(nèi)容數(shù)據(jù)所在的網(wǎng)址url未規(guī)范統(tǒng)一
【自己站點(diǎn)url規(guī)范統(tǒng)一】
多域名都可以200狀態(tài)正常訪(fǎng)問(wèn)網(wǎng)頁(yè)內(nèi)容;一域名下出現(xiàn)多種url形式可以訪(fǎng)問(wèn)相同內(nèi)容济蝉,如大小寫(xiě)url、url規(guī)則變更等菠发。
解決:選擇主域名(或主url)王滤,其他域名下的所有url都301重定向到主域名(或主url),并站長(zhǎng)工具提交域名改版(或目錄url改版)
【外部平臺(tái)使用己站數(shù)據(jù)】
A滓鸠、市場(chǎng)合作雁乡,站點(diǎn)數(shù)據(jù)調(diào)用到其他平臺(tái)上;內(nèi)容主動(dòng)外發(fā),推廣人員完整轉(zhuǎn)發(fā)自有內(nèi)容到高質(zhì)量平臺(tái)——這兩個(gè)原因都有可能導(dǎo)致搜索引擎收錄了外部平臺(tái)的內(nèi)容而拒絕了原網(wǎng)站內(nèi)容
解決:使用站長(zhǎng)平臺(tái)鏈接提交工具的主動(dòng)推送功能糜俗,及時(shí)提交網(wǎng)站新出現(xiàn)的鏈接踱稍,延遲將內(nèi)容調(diào)用到其他平臺(tái)的時(shí)間;
B曲饱、被鏡像,用戶(hù)通過(guò)其他舉辦主體的域名或url直接可訪(fǎng)問(wèn)己方內(nèi)容珠月。
解決:關(guān)注域名解析安全和服務(wù)器安全;綁定唯一可解析的域名或唯一可訪(fǎng)問(wèn)的url;頁(yè)面內(nèi)容中鏈接使用絕對(duì)地址
2扩淀、站點(diǎn)受青睞度下降
【網(wǎng)頁(yè)內(nèi)容相關(guān)】
A、內(nèi)容質(zhì)量度下降
解決:提高內(nèi)容質(zhì)量度桥温,詳見(jiàn)百度站長(zhǎng)學(xué)院相關(guān)內(nèi)容;杜絕簡(jiǎn)單拷貝引矩,多做整合信息梁丘。
B侵浸、更新量及頻率下降
解決:穩(wěn)定的更新頻率,視內(nèi)容發(fā)展情況氛谜,擴(kuò)充編輯團(tuán)隊(duì)掏觉,生產(chǎn)更多新內(nèi)容,讓網(wǎng)站索引避免下降值漫,持續(xù)增加澳腹。(當(dāng)更新量及頻率下降明顯,那么配額就會(huì)下降杨何,首先表現(xiàn)抓取頻次下降酱塔,導(dǎo)致索引量下降)
C、時(shí)效性信息消失
解決:時(shí)效性的信息危虱,大部分一般在數(shù)據(jù)庫(kù)不會(huì)長(zhǎng)期保留羊娃,所以需要持續(xù)挖掘新的時(shí)效信息點(diǎn),整合相關(guān)內(nèi)容埃跷。
D蕊玷、部分區(qū)域出現(xiàn)不良信息
解決:杜絕大量外鏈軟文、惡劣彈窗廣告弥雹、非法敏感類(lèi)信息垃帅、專(zhuān)門(mén)針對(duì)搜索引擎作弊的內(nèi)容等
【觸犯懲罰算法】
解決:關(guān)注站長(zhǎng)工具消息和百度網(wǎng)頁(yè)搜索動(dòng)態(tài)。按官方公告說(shuō)明來(lái)整改站點(diǎn)剪勿,并進(jìn)行反饋贸诚,然后等待算法更新。
【特型url不被信任】
解決:定制各類(lèi)url的索引查詢(xún)規(guī)則;定位索引量下降的特型url;排查該類(lèi)url當(dāng)日厕吉、前一日赦颇、本周、歷史索引情況;找出未被入庫(kù)的數(shù)據(jù)可能存在的問(wèn)題;處理完后赴涵,增強(qiáng)該類(lèi)url與百度數(shù)據(jù)溝通(途徑有sitemap媒怯、批量提交url、數(shù)據(jù)推送等)髓窜。
【站點(diǎn)被搜索引擎信任度下降】
A扇苞、非法投票嫌疑(鏈接工廠(chǎng)等)
解決:珍惜自己頁(yè)面的投票權(quán)欺殿,對(duì)于劣質(zhì)網(wǎng)頁(yè)堅(jiān)決不投票,盡量減少站點(diǎn)的導(dǎo)出鏈接鳖敷。
B脖苏、主題變動(dòng)(如從教育領(lǐng)域跨入醫(yī)療領(lǐng)域)
解決:將舊領(lǐng)域的網(wǎng)頁(yè)進(jìn)行死鏈處理后向百度進(jìn)行提交,封禁相關(guān)舊url的被訪(fǎng)問(wèn)權(quán)定踱,然后再上線(xiàn)新主題相關(guān)內(nèi)容棍潘,加強(qiáng)對(duì)百度的數(shù)據(jù)提交
C、受牽連
相同ip下非法站點(diǎn)偏多崖媚,同一域名所有人舉辦的網(wǎng)站大都被懲罰且情況惡劣等
解決:離開(kāi)惡鄰亦歉,獲取搜索引擎的各產(chǎn)品的相關(guān)反饋方式,請(qǐng)求給予解禁畅哑,等待恢復(fù)正常索引肴楷。
D、政策性原因
如香港主機(jī)荠呐、國(guó)外主機(jī)站點(diǎn)由于各種你懂的原因赛蔫,穩(wěn)定性可能較差
解決:國(guó)內(nèi)主機(jī)備案,合法符合政策經(jīng)營(yíng)
3泥张、網(wǎng)頁(yè)模板相關(guān)
【主體內(nèi)容區(qū)域?qū)χ┲氲南拗啤?/p>
解決:取消登陸查看信息等限制呵恢,讓蜘蛛便捷暢快的“采集”到己站數(shù)據(jù)
【啟用了對(duì)蜘蛛不友好的技術(shù)】
解決:對(duì)需要蜘蛛識(shí)別的內(nèi)容,不要啟用對(duì)蜘蛛不友好的技術(shù)來(lái)調(diào)用媚创。
【響應(yīng)式模板干擾蜘蛛識(shí)別頁(yè)面類(lèi)型(pc渗钉、移動(dòng))】
解決:提交特定的url對(duì)應(yīng)關(guān)系(盡量parrten級(jí));meta標(biāo)記移動(dòng)版本url及適合瀏覽的設(shè)備;自主適配;增強(qiáng)pc、移動(dòng)不同模板源碼標(biāo)簽的區(qū)分度筝野,幫助百度識(shí)別頁(yè)面類(lèi)型
4晌姚、源碼相關(guān)
【源碼錯(cuò)誤較嚴(yán)重,如編碼錯(cuò)誤歇竟、標(biāo)簽使用錯(cuò)誤等;源碼改動(dòng)嚴(yán)重挥唠,蜘蛛“采集”數(shù)據(jù)后重新觀察分析;某類(lèi)url下的TD(網(wǎng)頁(yè)title、deion)變化焕议,如變化比例大宝磨、變化頁(yè)面量大,頁(yè)面進(jìn)行更改后會(huì)重走建索引庫(kù)流程盅安,如果頁(yè)面質(zhì)量達(dá)不到建索引庫(kù)標(biāo)準(zhǔn)會(huì)從線(xiàn)上消失】
解決:校驗(yàn)源碼唤锉,準(zhǔn)確的源碼是蜘蛛“采集”數(shù)據(jù)進(jìn)行分析的基礎(chǔ);link內(nèi)鏈結(jié)構(gòu)、url地址形式别瞭、頁(yè)面主題窿祥、頁(yè)面各區(qū)域html標(biāo)記等盡量維持改動(dòng)前的情況;逐步、分期更換TD(網(wǎng)頁(yè)title蝙寨、deion)晒衩,結(jié)合頁(yè)面主題嗤瞎、用戶(hù)實(shí)際需求來(lái)制定合理的TD,不欺騙不誤導(dǎo)用戶(hù)听系。
5贝奇、已入庫(kù)的url對(duì)蜘蛛狀態(tài)有變化
【robots聲明,禁止蜘蛛抓取】
解決:查看百度站長(zhǎng)工具robots及抓取情況靠胜。
【url規(guī)則變化掉瞳,原有url無(wú)法訪(fǎng)問(wèn)】
解決:特別是linux和win服務(wù)器之間的數(shù)據(jù)遷移,可能會(huì)出現(xiàn)大小寫(xiě)url支持變化浪漠,確保各類(lèi)url規(guī)則不變化陕习。url必須重構(gòu)的時(shí)候,做好舊新url301重定向郑藏,站長(zhǎng)工具提交改版需求衡查。
【提示錯(cuò)誤頁(yè)面】
解決:由于誤刪瘩欺,則可以數(shù)據(jù)恢復(fù)必盖,并維持url對(duì)應(yīng)網(wǎng)頁(yè)內(nèi)容的更新變化,提高抓取頻次俱饿。如果確定要?jiǎng)h除歌粥,那么提交死鏈,刪除死鏈后拍埠,再robots禁止失驶,這種情況的索引下降無(wú)需擔(dān)憂(yōu)。
【被入侵】
解決:防止url對(duì)蜘蛛進(jìn)行非法跳轉(zhuǎn)操作;防止url對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容對(duì)蜘蛛出現(xiàn)內(nèi)容大變化枣购,特別是一些違法亂紀(jì)的內(nèi)容
6嬉探、DNS、服務(wù)器問(wèn)題
【DNS問(wèn)題】
dns不穩(wěn)定;dns不安全
解決:選擇可靠的dns服務(wù);溝通強(qiáng)調(diào)對(duì)蜘蛛的穩(wěn)定性;防止dns解析到非正常ip;防止解析的網(wǎng)站ip頻繁變動(dòng)棉圈。防止dns管理漏洞涩堤,導(dǎo)致被惡意解析;防止dns解析掛靠在小代理等技術(shù)能力、管理規(guī)范分瘾、道德法律約束都欠缺的平臺(tái)上胎围。
【服務(wù)器問(wèn)題】
A、可訪(fǎng)問(wèn)性差
解決:盡量讓目標(biāo)地區(qū)所有運(yùn)營(yíng)商來(lái)路的用戶(hù)都能在3秒內(nèi)打開(kāi)網(wǎng)站德召,最佳1秒內(nèi);監(jiān)控網(wǎng)站運(yùn)行狀態(tài)白魂,合理設(shè)置目標(biāo)地區(qū)的所有運(yùn)營(yíng)商監(jiān)控節(jié)點(diǎn)及監(jiān)控項(xiàng)目、監(jiān)控頻率
B上岗、屏蔽百度ua或ip
解決:多利用百度站長(zhǎng)工具福荸,查看百度抓取網(wǎng)頁(yè)的情況,可見(jiàn)
C肴掷、防刷壓力值設(shè)定
解決:將蜘蛛解析到專(zhuān)用空間;如出現(xiàn)訪(fǎng)問(wèn)陡增的ip敬锐,查看是否為蜘蛛再確定是否禁止訪(fǎng)問(wèn)辞嗡。
三、導(dǎo)致百度索引量下降的常見(jiàn)原因——百度方原因
1滞造、配額再分配
同類(lèi)數(shù)據(jù)量接近索引分配總額续室,配額量再分配,有升的就會(huì)有降的
解決:超過(guò)競(jìng)品谒养,爭(zhēng)取高額分配挺狰。
2、數(shù)據(jù)異常錯(cuò)誤
A买窟、錯(cuò)誤懲罰
應(yīng)對(duì)某類(lèi)作惡行為而新算法上線(xiàn)丰泊,但由于蝴蝶效應(yīng),導(dǎo)致部分站點(diǎn)被錯(cuò)誤懲罰而清除大量索引始绍。
解決:反饋百度方瞳购,請(qǐng)求解除懲罰。
B亏推、地區(qū)性數(shù)據(jù)異常
部分地區(qū)數(shù)據(jù)抓取或查詢(xún)異常学赛,導(dǎo)致誤判站點(diǎn)情況而清除相應(yīng)索引數(shù)據(jù)或輸出錯(cuò)誤索引量,如百度dns系統(tǒng)升級(jí)事件吞杭。
解決:反饋百度方盏浇,由百度檢查各地蜘蛛執(zhí)行情況。
C芽狗、接口調(diào)用數(shù)據(jù)錯(cuò)誤绢掰、數(shù)據(jù)丟失、數(shù)據(jù)備份衍生異常
解決:反饋百度方童擎,由百度檢查相關(guān)數(shù)據(jù)情況滴劲。
說(shuō)了這么多,有的站長(zhǎng)遇到百度索引量下降情況可能還是仍然不知道怎么辦顾复。最基礎(chǔ)的做法是去百度站長(zhǎng)平臺(tái)查看下robots.txt的設(shè)置班挖,然后分別抓取網(wǎng)站每個(gè)分類(lèi)目錄和二級(jí)域名的網(wǎng)頁(yè),查看是否抓取正常和驗(yàn)證robots.txt文件是否設(shè)置有誤捕透。如果都沒(méi)有問(wèn)題聪姿,再檢查下友情鏈接和外鏈數(shù)據(jù)。當(dāng)然如果網(wǎng)站轉(zhuǎn)載文章和抄襲文章過(guò)多或者原創(chuàng)質(zhì)量過(guò)低乙嘀,這樣收錄量和索引量下降是遲早的事了末购。此外,網(wǎng)站索引量下降未必是壞事虎谢,如果我們的網(wǎng)站存在大量重復(fù)網(wǎng)頁(yè)盟榴,動(dòng)態(tài)網(wǎng)頁(yè),和無(wú)效網(wǎng)頁(yè)婴噩,這些網(wǎng)頁(yè)都被百度索引帶來(lái)的是副作用擎场。設(shè)置robots.txt文件(利用robots文件做seo優(yōu)化羽德,讓蜘蛛更好的抓取網(wǎng)站)必然會(huì)導(dǎo)致索引量的下降,這種情況下迅办,索引量下降對(duì)我們網(wǎng)站是由好處的宅静。
來(lái)源:朱海濤自媒體(微信/QQ號(hào):81433982),原創(chuàng)文章如轉(zhuǎn)載,請(qǐng)注明本文鏈接: http://www.stcash.com/6174
篇二 : 百度收錄量和索引量的終極解讀站欺?
網(wǎng)友道哥對(duì)[百度索引量]百度收錄量和索引量的終極解讀姨夹?給出的答復(fù):
收錄量是SEO圈內(nèi)的叫法(通常指site的結(jié)果數(shù)量),學(xué)術(shù)叫法就是索引量(也就是一個(gè)網(wǎng)站實(shí)際被建倒排索引的網(wǎng)頁(yè)數(shù)量矾策,不過(guò)由于倒排索引的特性難以統(tǒng)計(jì)磷账,所以百度站長(zhǎng)平臺(tái)實(shí)際輸出的這個(gè)值很有可能如zero所說(shuō)是正排索引的統(tǒng)計(jì)量,也就是網(wǎng)址索引庫(kù)贾虽,而網(wǎng)址索引庫(kù)應(yīng)該是百度口中作為補(bǔ)充材料的最低層級(jí)的索引庫(kù)之一了)逃糟。
而兩者統(tǒng)計(jì)值不同就是實(shí)際query分析后檢索的索引庫(kù)不同所致。
但無(wú)論是site數(shù)據(jù)蓬豁,還是百度口中的這個(gè)“精準(zhǔn)”的索引量數(shù)據(jù)其實(shí)都不靠譜绰咽。因?yàn)檎嬲蠸EO價(jià)值的是倒排索引庫(kù)的索引量,只有這部分索引量才具備產(chǎn)出流量的能力庆尘。這也是為什么要盡量細(xì)分頻道隨機(jī)采樣url并且采用查title而非url來(lái)實(shí)現(xiàn)索引量監(jiān)控的原因剃诅。
網(wǎng)友Zero對(duì)[百度索引量]百度收錄量和索引量的終極解讀巷送?給出的答復(fù):
看似不難實(shí)際極復(fù)雜的問(wèn)題驶忌,要搞明白的話(huà)涉及到對(duì)搜索引擎不同數(shù)據(jù)口徑的反推。
從結(jié)論而言是笑跛,我?guī)缀醪豢催@些數(shù)付魔,除非是看著翻了幾倍心里爽。
所謂收錄飞蹂,要去關(guān)心的話(huà)就是去解決流量問(wèn)題的几苍。而基于這個(gè)目的,要量化的總是細(xì)分頁(yè)面類(lèi)型的收錄情況而非整站情況(站長(zhǎng)平臺(tái)索引量可以拆分部分頁(yè)面類(lèi)型陈哑,有時(shí)能簡(jiǎn)單點(diǎn)處理事情妻坝,但不推薦),這時(shí)候最佳方法一般是取頁(yè)面類(lèi)型所有URL再隨機(jī)采樣惊窖。這個(gè)解決方案在絕大多數(shù)情況下都好用刽宪。
搜狗站長(zhǎng)平臺(tái)把收錄量索引量放在一起兩張圖,意思多半是前者是進(jìn)正排索引界酒,后者是建立了倒排索引的(見(jiàn)走進(jìn)搜索引擎等基礎(chǔ)書(shū)籍)圣拄。
猜百度也是這樣,硬要去解讀的話(huà)可以這么來(lái)看毁欣。痞子瑞的SEO深度解析里面也更具體提到了一些site數(shù)量的規(guī)則庇谆。
正排倒排網(wǎng)頁(yè)數(shù)量不同的最主要影響可能是岳掐,低質(zhì)量頁(yè)面在建倒排過(guò)程中被分析出來(lái)過(guò)濾了。也可能是其中一個(gè)庫(kù)清了一些頁(yè)面饭耳,另一個(gè)庫(kù)還沒(méi)跟上串述。等等。
不管怎么樣不要覺(jué)得這兩個(gè)數(shù)對(duì)不起來(lái)是件什么奇怪的事情寞肖,本就不是一回事剖煌。之前碰到有人因?yàn)樗饕慷嗔耍X(jué)得收錄索引必一樣的趨勢(shì)逝淹,看到乙方(非我們)統(tǒng)計(jì)的收錄下降耕姊,就怪罪乙方算的什么破數(shù)據(jù)。
無(wú)知害人栅葡。
網(wǎng)友魚(yú)非子對(duì)[百度索引量]百度收錄量和索引量的終極解讀茉兰?給出的答復(fù):
百度收錄量是百度蜘蛛抓取之后,感覺(jué)你內(nèi)容寫(xiě)的不錯(cuò)欣簇,然后把你的內(nèi)容放到了自己的大盤(pán)子里面规脸,網(wǎng)名是可以搜索到的,這就是百度收錄熊咽。
索引量指的是百度蜘蛛抓取的內(nèi)容莫鸭,注意,是抓取哦横殴,索引量的大小和你網(wǎng)站內(nèi)容的多少有直接聯(lián)系被因,但是如果內(nèi)容質(zhì)量太差的話(huà),只是抓壬缆亍(索引)之后梨与,可能又放下了,蜘蛛不喜歡你的內(nèi)容文狱,所以?xún)?nèi)容的質(zhì)量高才會(huì)最終被收錄粥鞋。