如何選擇鏈接提交方式
主動(dòng)推送:最為快速的提交方式橄妆,建議您將站點(diǎn)當(dāng)天新產(chǎn)出鏈接立即通過此方式推送給百度,以保證新鏈接可以及時(shí)被百度收錄饶唤。
sitemap:您可以定期將網(wǎng)站鏈接放到Sitemap中,然后將Sitemap提交給百度。百度會(huì)周期性的抓取檢查您提交的Sitemap邑彪,對(duì)其中的鏈接進(jìn)行處理,但收錄速度慢于主動(dòng)推送胧华。
手工提交:如果您不想通過程序提交寄症,那么可以采用此種方式,手動(dòng)將鏈接提交給百度矩动。
自動(dòng)推送:是輕量級(jí)鏈接提交組件有巧,將自動(dòng)推送的JS代碼放置在站點(diǎn)每一個(gè)頁面源代碼中,當(dāng)頁面被訪問時(shí)悲没,頁面鏈接會(huì)自動(dòng)推送給百度篮迎,有利于新頁面更快被百度發(fā)現(xiàn)。
使用主動(dòng)推送功能會(huì)達(dá)到怎樣效果
及時(shí)發(fā)現(xiàn):可以縮短百度爬蟲發(fā)現(xiàn)您站點(diǎn)新鏈接的時(shí)間檀训,使新發(fā)布的頁面可以在第一時(shí)間被百度收錄
保護(hù)原創(chuàng):對(duì)于網(wǎng)站的最新原創(chuàng)內(nèi)容柑潦,使用主動(dòng)推送功能可以快速通知到百度,使內(nèi)容可以在轉(zhuǎn)發(fā)之前被百度發(fā)現(xiàn)
如何使用主動(dòng)推送功能
1峻凫,需要網(wǎng)站制作數(shù)據(jù)推送接口渗鬼,進(jìn)入主動(dòng)推送工具后,會(huì)看到接口調(diào)用地址的token荧琼,token是由16個(gè)英文數(shù)字組合的字符串
2譬胎,下面提供一些推送示例
1)curl推送示例
將要提交的url數(shù)據(jù)寫入一個(gè)本地文件差牛,比如urls.txt,每個(gè)url占一行堰乔,然后調(diào)用curl命令:
curl -H 'Content-Type:text/plain' --data-binary @urls.txt
"http://data.zz.baidu.com/urls?site=www.example.com&token=edk7yc4rEZP9pDQD"
使用php偏化、python、java等可以參照這個(gè)過程推送結(jié)構(gòu)化數(shù)據(jù)镐侯。
如何查看推送反饋
您可以通過推送后返回的狀態(tài)碼和字段來判斷數(shù)據(jù)是否推送成功侦讨。
1,狀態(tài)碼為200苟翻,表示推送成功韵卤,可能返回以下字段:
常見的推送失敗返回示例說明:
主動(dòng)推送功能常見問題
1,?和原來的sitemap提交接口有什么區(qū)別崇猫?
答:狀態(tài)反饋更及時(shí)了沈条,原來提交后需要登錄到站長(zhǎng)平臺(tái)查看提交是否成功。目前只要根據(jù)提交后返回的數(shù)據(jù)就可以判斷了诅炉。
2蜡歹,?已經(jīng)存在的提交sitemap數(shù)據(jù)的程序代碼需要做什么修改?
答:主要修改兩點(diǎn)涕烧。第一點(diǎn)月而,提交的接口需要修改;第二點(diǎn)澈魄,需要處理下接口返回的信息景鼠,失敗后需要根據(jù)錯(cuò)誤進(jìn)行相應(yīng)處理,報(bào)錯(cuò)的鏈接是無法提交成功的
3痹扇,為什么提交成功后看不到數(shù)據(jù)變化?
答:我們反饋的是新提交鏈接的數(shù)量溯香,如果您提交的鏈接在之前提交過(即重復(fù)提交)是不會(huì)被統(tǒng)計(jì)到的
4鲫构,在什么時(shí)機(jī)使用主動(dòng)推送提交功能效果最明顯?
答:頁面鏈接產(chǎn)生或發(fā)布時(shí)立即提交玫坛,這樣效果是最好的
5结笨,每次提交一條數(shù)據(jù)和多條數(shù)據(jù)有什么區(qū)別?
答:沒有區(qū)別
6湿镀,重復(fù)提交已經(jīng)發(fā)布的鏈接會(huì)有什么問題炕吸?
答:會(huì)有兩個(gè)影響。第一勉痴,將浪費(fèi)您提交的配額赫模,每個(gè)站點(diǎn)每天可提交的數(shù)量是有限制的,如果您都提交了舊鏈接蒸矛,當(dāng)有新鏈接時(shí)可能因?yàn)榕漕~耗盡無法提交瀑罗。第二胸嘴,如果您經(jīng)常重復(fù)提交舊鏈接,我們會(huì)下調(diào)您的配額斩祭,您可能會(huì)失去主動(dòng)推送功能的權(quán)限
7劣像,主動(dòng)推送可以推多少條鏈接?
答:主動(dòng)推送可提交的鏈接數(shù)量上限是根據(jù)您提交的新產(chǎn)生有價(jià)值鏈接數(shù)量而決定的摧玫,百度會(huì)根據(jù)您提交數(shù)量的情況不定期對(duì)上限額進(jìn)行調(diào)整耳奕,提交的新產(chǎn)生有價(jià)值鏈接數(shù)量越多,可提交鏈接的上限越高诬像。
什么是Sitemap
Sitemap(即站點(diǎn)地圖)就是您網(wǎng)站上各網(wǎng)頁的列表屋群。創(chuàng)建并提交Sitemap有助于百度發(fā)現(xiàn)并了解您網(wǎng)站上的所有網(wǎng)頁。您還可以使用Sitemap提供有關(guān)您網(wǎng)站的其他信息颅停,如上次更新日期谓晌、Sitemap文件的更新頻率等,供百度Spider參考癞揉。
百度對(duì)已提交的數(shù)據(jù)纸肉,不保證一定會(huì)抓取及索引所有網(wǎng)址。但是喊熟,我們會(huì)使用Sitemap中的數(shù)據(jù)來了解網(wǎng)站的結(jié)構(gòu)等信息柏肪,這樣可以幫助我們改進(jìn)抓取策略,并在日后能更好地對(duì)網(wǎng)站進(jìn)行抓取芥牌。
此外烦味,Sitemap 與搜索排名沒有關(guān)系。?
百度Sitemap支持哪些格式
百度Sitemap協(xié)議支持三種格式:文本格式壁拉、xml格式谬俄、Sitemap索引格式,可以根據(jù)自己情況來選擇任意一種格式組織sitemap。具體格式說明及示例如下:
1.第一種格式樣例:txt文本格式
在一個(gè)txt文本列明需要向百度提交的鏈接地址弃理,將txt文本文件通過站長(zhǎng)平臺(tái)進(jìn)行提交
http://www.example.com/repaste/101562698_5230191316.html
http://www.example.com/repaste/101586283_5230215075.html
http://www.example.com/repaste/101639435_5230310576.html
此文本文件需要遵循以下指南:
·?文本文件每行都必須有一個(gè)網(wǎng)址溃论。網(wǎng)址中不能有換行。
·?不應(yīng)包含網(wǎng)址列表以外的任何信息痘昌。
·?您必須書寫完整的網(wǎng)址钥勋,包括 http。
·?每個(gè)文本文件最多可包含 50,000 個(gè)網(wǎng)址辆苔,并且應(yīng)小于10MB(10,485,760字節(jié))算灸。如果網(wǎng)站所包含的網(wǎng)址超過 50,000 個(gè),則可將列表分割成多個(gè)文本文件驻啤,然后分別添加每個(gè)文件菲驴。
·?文本文件需使用 UTF-8 編碼或GBK編碼。
2.第二種格式樣例:xml格式
若有多條url街佑,按照上述格式重復(fù)之間的片斷谢翎,列明所有url地址捍靠,打包到一個(gè)xml文件,向站長(zhǎng)平臺(tái)進(jìn)行提交森逮。
3.第三種格式樣例:Sitemap索引格式
如需提交大量sitemap文件榨婆,則可將其列在sitemap索引文件中,然后將該索引文件提交褒侧。您無需分別提交每個(gè)文件良风。
創(chuàng)建Sitemap時(shí)有哪些注意事項(xiàng)?
第一闷供,一個(gè)Sitemap文件包含的網(wǎng)址不得超過 5 萬個(gè)烟央,且文件大小不得超過 10 MB。如果您的Sitemap超過了這些限值歪脏,請(qǐng)將其拆分為幾個(gè)小的Sitemap疑俭。這些限制條件有助于確保您的網(wǎng)絡(luò)服務(wù)器不會(huì)因提供大文件而超載。
第二婿失,一個(gè)站點(diǎn)支持提交的sitemap文件個(gè)數(shù)必須小于5萬個(gè)钞艇,多于5萬個(gè)后會(huì)不再處理,并顯示“鏈接數(shù)超”的提示豪硅。? ??
第三哩照,如果驗(yàn)證了網(wǎng)站的主域,那么Sitemap文件中可包含該網(wǎng)站主域下的所有網(wǎng)址懒浮。
如何提交Sitemap
第一步飘弧,將需提交的網(wǎng)頁列表制作成一個(gè)Sitemap文件,文件格式請(qǐng)閱讀百度Sitemap協(xié)議都支持哪些格式砚著。
第二步次伶,將Sitemap文件放置在網(wǎng)站目錄下。比如您的網(wǎng)站為example.com稽穆,您已制作了一個(gè)sitemap_example.xml的Sitemap文件学少,將sitemap_example.xml上傳至網(wǎng)站根目錄即example.com/sitemap_example.xml
第三步,登錄百度站長(zhǎng)平臺(tái)秧骑,確保提交Sitemap數(shù)據(jù)的網(wǎng)站已驗(yàn)證歸屬。
第四步扣囊,進(jìn)入Sitemap工具乎折,點(diǎn)擊“添加新數(shù)據(jù)”,文件類型選擇“URL列表”侵歇,填寫抓取周期和Sitemap文件地址
最后骂澄,提交完之后,可在Sitemap列表里看到提交的Sitemap文件惕虑,如果Sitemap文件里面有新的網(wǎng)站鏈接坟冲,可以選擇文件后磨镶,點(diǎn)擊更新所選,即對(duì)更新的網(wǎng)站鏈接進(jìn)行了提交健提。
什么是移動(dòng)Sitemap協(xié)議,如何提交移動(dòng)Sitemap協(xié)議
百度推出了移動(dòng)Sitemap協(xié)議琳猫,用于將網(wǎng)址提交給移動(dòng)搜索收錄。百度移動(dòng)Sitemap協(xié)議是在標(biāo)準(zhǔn)Sitemap協(xié)議基礎(chǔ)上制定的私痹,增加了標(biāo)簽脐嫂,它有四種取值:
:移動(dòng)網(wǎng)頁
:移動(dòng)網(wǎng)頁
:自適應(yīng)網(wǎng)頁
:代碼適配
無該上述標(biāo)簽表示為PC網(wǎng)頁
下方樣例相當(dāng)于向百度移動(dòng)搜索提交了一個(gè)移動(dòng)網(wǎng)頁:http://m.example.com/index.html,向PC搜索提交了一個(gè)傳統(tǒng)網(wǎng)頁:http://www.example.com/index.html紊遵,同時(shí)向移動(dòng)搜索和PC搜索提交了一個(gè)自適配網(wǎng)頁http://www.example.com/autoadapt.html:
xmlns:mobile="http://www.baidu.com/schemas/sitemap-mobile/1/">
http://m.example.com/index.html
2009-12-14
daily
0.8
http://www.example.com/index.html
2009-12-14
daily
0.8
http://www.example.com/autoadapt.html
2009-12-14
daily
0.8
http://www.example.com/htmladapt.html
2009-12-14
daily
0.8
按照移動(dòng)Sitemap協(xié)議做好Sitemap后账千,在Sitemap工具點(diǎn)擊添加新數(shù)據(jù)提交,與提交普通Sitemap方式一致暗膜。
我提交時(shí)填寫的周期是什么含義匀奏?
百度Spider會(huì)參考設(shè)置周期抓取Sitemap文件,因此請(qǐng)根據(jù)Sitemap文件內(nèi)容的更新(比如增加新url)來設(shè)置学搜。請(qǐng)注意若url不變而僅是url對(duì)應(yīng)的頁面內(nèi)容更新(比如論壇帖子頁有新回復(fù)內(nèi)容)娃善,不在此更新范圍內(nèi)。Sitemap工具不能解決頁面更新問題恒水。
Sitemap提交后会放,多久能被百度處理?
Sitemap數(shù)據(jù)提交后钉凌,一般在1小時(shí)內(nèi)百度會(huì)開始處理咧最。在以后的調(diào)度抓取中,如果您的sitemap支持etag御雕,我們會(huì)更頻繁抓取sitemap文件矢沿,從而及時(shí)發(fā)現(xiàn)內(nèi)容更新;否則抓取的周期會(huì)比較長(zhǎng)酸纲。
提交的Sitemap都會(huì)被百度抓取并收錄嗎捣鲸?
百度對(duì)已提交的數(shù)據(jù),不保證一定會(huì)抓取及收錄所有網(wǎng)址闽坡。是否收錄與頁面質(zhì)量相關(guān)栽惶。
我可以壓縮我的 Sitemap 嗎?它們是否需要用 gzip 壓縮疾嗅?
可以外厂。請(qǐng)使用?gzip?壓縮?Sitemap。無論壓縮與否代承,Sitemap?應(yīng)該小于?10MB(10,485,759字節(jié))汁蝶。
XML格式的 Sitemap 中,“priority”提示會(huì)影響我的網(wǎng)頁在搜索結(jié)果中的排名嗎?
不會(huì)掖棉。Sitemap?中的“priority”提示只是說明該網(wǎng)址相對(duì)于您自己網(wǎng)站上其他網(wǎng)址的重要性墓律,并不會(huì)影響網(wǎng)頁在搜索結(jié)果中的排名。
網(wǎng)址在 Sitemap 中的位置是否會(huì)影響它的使用幔亥?
不會(huì)耻讽。網(wǎng)址在?Sitemap?中的位置并不會(huì)影響百度對(duì)它的識(shí)別或使用方式。
Sitemap中提交的url能否包含中文紫谷?
因?yàn)檗D(zhuǎn)碼問題建議最好不要包含中文齐饮。
什么是自動(dòng)推送工具?自動(dòng)推送工具解決了什么問題笤昨?
自動(dòng)推送JS代碼是百度站長(zhǎng)平臺(tái)最新推出的輕量級(jí)鏈接提交組件祖驱,站長(zhǎng)只需將自動(dòng)推送的JS代碼放置在站點(diǎn)每一個(gè)頁面源代碼中,當(dāng)頁面被訪問時(shí)瞒窒,頁面鏈接會(huì)自動(dòng)推送給百度捺僻,有利于新頁面更快被百度發(fā)現(xiàn)。
為了更快速的發(fā)現(xiàn)站點(diǎn)每天產(chǎn)生的最新內(nèi)容崇裁,百度站長(zhǎng)平臺(tái)推出主動(dòng)推送工具匕坯,產(chǎn)品上線后,部分站長(zhǎng)反饋使用主動(dòng)推送方式的技術(shù)門檻較高拔稳,于是我們順勢(shì)推出更低成本的JS自動(dòng)推送工具葛峻。一步安裝便可實(shí)現(xiàn)頁面自動(dòng)推送,低成本巴比,高收益术奖。
自動(dòng)推送代碼如何安裝使用?
如果站長(zhǎng)使用PHP語言開發(fā)的網(wǎng)站轻绞,可以按以下步驟操作:
1采记、創(chuàng)建名為“baidu_js_push.php”的文件,文件內(nèi)容是上述自動(dòng)推送JS代碼政勃;
2唧龄、在每個(gè)PHP模板頁文件中的 標(biāo)記后面添加一行代碼:
為什么自動(dòng)推送可以更快的將頁面推送給百度搜索?
基于自動(dòng)推送的實(shí)現(xiàn)原理問題奸远,當(dāng)新頁面每次被瀏覽時(shí)既棺,頁面URL會(huì)自動(dòng)推送給百度,無需站長(zhǎng)匯總URL再進(jìn)行主動(dòng)推送操作懒叛。
借助用戶的瀏覽行為來觸發(fā)推送動(dòng)作援制,省去了站長(zhǎng)人工操作的時(shí)間。
自動(dòng)推送和主動(dòng)推送有什么區(qū)別芍瑞?
已經(jīng)在使用鏈接提交里的主動(dòng)推送(或sitemap)的網(wǎng)站還需要再部署自動(dòng)推送代碼嗎?
二者之間互不沖突褐墅,互為補(bǔ)充拆檬。已經(jīng)使用主動(dòng)推送的站點(diǎn)洪己,依然可以部署自動(dòng)推送的JS代碼,二者一起使用竟贯。
什么樣的網(wǎng)站更適合使用自動(dòng)推送答捕?
自動(dòng)推送由于實(shí)現(xiàn)便捷和后續(xù)維護(hù)成本低的特點(diǎn),適合技術(shù)能力相對(duì)薄弱屑那,無能力支持全天候?qū)崟r(shí)主動(dòng)推送程序的站長(zhǎng)拱镐。
站長(zhǎng)僅需一次部署自動(dòng)推送JS代碼的操作,就可以實(shí)現(xiàn)新頁面被瀏覽即推送的效果持际,低成本實(shí)現(xiàn)鏈接自動(dòng)提交沃琅。
同時(shí),也支持主動(dòng)推送和自動(dòng)推送代碼配合使用蜘欲,二者互不影響益眉。