Sitemap(站點(diǎn)地圖)是一種文件醋粟,站長(zhǎng)可通過(guò)該文件列出網(wǎng)站上的網(wǎng)頁(yè)靡菇,將網(wǎng)站內(nèi)容的組織結(jié)構(gòu)告知搜索引擎。神馬等搜索引擎網(wǎng)頁(yè)抓取工具會(huì)讀取此文件米愿,以便更加智能地抓取網(wǎng)站內(nèi)容
Sitemap(站點(diǎn)地圖)是一種文件厦凤,站長(zhǎng)可通過(guò)該文件列出網(wǎng)站上的網(wǎng)頁(yè),將網(wǎng)站內(nèi)容的組織結(jié)構(gòu)告知搜索引擎吗货。神馬等搜索引擎網(wǎng)頁(yè)抓取工具會(huì)讀取此文件泳唠,以便更加智能地抓取網(wǎng)站內(nèi)容
理想狀況下狈网,如果您的網(wǎng)站網(wǎng)頁(yè)間關(guān)聯(lián)得當(dāng)宙搬,神馬的網(wǎng)頁(yè)抓取工具便能夠發(fā)現(xiàn)其中的大多數(shù)網(wǎng)頁(yè)笨腥。即便如此,提交站點(diǎn)地圖仍有助于搜索引擎更加有效地抓取網(wǎng)站勇垛,尤其是當(dāng)網(wǎng)站符合以下某個(gè)條件時(shí):1.網(wǎng)站為新建網(wǎng)站且指向該網(wǎng)站的外部鏈接不多脖母。搜索引擎的網(wǎng)頁(yè)抓取工具通過(guò)跟蹤網(wǎng)頁(yè)之間的鏈接來(lái)抓取網(wǎng)頁(yè),如果沒(méi)有其他網(wǎng)站鏈接到您的網(wǎng)頁(yè)闲孤,可能不會(huì)發(fā)現(xiàn)您的網(wǎng)頁(yè)谆级。2.網(wǎng)站規(guī)模很大。?在這種情況下讼积,神馬的網(wǎng)頁(yè)抓取工具可能會(huì)在抓取時(shí)漏掉部分新網(wǎng)頁(yè)肥照。3.網(wǎng)站中大量?jī)?nèi)容頁(yè)之間互不關(guān)聯(lián)或缺少有效鏈接。?如果您的網(wǎng)站網(wǎng)頁(yè)沒(méi)有自然地相互引用勤众,那么您可以在站點(diǎn)地圖中列出這些網(wǎng)頁(yè)舆绎,以確保搜索引擎不會(huì)漏掉您的網(wǎng)頁(yè)。
需要注意的是们颜,神馬搜索會(huì)按正常流程分析吕朵、處理Sitemap,但不保證一定會(huì)抓取及索引您提交的所有網(wǎng)址窥突,不保證其在搜索結(jié)果中的排名努溃。
Sitemap格式:
神馬搜索支持的Sitemap文件包括標(biāo)準(zhǔn)xml文件和索引型xml文件。標(biāo)準(zhǔn)xml文件最多包含10,000條url阻问,如果url超過(guò)10,000條可采用索引型xml文件梧税,索引型xml限定最多不超過(guò)三層。
標(biāo)準(zhǔn)xml文件格式示例:
<?xml version="1.0" encoding="utf-8"?>
??<!-- XML文件需以u(píng)tf-8編碼-->
??<urlset>
????<!--必填-->
????<url>
????????<!--必填,定義某一個(gè)鏈接的入口称近,每一條數(shù)據(jù)必須要用<url>和</url>來(lái)標(biāo)示 -->
http://www.wuxujia.cn/aiqing/167.html
????????<!--必填,URL長(zhǎng)度限制在256字節(jié)內(nèi)-->
????????<lastmod>2014-05-01</lastmod>
????????<!--更新時(shí)間標(biāo)簽贡蓖,非必填,用來(lái)表示最后更新時(shí)間-->
????????<changefreq>daily</changefreq>
????????<!--更新頻率標(biāo)簽煌茬,非必填斥铺,用來(lái)告知引擎頁(yè)面的更新頻率 -->
????????<priority>0.5</priority>
????????<!--優(yōu)先級(jí)標(biāo)簽,優(yōu)先級(jí)值0.0-1.0坛善,用來(lái)告知引擎該條url的優(yōu)先級(jí)-->
?????</url>
?????<url>
????????<loc>http://m.domain.com/123.xhtml</loc>
????????<lastmod>2014-05-01</lastmod>
????????<changefreq>daily</changefreq>
????????<priority>0.8</priority>
????</url>
??</urlset>
索引xml文件格式示例:
1.頂層Sitemap格式
<sitemapindex>
??<sitemap>
????<loc>
?????http://www.abc.com/sitemap_v2/detail_new/index/index_1.xml
????</loc>
??<lastmod>2013-12-18 12:59:12</lastmod>
??<!--更新時(shí)間標(biāo)簽晾蜘,必填,用來(lái)表示xml文件最后更新時(shí)間-->
</sitemap>
</sitemapindex>
2.中間層Sitemap格式(非必要眠屎,視url數(shù)量而定)
<sitemapindex>
?? <sitemap>
????<loc>
?????http://www.abc.com/sitemap_v2/detail_new/1/1.xml
????</loc>
????<lastmod>2013-12-18 12:59:12</lastmod>
??</sitemap>
</sitemapindex>