懂一些SEO優(yōu)化知識的親們都知道,文章發(fā)布以后荚守,只有被搜索引擎收錄珍德,才有可能通過搜索引擎帶來一些自然流量练般。如果文章發(fā)布以后遲遲不被搜索引擎收錄,那么很大概率是這篇文章內(nèi)容的質(zhì)量不達(dá)標(biāo)锈候,網(wǎng)頁亦是如此薄料。
一,那么如何才能判斷你的文章或者一個網(wǎng)頁是否被搜索引擎收錄呢泵琳?
其實最簡單的辦法就是手動復(fù)制網(wǎng)址直接百度回車搜索摄职,然后看搜索結(jié)果即可。不過這種方法僅僅適合于一次性的查看获列,如果需要檢測大批量的網(wǎng)址是否被百度收錄谷市,這種方法真的會累死人。
但是我們可以用程序來解決這個重復(fù)的檢測工作蛛倦,剛好我今天就用PHP實現(xiàn)了這個功能點歌懒,所以就用這篇文章整理記錄,順便分享出來溯壶。
比如我們需要判斷“網(wǎng)址1”和“網(wǎng)址2”和“網(wǎng)址3”這三個網(wǎng)址是否被百度搜索引擎收錄及皂,只需要逐一手動復(fù)制網(wǎng)址到百度搜索框,然后回車搜索即可且改。
網(wǎng)址1的搜索結(jié)果截圖如下验烧,從搜索結(jié)果我們可以看出,該網(wǎng)址已經(jīng)被百度收錄了又跛。
網(wǎng)址2的搜索結(jié)果截圖如下碍拆,從搜索結(jié)果我們可以看出,該網(wǎng)址還沒有被百度收錄慨蓝,而且搜索結(jié)果中出現(xiàn)了“沒有找到該URL”這個關(guān)鍵字感混。
網(wǎng)址3的搜索結(jié)果截圖如下,從搜索結(jié)果我們可以看出礼烈,該網(wǎng)址也沒有被百度收錄弧满,且搜索結(jié)果中出現(xiàn)了“抱歉沒有找到”,“請檢查您的輸入是否正確”此熬,“網(wǎng)頁未收錄”等關(guān)鍵字庭呜。
二,判斷網(wǎng)頁/網(wǎng)址是否被收錄的原理又是什么呢犀忱?
到這一步募谎,其實我們的判斷原理已經(jīng)有了,就是看搜索結(jié)果阴汇。如果搜索結(jié)果中有“沒有找到該URL”数冬,“抱歉沒有找到”,“請檢查您的輸入是否正確”搀庶,“網(wǎng)頁未收錄”這4個關(guān)鍵字中的一個吉执,那么基本上就可以確定這個網(wǎng)址還沒有被百度收錄疯淫。
三地来,具體怎么實現(xiàn)這個功能戳玫?實現(xiàn)思路是怎樣的?
現(xiàn)在需求明確了未斑,原理也清楚了咕宿,那一般這種情況我們該怎么實現(xiàn)呢?我本次采用的是PHP中的一項基礎(chǔ)技術(shù)蜡秽,也就是CURL采集功能府阀。
我的實現(xiàn)思路就是先通過分析百度搜索結(jié)果的鏈接地址得出需要采集的目標(biāo)URL的地址結(jié)構(gòu),然后使用CURL去采集目標(biāo)URL地址的結(jié)果芽突,再通過strpos()這個函數(shù)來判斷采集的結(jié)果中有沒有包含上面提到的4個關(guān)鍵字试浙,如果有的話,那就說明該網(wǎng)址還沒有被收錄寞蚌,如果沒有的話田巴,就說明該網(wǎng)址已經(jīng)被百度收錄了。
下面就是我今天用PHP實現(xiàn)這個功能的具體代碼:
<?php
function checkBaiduInclude($url){
$url = 'http://www.baidu.com/s?wd='.$url;
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$result = curl_exec($ch);
curl_close($ch);
if(strpos($result, '沒有找到該URL')){
return 0;
}elseif(strpos($result, '抱歉沒有找到')){
return 0;
}elseif(strpos($result, '請檢查您的輸入是否正確')){
return 0;
}elseif(strpos($result, '網(wǎng)頁未收錄')){
return 0;
}else{
return 1;
}
}
$url = "https://www.hubaye.com";
if(checkBaiduInclude($url) == 1){
var_dump("該網(wǎng)頁已經(jīng)被百度收錄了");
}else{
var_dump("該網(wǎng)頁還沒有被百度收錄");
}
四挟秤,為什么只寫了如何用PHP判斷網(wǎng)址是否被百度收錄壹哺,沒有寫如何判斷網(wǎng)頁是否被其它搜索引擎收錄呢?
因為如今國內(nèi)的搜索領(lǐng)域艘刚,百度依舊是搜索引擎領(lǐng)域的巨頭管宵。我們平時做國內(nèi)SEO優(yōu)化工作的時候,基本上也只做百度的優(yōu)化攀甚。
所以我們這次也只寫了如何用PHP判斷網(wǎng)址是否被百度收錄箩朴,但其實代碼的原理是通用的,需要判斷是否被其它搜索引擎收錄的親們秋度,可以自行更改CURL采集的URL地址炸庞。