Unknown robot (identified by 'spider')是什么意思囚聚？

通過robots.txt來限制爬蟲

robots.txt是一個限制爬蟲的規(guī)范，該文件是用來聲明哪些東西不能被爬取顽铸。如果根目錄存在該文件，爬蟲就會按照文件的內(nèi)容來爬取指定的范圍簸淀。

因國內(nèi)大部分虛擬主機(jī)限制了每月的流量租幕，在通過空間商提供的控制面板查看訪問流量時發(fā)現(xiàn)非瀏覽器瀏覽占去大量的流量拧簸，通過查看：

搜索引擎網(wǎng)站的機(jī)器人發(fā)現(xiàn)大量流量是被Unknown robot (identified by ‘spider’)、Unknown robot (identified by 'robot')消耗掉，除了百度歉眷，GOOGLE等常見搜索引擎蜘蛛外颤枪，有些不知名搜索引擎蜘蛛違規(guī)胡亂爬行我們的網(wǎng)站畏纲，造成流量被大量消耗和占用CPU資源，導(dǎo)致網(wǎng)站訪問速度變慢盗胀，超出流量還需要單獨(dú)再付費(fèi)購買流量，給客戶造成經(jīng)濟(jì)負(fù)擔(dān)女阀。那么我們需要做一些設(shè)置將其屏蔽屑迂。為客戶快速解決這個問題。?

robots.txt爬蟲協(xié)議對正規(guī)的搜索引擎會有效的榛，但對一些不知名的搜索引擎可能會無效逻锐，現(xiàn)在GOOGLE被國內(nèi)封鎖，如果你的用戶是國內(nèi)客戶晓淀，可以將GOOGLE搜索引擎一起屏蔽掉盏档。以下代碼為：

禁止除百度、360外的一切搜索引擎索引你的網(wǎng)站

User-agent: Baiduspider

User-agent: 360spider

Disallow: User-agent: *

Disallow: /

?在網(wǎng)站根目錄下創(chuàng)建名為robots.txt的記事本文件懦窘，把以上代碼的紅色部份放到robots.txt內(nèi)即可稚配。

User-agent為充許某個搜索引擎索引你的網(wǎng)站。如要增加搜狗:Sogou web spider午衰、有道:YoudaoBot等，增加User-agent即可臊岸。

如果對代碼不熟悉，可以通過在線生成工具操作生成灯帮。tool.chinaz.com/robots/

User-agent: *? ? ? ? ?對所有蜘蛛開放

Allow: /? ? ? ? ? ? ? ? ? 允許訪問子目錄

Sitemap: http://###########/sitemap.xml? ? ? 指定網(wǎng)站地圖

User-agent: Baiduspider? ? ? ?允許百度蜘蛛

User-agent: 360spider? ? ? ? ? 允許360蜘蛛

Disallow: User-agent: *? ? ? ? ?關(guān)閉向所有蜘蛛開放的通道

Disallow: /? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 不允許訪問子目錄

最后編輯于：2024.01.27 11:52:34

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末钟哥，一起剝皮案震驚了整個濱河市鄙信，隨后出現(xiàn)的幾起案子忿晕，更是在濱河造成了極大的恐慌，老刑警劉巖践盼，帶你破解...
沈念sama閱讀 206,968評論 6贊 482
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件咕幻，死亡現(xiàn)場離奇詭異，居然都是意外死亡肄程，警方通過查閱死者的電腦和手機(jī)蓝厌，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,601評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門拓提，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人代态，你說我怎么就攤上這事∥魅福” “怎么了蒋搜？”我有些...
開封第一講書人閱讀 153,220評論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長豆挽。經(jīng)常有香客問我，道長膛檀，這世上最難降的妖魔是什么咖刃？我笑而不...
開封第一講書人閱讀 55,416評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任憾筏，我火速辦了婚禮，結(jié)果婚禮上枫浙，老公的妹妹穿的比我還像新娘古拴。我一直安慰自己黄痪，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 64,425評論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布是嗜。她就那樣靜靜地躺著挺尾，像睡著了一般。火紅的嫁衣襯著肌膚如雪潦嘶。梳的紋絲不亂的頭發(fā)上掂僵，一...
開封第一講書人閱讀 49,144評論 1贊 285
城市分裂傳說
那天锰蓬，我揣著相機(jī)與錄音幔睬，去河邊找鬼麻顶。笑死，一個胖子當(dāng)著我的面吹牛队萤，可吹牛的內(nèi)容都是我干的矫钓。我是一名探鬼主播，決...
沈念sama閱讀 38,432評論 3贊 401
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼赵辕，長吁一口氣：“原來是場噩夢啊……” “哼还惠！你這毒婦竟也來了私杜？” 一聲冷哼從身側(cè)響起蚕键，我...
開封第一講書人閱讀 37,088評論 0贊 261
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎歪今，沒想到半個月后嚎幸，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體颜矿，經(jīng)...
沈念sama閱讀 43,586評論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡寄猩，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,028評論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了骑疆。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片田篇。...
茶點(diǎn)故事閱讀 38,137評論 1贊 334
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖箍铭，靈堂內(nèi)的尸體忽然破棺而出泊柬，到底是詐尸還是另有隱情，我是刑警寧澤诈火，帶...
沈念sama閱讀 33,783評論 4贊 324
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布兽赁，位于F島的核電站，受9級特大地震影響刀崖，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜蜂莉，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,343評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一窖张、第九天我趴在偏房一處隱蔽的房頂上張望荤堪。院中可真熱鬧澄阳，春花似錦碎赢、人聲如沸肮塞。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,333評論 0贊 19
一樁弒父案涧黄，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽懊昨。三九已至酵颁，卻和暖如春躏惋，著一層夾襖步出監(jiān)牢的瞬間其掂，已是汗流浹背深寥。一陣腳步聲響...
開封第一講書人閱讀 31,559評論 1贊 262
情欲美人皮
我被黑心中介騙來泰國打工殉簸，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留般卑，地道東北人蝠检。一個月前我還...
沈念sama閱讀 45,595評論 2贊 355
代替公主和親
正文我出身青樓，卻偏偏與公主長得像焰檩，于是被迫代替她去往敵國和親析苫。傳聞我的和親對象是個殘疾皇子藤违，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,901評論 2贊 345

Unknown robot (identified by 'spider')是什么意思载庭？

Unknown robot (identified by 'spider')是什么意思囚聚？

推薦閱讀更多精彩內(nèi)容