rogerbot 爬蟲介紹

Rogerbot 是 Moz Pro Campaign 網站審核的 Moz 爬蟲。它與 Dotbot 不同，Dotbot 是為鏈接索引提供支持的網絡爬蟲叶圃。Rogerbot 訪問您網站的代碼以將報告發(fā)送回您的 Moz Pro Campaign。這可以幫助您了解您的網站并教您如何解決可能影響您的排名的問題塞赂。Rogerbot 為您的站點抓取報告春叫、按需抓取噪矛、頁面優(yōu)化報告和頁面評分器提供數(shù)據(jù)小渊。

Rogerbot 是如何處理 Robots.txt 文件

Rogerbot 旨在遵守 robots.txt 文件放可。您可以使用這個奇妙的文件來通知機器人它們應該如何在您的站點上運行谒臼。這有點像行為準則：你知道朝刊，脫掉你的鞋子，遠離餐廳蜈缤，把那些肘部從桌子上拿開拾氓，天哪！之類的東西底哥。

每個站點都應該有一個 robots.txt 文件咙鞍。您可以通過訪問 www.pdflibr.com/robots.txt 來檢查它是否存在。您還可以檢查任何其他站點的 robots.txt 文件趾徽，只是為了好玩续滋。例如：pdf-lib.org/robots.txt、baidu.com/robots.txt孵奶，是的疲酌，甚至是 google.com/robots.txt。任何人都可以看到您的 robots.txt 文件了袁；它是公開的朗恳，所以請記住這一點。

如果您的網站沒有 robots.txt 文件载绿、您的 robots.txt 文件無法加載或返回錯誤粥诫，Rogerbot 可能無法抓取您的網站。這也可能導致導致服務器日志膨脹的錯誤卢鹦。您需要在文件中包含一些內容臀脏，因為空白文件可能會使檢查您的站點是否正確設置的人感到困惑劝堪。他們可能認為這是一個錯誤冀自。即使您沒有阻止任何機器人，配置了某些內容的文件也是可取的秒啦。

Rogerbot 用戶代理

要直接與 rogerbot 交談熬粗，您可以通過他們的名字（也稱為用戶代理）來稱呼他們。Rogerbot 用戶代理是：rogerbot余境。

如何通過 Robots.txt 允許 Rogerbot 抓取您的網站

要告訴 rogerbot 它可以抓取您網站上的所有頁面驻呐，您可以在 robots.txt 文件這樣寫：

User-agent: rogerbot

Disallow:

disallow: 之后的字段為空，則特別表示不應阻止任何 URL芳来。

通過 Robots.txt 阻止 Rogerbot 抓取您的網站

如果您厭倦了 rogerbot 抓取您的網站含末，您可以通過在 robots.txt 文件中的 disallow 指令后添加斜杠 ("/") 來阻止抓取工具。那就是說：“Rogerbot即舌，您無法訪問這些頁面中的任何一個佣盒，該站點上的所有頁面都不適合您，請遠離顽聂，伙計肥惭《⒁牵”

使用您的 robots.txt 文件阻止 rogerbot 如下所示：

User-agent: rogerbot

Disallow: /

注意表示站點根目錄的斜線。添加此代碼將阻止 rogerbot 抓取您的網站所有頁面蜜葱。

您還可以從站點的某些部分（例如子文件夾）中排除 rogerbot全景。下面是阻止 rogerbot 抓取您某個目錄的所有頁面：

User-agent: rogerbot

Disallow: */manage/*

此語法僅告訴 Rogerbot 爬蟲不要爬取任何包含此 URL 字符串的頁面，例如：www.pdflibr.com/marketplace/

建議您在進行更改后使用這個機器人檢查器工具檢查您的 robots.txt 文件牵囤，以避免任何令人討厭的意外爸黄。

通過 Robots.txt 爬行延遲以減慢 Rogerbot 爬蟲對您網站的抓取速度

rogertbot 希望盡可能快地抓取您的網站，以便能夠及時完成抓取揭鳞，而不會給您的人類訪問者帶來問題馆纳。

如果您想減慢 rogerbot 的速度，可以使用 Crawl Delay 指令汹桦。以下指令僅允許 rogerbot 每 10 秒訪問一次您的站點鲁驶，下面是 robots.txt 的具體寫法：

User-agent: rogerbot

Crawl-delay: 10

請記住，當您考慮一天有 86,400 秒時舞骆，這將允許 Rogerbot 在一天內訪問 8,640 個頁面钥弯，因此如果您有很多頁面要抓取，這可能意味著抓取您的網站需要一段時間督禽。

不建議添加大于 30 秒的抓取延遲脆霎，否則 rogerbot 可能無法完成對您網站的抓取。

Rogerbot 的 IP 范圍

不幸的是狈惫，rogerbot 不使用靜態(tài) IP 地址或 IP 地址范圍睛蛛，因為 rogerbot 爬蟲設計為采用動態(tài)方法。這意味著 rogerbot 使用數(shù)千個動態(tài) IP 地址胧谈，每次運行爬網時這些地址都會發(fā)生變化忆肾。這種方法提供了最好的網絡動態(tài)視圖，但它可能使我們與某些服務器或托管服務提供商不兼容菱肖。

最好的選擇是通過用戶代理識別爬蟲：rogerbot客冈。

阻止 Rogerbot 訪問動態(tài)頁面

阻止 rogerbot 的爬蟲訪問這些動態(tài)標記頁面的最佳方法是使用您的 robots.txt 文件中的 disallow 指令阻止它訪問它們。它看起來像這樣：

User-agent: Rogerbot

Disallow: /TAG TYPE

通過 Robots.txt 阻止除 Rogerbot 之外的所有機器人

確保在“所有機器人指令”上方有“用戶代理特定指令”稳强，例如下面的寫法：

User-agent: rogerbot

Disallow:

User-agent: *

Disallow: /

rogerbot 是否支持“allow”指令场仲？

rogerbot 支持“allow”指令。

要允許在目錄中抓取頁面退疫，同時禁止 rogerbot 訪問目錄的其余部分渠缕，您可以在 robots.txt 文件中添加如下內容：

User-agent: rogerbot

Allow: /crawler/roger-bot

Disallow: /crawler/

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市褒繁，隨后出現(xiàn)的幾起案子亦鳞，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 222,590評論 6贊 517
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件蚜迅，死亡現(xiàn)場離奇詭異舵匾，居然都是意外死亡，警方通過查閱死者的電腦和手機谁不，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 95,157評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門坐梯，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人刹帕，你說我怎么就攤上這事吵血。” “怎么了偷溺？”我有些...
開封第一講書人閱讀 169,301評論 0贊 362
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵蹋辅，是天一觀的道長。經常有香客問我挫掏，道長侦另，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 60,078評論 1贊 300
?港島之戀（遺憾婚禮）
正文為了忘掉前任尉共，我火速辦了婚禮褒傅，結果婚禮上，老公的妹妹穿的比我還像新娘袄友。我一直安慰自己殿托，他們只是感情好，可當我...
茶點故事閱讀 69,082評論 6贊 398
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布剧蚣。她就那樣靜靜地躺著支竹，像睡著了一般。火紅的嫁衣襯著肌膚如雪鸠按。梳的紋絲不亂的頭發(fā)上礼搁，一...
開封第一講書人閱讀 52,682評論 1贊 312
城市分裂傳說
那天，我揣著相機與錄音待诅，去河邊找鬼叹坦。笑死熊镣，一個胖子當著我的面吹牛卑雁，可吹牛的內容都是我干的。我是一名探鬼主播绪囱，決...
沈念sama閱讀 41,155評論 3贊 422
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼测蹲，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了鬼吵？” 一聲冷哼從身側響起扣甲，我...
開封第一講書人閱讀 40,098評論 0贊 277
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后琉挖，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體启泣，經...
沈念sama閱讀 46,638評論 1贊 319
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 38,701評論 3贊 342
?白月光啟示錄
正文我和宋清朗相戀三年示辈，在試婚紗的時候發(fā)現(xiàn)自己被綠了寥茫。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,852評論 1贊 353
活死人
序言：一個原本活蹦亂跳的男人離奇死亡矾麻，死狀恐怖纱耻，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情险耀，我是刑警寧澤弄喘，帶...
沈念sama閱讀 36,520評論 5贊 351
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站甩牺，受9級特大地震影響蘑志，放射性物質發(fā)生泄漏。R本人自食惡果不足惜贬派，卻給世界環(huán)境...
茶點故事閱讀 42,181評論 3贊 335
男人毒藥：我在死后第九天來索命
文/蒙蒙一卖漫、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧赠群，春花似錦羊始、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,674評論 0贊 25
一樁弒父案突委，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至冬三，卻和暖如春匀油，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背勾笆。一陣腳步聲響...
開封第一講書人閱讀 33,788評論 1贊 274
情欲美人皮
我被黑心中介騙來泰國打工敌蚜，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人窝爪。一個月前我還...
沈念sama閱讀 49,279評論 3贊 379
代替公主和親
正文我出身青樓弛车，卻偏偏與公主長得像，于是被迫代替她去往敵國和親蒲每。傳聞我的和親對象是個殘疾皇子纷跛，可洞房花燭夜當晚...
茶點故事閱讀 45,851評論 2贊 361