從Github上淘來的爬蟲框架

好久好久,沒怎么寫東西会喝,就把從GitHub上淘來的各種各樣語言的爬蟲框架分享給大家陡叠。

Python

python自然不用多說,擁有的爬蟲框架數(shù)不勝數(shù)肢执。

  • scrapy枉阵,大名鼎鼎的爬蟲框架,功能強大预茄,乃入門學習的必備良藥兴溜。支持多種多樣的配置特性,唯一可惜不支持分布式的特性,于是就誕生了scrapy-redis這個以redis為隊列的分布式爬蟲框架拙徽。
  • pyspider刨沦,應該是個華人寫的爬蟲框架,可支持的配置非常多斋攀,同時也支持分布式已卷,只需要配置中間的消息隊列就可以。
  • portia淳蔼,可視化的爬蟲框架侧蘸,對于編程經(jīng)驗少的人來說相當適合學習。
  • xcrawler鹉梨,輕量級的爬蟲框架讳癌。個人很簡易從讀輕量級的爬蟲框架的源代碼入手,這樣能夠由淺入深存皂,學地更有意思晌坤。
  • cola,也是很強大的分布式爬蟲框架旦袋,只是可惜不支持python 3以上骤菠。
  • fetchman, 國人寫的爬蟲框架,采用grequests來并發(fā)請求疤孕∩毯酰看過源代碼,寫的容易理解祭阀,所以對于新手來說很實用鹉戚。
  • gain, 使用```asyncio``來異步爬取的輕量級爬蟲框架。代碼很容易理解专控,利于學習抹凳。

Java

Java接觸的不是很多,所以知道的爬蟲框架不多伦腐。

  • webmagic赢底,這個是國人寫的爬蟲框架,很好用柏蘑,也很強大颖系。源代碼的閱讀體驗也不錯,推薦寫java的可以去熟悉熟悉辩越。
  • crawler4j嘁扼, 比較好的爬蟲架構,對于學習和理解爬蟲框架很有用黔攒。
  • SeimiCrawler趁啸, 分布式爬蟲框架强缘,也是受到scrapy啟發(fā)。支持動態(tài)渲染的頁面爬蟲不傅。
  • elves, 輕量級的爬蟲框架旅掂,國人寫的。易于學習和理解访娶。

Node

node接觸的更加不多商虐,但是也淘到了不錯的幾個框架。

  • node-crawler,強大且流行崖疤。采用Cheerio這個包解析網(wǎng)頁結構秘车。
  • webster,高性能的NodeJs爬蟲框架,可爬取動態(tài)渲染的內容(通過headless Chrome)劫哼。

C#

C#作為筆者除了Python以外比較熟悉的語言了叮趴。但是發(fā)現(xiàn)其爬蟲框架少的可憐。哎权烧,不禁嘆息眯亦。

  • DotnetSpider,整體架構參照了WebMagicScrapy般码,是C#中比較強大的存在妻率。目前已經(jīng)支持.net core 2.0,所以板祝,喜歡C#的可以去玩玩宫静。還是比較不錯的支持Entity Framework
  • WebCrawler扔字,國人寫的輕量級的爬蟲框架∥录迹可以去學習學習~~~

就這樣吧~ 不知道下回什么時候寫文章革为。繼續(xù)去看書了!6媪邸震檩!再見~~想想,下回寫個什么東西玩玩呢蜓堕。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末抛虏,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子套才,更是在濱河造成了極大的恐慌迂猴,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,214評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件背伴,死亡現(xiàn)場離奇詭異沸毁,居然都是意外死亡峰髓,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評論 2 382
  • 文/潘曉璐 我一進店門息尺,熙熙樓的掌柜王于貴愁眉苦臉地迎上來携兵,“玉大人,你說我怎么就攤上這事搂誉⌒旖簦” “怎么了?”我有些...
    開封第一講書人閱讀 152,543評論 0 341
  • 文/不壞的土叔 我叫張陵炭懊,是天一觀的道長并级。 經(jīng)常有香客問我,道長凛虽,這世上最難降的妖魔是什么死遭? 我笑而不...
    開封第一講書人閱讀 55,221評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮凯旋,結果婚禮上呀潭,老公的妹妹穿的比我還像新娘。我一直安慰自己至非,他們只是感情好钠署,可當我...
    茶點故事閱讀 64,224評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著荒椭,像睡著了一般谐鼎。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上趣惠,一...
    開封第一講書人閱讀 49,007評論 1 284
  • 那天狸棍,我揣著相機與錄音,去河邊找鬼味悄。 笑死草戈,一個胖子當著我的面吹牛,可吹牛的內容都是我干的侍瑟。 我是一名探鬼主播唐片,決...
    沈念sama閱讀 38,313評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼涨颜!你這毒婦竟也來了费韭?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 36,956評論 0 259
  • 序言:老撾萬榮一對情侶失蹤庭瑰,失蹤者是張志新(化名)和其女友劉穎星持,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體弹灭,經(jīng)...
    沈念sama閱讀 43,441評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡钉汗,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 35,925評論 2 323
  • 正文 我和宋清朗相戀三年羹令,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片损痰。...
    茶點故事閱讀 38,018評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡福侈,死狀恐怖,靈堂內的尸體忽然破棺而出卢未,到底是詐尸還是另有隱情肪凛,我是刑警寧澤,帶...
    沈念sama閱讀 33,685評論 4 322
  • 正文 年R本政府宣布辽社,位于F島的核電站伟墙,受9級特大地震影響,放射性物質發(fā)生泄漏滴铅。R本人自食惡果不足惜戳葵,卻給世界環(huán)境...
    茶點故事閱讀 39,234評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望汉匙。 院中可真熱鬧拱烁,春花似錦、人聲如沸噩翠。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽伤锚。三九已至擅笔,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間屯援,已是汗流浹背猛们。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評論 1 261
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留狞洋,地道東北人弯淘。 一個月前我還...
    沈念sama閱讀 45,467評論 2 352
  • 正文 我出身青樓,卻偏偏與公主長得像徘铝,于是被迫代替她去往敵國和親耳胎。 傳聞我的和親對象是個殘疾皇子惯吕,可洞房花燭夜當晚...
    茶點故事閱讀 42,762評論 2 345

推薦閱讀更多精彩內容