A Web Crawler With asyncio Coroutines

500 lines 是個不錯的大牛編寫程序稠肘,值得好好學(xué)習(xí),web爬蟲這個項目需要爬取page的所有l(wèi)ink项阴,采用異步并發(fā)的操作。

異步并發(fā)的設(shè)計

由于connection的量會比較大环揽,所以需要選擇高效的高并發(fā)處理操作。
如果采用多線程歉胶,一個進程多個線程會導(dǎo)致線程之間頻繁切換,效率低,還耗電通今。
可以采用select,epoll的異步非阻塞IO,并在請求回來數(shù)據(jù)后衡创,異步調(diào)用回調(diào)函數(shù)。這樣耗費的資源比較低璃氢。
雖然如此,但是還不夠高效一也,最后一把利器,協(xié)程椰苟。協(xié)程就是用戶執(zhí)行態(tài)的程序間切換。python的實現(xiàn)用到了yield 迭代器的next(),send()方法.

@asyncio.coroutine   aiohttp.clientSession

如果想深入了解異步并發(fā)舆蝴,關(guān)鍵詞:aiohttp, asyncio,yield

##測試性能比較快的sanic+uvloop
from sanic import Sanic
from sanic.response import json
app = Sanic(__name__)
@app.route('/get')
async def test(request):
    a = request.args.get('a')
    return json({'args': {'a': a}})
if __name__ == '__main__':
    app.run(host='127.0.0.1', port=8000)

代碼風(fēng)格

  1. 日志打印
    以文件為模塊,打印日志题诵,一個模塊僅有唯一的全局變量logger句柄
LOGGER = logging.getLogger(__nam__)

輸出類型可選,LOGGER.info(),LOGGER.error

  1. 參數(shù)有多個的時候應(yīng)該換行
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末层皱,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子叫胖,更是在濱河造成了極大的恐慌,老刑警劉巖瓮增,帶你破解...
    沈念sama閱讀 221,820評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異绷跑,居然都是意外死亡,警方通過查閱死者的電腦和手機砸捏,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,648評論 3 399
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來带膜,“玉大人,你說我怎么就攤上這事膝藕。” “怎么了芭挽?”我有些...
    開封第一講書人閱讀 168,324評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長蠕趁。 經(jīng)常有香客問我,道長辛馆,這世上最難降的妖魔是什么俺陋? 我笑而不...
    開封第一講書人閱讀 59,714評論 1 297
  • 正文 為了忘掉前任昙篙,我火速辦了婚禮,結(jié)果婚禮上苔可,老公的妹妹穿的比我還像新娘。我一直安慰自己焚辅,他們只是感情好苟鸯,可當(dāng)我...
    茶點故事閱讀 68,724評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著倔毙,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上卵蛉,一...
    開封第一講書人閱讀 52,328評論 1 310
  • 那天,我揣著相機與錄音傻丝,去河邊找鬼。 笑死葡缰,一個胖子當(dāng)著我的面吹牛亏掀,可吹牛的內(nèi)容都是我干的泛释。 我是一名探鬼主播,決...
    沈念sama閱讀 40,897評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼怜校,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了茄茁?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,804評論 0 276
  • 序言:老撾萬榮一對情侶失蹤裙顽,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后愈犹,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,345評論 1 318
  • 正文 獨居荒郊野嶺守林人離奇死亡漩怎,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,431評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了牙言。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,561評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡咱枉,死狀恐怖卑硫,靈堂內(nèi)的尸體忽然破棺而出蚕断,到底是詐尸還是另有隱情,我是刑警寧澤亿乳,帶...
    沈念sama閱讀 36,238評論 5 350
  • 正文 年R本政府宣布,位于F島的核電站葛假,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏聊训。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,928評論 3 334
  • 文/蒙蒙 一带斑、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧勋磕,春花似錦、人聲如沸挂滓。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,417評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至亲怠,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間团秽,已是汗流浹背主胧。 一陣腳步聲響...
    開封第一講書人閱讀 33,528評論 1 272
  • 我被黑心中介騙來泰國打工踪栋, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人图毕。 一個月前我還...
    沈念sama閱讀 48,983評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像囤官,于是被迫代替她去往敵國和親冬阳。 傳聞我的和親對象是個殘疾皇子党饮,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,573評論 2 359

推薦閱讀更多精彩內(nèi)容