抓取

# cnblogs.py
from urllib2 import parse
from scrapy import Request

class CnblogsSpider(scrapy.spider):
    name = 'cnblogs'
    allowed_domains = ['news.cnblogs.com']
    start_urls = ['http://news.cnblogs.com/']
    
    # 獲取新聞列表頁(yè)中的新聞url 并交給 scrapy 進(jìn)行下載后調(diào)用相應(yīng)的解析方法
    # 獲取下一頁(yè)的url并交給scrapy進(jìn)行下載, 下載完成后交給parse繼續(xù)跟進(jìn)
    def parse(self, response):
        post_nodes = response.css('.news_block') # 獲取列表頁(yè)的信息
        for post in post_nodes:
            image_url = post.css('.entry_summary a img::attr(src)').extract_first() # 略縮圖地址
            post_url = post.css('.news_entry a::attr(href)').extract_first() # 文章url地址
            request_url = parse.urljoin(response.url, post_url
            # 用 Request 返回生成器, 用meta來(lái)傳遞參數(shù)
            # 將request_url返回后的數(shù)據(jù)交給parse_detail異步處理
            yield Request(url=request_url, meta={"front_image_url": image_url}, callback=self.parse_detail)

    def parse_detail(self, response):
        pass
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末暂殖,一起剝皮案震驚了整個(gè)濱河市儒陨,隨后出現(xiàn)的幾起案子宁仔,更是在濱河造成了極大的恐慌项贺,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,204評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡队他,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門(mén)峻村,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)麸折,“玉大人,你說(shuō)我怎么就攤上這事雀哨】牧拢” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,548評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵雾棺,是天一觀的道長(zhǎng)膊夹。 經(jīng)常有香客問(wèn)我,道長(zhǎng)捌浩,這世上最難降的妖魔是什么放刨? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,657評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮尸饺,結(jié)果婚禮上进统,老公的妹妹穿的比我還像新娘。我一直安慰自己浪听,他們只是感情好螟碎,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,689評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著迹栓,像睡著了一般掉分。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上克伊,一...
    開(kāi)封第一講書(shū)人閱讀 51,554評(píng)論 1 305
  • 那天酥郭,我揣著相機(jī)與錄音,去河邊找鬼愿吹。 笑死不从,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的犁跪。 我是一名探鬼主播椿息,決...
    沈念sama閱讀 40,302評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼歹袁,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了寝优?” 一聲冷哼從身側(cè)響起宇攻,我...
    開(kāi)封第一講書(shū)人閱讀 39,216評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎倡勇,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體嘉涌,經(jīng)...
    沈念sama閱讀 45,661評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡妻熊,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,851評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了仑最。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片扔役。...
    茶點(diǎn)故事閱讀 39,977評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖警医,靈堂內(nèi)的尸體忽然破棺而出亿胸,到底是詐尸還是另有隱情,我是刑警寧澤预皇,帶...
    沈念sama閱讀 35,697評(píng)論 5 347
  • 正文 年R本政府宣布侈玄,位于F島的核電站,受9級(jí)特大地震影響吟温,放射性物質(zhì)發(fā)生泄漏序仙。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,306評(píng)論 3 330
  • 文/蒙蒙 一鲁豪、第九天 我趴在偏房一處隱蔽的房頂上張望潘悼。 院中可真熱鬧,春花似錦爬橡、人聲如沸治唤。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,898評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)宾添。三九已至,卻和暖如春郭宝,著一層夾襖步出監(jiān)牢的瞬間辞槐,已是汗流浹背。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,019評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工粘室, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留榄檬,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,138評(píng)論 3 370
  • 正文 我出身青樓衔统,卻偏偏與公主長(zhǎng)得像鹿榜,于是被迫代替她去往敵國(guó)和親海雪。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,927評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容