scrapy-4.pipeline

pipeline是清洗數(shù)據(jù)存入數(shù)據(jù)庫的
清洗數(shù)據(jù)看每個(gè)人的需求,但是存入數(shù)據(jù)庫是有套路的痕寓。
就是在這個(gè)class里有三個(gè)def傲醉,一個(gè)是open_spider,一個(gè)是close_spider呻率,一個(gè)是process_item硬毕,存入sqlite3基本都是這個(gè)套路,需要注意的是數(shù)據(jù)庫的列名要和items的一致礼仗。


# Define your item pipelines here
#
# Don't forget to add your pipeline to the ITEM_PIPELINES setting
# See: https://doc.scrapy.org/en/latest/topics/item-pipeline.html
import sqlite3

class ZdmPipeline(object):
    def open_spider(self,spider):
        self.conn = sqlite3.connect('test.sqlite')
        self.cur = self.conn.cursor()
        self.cur.execute('CREATE TABLE IF NOT EXISTS sm(name varchar(100),price varchar(50))')

    def close_spider(self,spider):
        self.conn.commit()
        self.conn.close()

    def process_item(self, item, spider):
        sql = 'insert into sm({}) VALUES ({})'
        col = ','.join(item.keys())
        holder = ','.join(len(item)*'?')
        self.cur.execute(sql.format(col,holder),list(item.values()))
        return item

最后按照注釋所說去settings把對(duì)應(yīng)的pipeline打開吐咳,就是取消注釋逻悠。


settings

如果有多個(gè)需求比如要先處理數(shù)據(jù)然后在存入數(shù)據(jù)庫,就寫多個(gè)class韭脊,然后在settings里添加多個(gè)pipeline童谒,數(shù)字小的先開始運(yùn)行。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末乾蓬,一起剝皮案震驚了整個(gè)濱河市惠啄,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌任内,老刑警劉巖撵渡,帶你破解...
    沈念sama閱讀 211,265評(píng)論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異死嗦,居然都是意外死亡趋距,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,078評(píng)論 2 385
  • 文/潘曉璐 我一進(jìn)店門越除,熙熙樓的掌柜王于貴愁眉苦臉地迎上來节腐,“玉大人,你說我怎么就攤上這事摘盆∫砣福” “怎么了?”我有些...
    開封第一講書人閱讀 156,852評(píng)論 0 347
  • 文/不壞的土叔 我叫張陵孩擂,是天一觀的道長(zhǎng)狼渊。 經(jīng)常有香客問我,道長(zhǎng)类垦,這世上最難降的妖魔是什么狈邑? 我笑而不...
    開封第一講書人閱讀 56,408評(píng)論 1 283
  • 正文 為了忘掉前任,我火速辦了婚禮蚤认,結(jié)果婚禮上米苹,老公的妹妹穿的比我還像新娘。我一直安慰自己砰琢,他們只是感情好蘸嘶,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,445評(píng)論 5 384
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著氯析,像睡著了一般亏较。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上掩缓,一...
    開封第一講書人閱讀 49,772評(píng)論 1 290
  • 那天雪情,我揣著相機(jī)與錄音,去河邊找鬼你辣。 笑死巡通,一個(gè)胖子當(dāng)著我的面吹牛尘执,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播宴凉,決...
    沈念sama閱讀 38,921評(píng)論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼誊锭,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了弥锄?” 一聲冷哼從身側(cè)響起丧靡,我...
    開封第一講書人閱讀 37,688評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎籽暇,沒想到半個(gè)月后温治,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,130評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡戒悠,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,467評(píng)論 2 325
  • 正文 我和宋清朗相戀三年熬荆,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片绸狐。...
    茶點(diǎn)故事閱讀 38,617評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡卤恳,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出寒矿,到底是詐尸還是另有隱情突琳,我是刑警寧澤,帶...
    沈念sama閱讀 34,276評(píng)論 4 329
  • 正文 年R本政府宣布符相,位于F島的核電站本今,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏主巍。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,882評(píng)論 3 312
  • 文/蒙蒙 一挪凑、第九天 我趴在偏房一處隱蔽的房頂上張望孕索。 院中可真熱鬧,春花似錦躏碳、人聲如沸搞旭。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,740評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽肄渗。三九已至,卻和暖如春咬最,著一層夾襖步出監(jiān)牢的瞬間翎嫡,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,967評(píng)論 1 265
  • 我被黑心中介騙來泰國(guó)打工永乌, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留惑申,地道東北人具伍。 一個(gè)月前我還...
    沈念sama閱讀 46,315評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像圈驼,于是被迫代替她去往敵國(guó)和親人芽。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,486評(píng)論 2 348

推薦閱讀更多精彩內(nèi)容

  • https://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml 下載即可绩脆。 安裝...
    慫恿的大腦閱讀 1,253評(píng)論 0 7
  • 總結(jié)一下之前的spider萤厅,總的來說,Spider類就是定義了如何爬取某個(gè)(或某些)網(wǎng)站靴迫。包括了爬取的動(dòng)作以及如何...
    王小魚鱻閱讀 1,226評(píng)論 0 2
  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理惕味,服務(wù)發(fā)現(xiàn),斷路器矢劲,智...
    卡卡羅2017閱讀 134,629評(píng)論 18 139
  • scrapy學(xué)習(xí)筆記(有示例版) 我的博客 scrapy學(xué)習(xí)筆記1.使用scrapy1.1創(chuàng)建工程1.2創(chuàng)建爬蟲模...
    陳思煜閱讀 12,668評(píng)論 4 46
  • 如果你想被愛赦拘,想獲得一份真正的愛情,一定先認(rèn)清自己芬沉,清楚地知道自己要什么躺同,當(dāng)愛情來臨的時(shí)候,一定要多花點(diǎn)心思丸逸,好好經(jīng)營(yíng)蹋艺。
    主持人梓惟閱讀 175評(píng)論 0 0