八忌傻、json文件

一大脉、制作一個保存json的pipeline

1、首先為什么要搞這個json呢水孩?

因為對于沒有數(shù)據(jù)庫的人而言镰矿,你總要有個地方存儲你的數(shù)據(jù)吧,那么久可以通過寫入json文件中俘种。

2秤标、代碼如下:

import codecs

import json

classJsonWithEncodingPipeline(object):

def__init__(self):

self.file = codecs.open('article.json','w',encoding="utf-8")#用codecs完成文件的打開和寫入

defprocess_item(self, item,spider):

lines = json.dumps(dict(item),ensure_ascii=False) +"\n"

self.file.write(lines)

returnitem

defspider_closed(self,spider):

self.file.close()

3、setting中的配置

ITEM_PIPELINES= {

'mm.pipelines.MmPipeline':300,

# 'scrapy.pipelines.images.ImagesPipeline': 1,

'mm.pipelines.ArticleImagePipeline':1,

'mm.pipelines.JsonWithEncodingPipeline':2,

}

4宙刘、將item導(dǎo)出成json格式的文件苍姜,json就被寫入了



5、用scrapy提供的json export導(dǎo)出json文件

from scrapy.exportersimport JsonItemExporter

class JsonExporterPipleline (object):

# 調(diào)用scrapy提供的json export導(dǎo)出json文件,專門用來導(dǎo)封面照片用的

def__init__(self):

self.file =open('articleexport.json','wb')

self.exporter = JsonItemExporter (self.file,encoding="utf-8",ensure_ascii=False)

self.exporter.start_exporting ()

defclose_spider(self,spider):

self.exporter.finish_exporting()

self.file.close()

defprocess_item(self, item,spider):

self.exporter.export_item ( item )

return item


6悬包、JsonExporterPipleline和JsonWithEncodingPipeline區(qū)別

準(zhǔn)確地講之前的JsonWithEncodingPipeline相當(dāng)于一堆資料衙猪,那么這堆資料你怎么拜訪了,是xml格式布近,還是csv格式垫释,還是json格式,那么fromscrapy.exportersimportJsonItemExporter就可以幫助分類吊输,command+JsonItemExporter可以看到多動的格式文件饶号。

如下:

['BaseItemExporter','PprintItemExporter','PickleItemExporter',

'CsvItemExporter','XmlItemExporter','JsonLinesItemExporter',

'JsonItemExporter','MarshalItemExporter']

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市季蚂,隨后出現(xiàn)的幾起案子茫船,更是在濱河造成了極大的恐慌琅束,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,294評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件算谈,死亡現(xiàn)場離奇詭異涩禀,居然都是意外死亡,警方通過查閱死者的電腦和手機然眼,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,493評論 3 385
  • 文/潘曉璐 我一進店門艾船,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人高每,你說我怎么就攤上這事屿岂。” “怎么了鲸匿?”我有些...
    開封第一講書人閱讀 157,790評論 0 348
  • 文/不壞的土叔 我叫張陵爷怀,是天一觀的道長。 經(jīng)常有香客問我带欢,道長运授,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,595評論 1 284
  • 正文 為了忘掉前任乔煞,我火速辦了婚禮吁朦,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘渡贾。我一直安慰自己逗宜,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,718評論 6 386
  • 文/花漫 我一把揭開白布空骚。 她就那樣靜靜地躺著锦溪,像睡著了一般。 火紅的嫁衣襯著肌膚如雪府怯。 梳的紋絲不亂的頭發(fā)上刻诊,一...
    開封第一講書人閱讀 49,906評論 1 290
  • 那天,我揣著相機與錄音牺丙,去河邊找鬼则涯。 笑死,一個胖子當(dāng)著我的面吹牛冲簿,可吹牛的內(nèi)容都是我干的粟判。 我是一名探鬼主播,決...
    沈念sama閱讀 39,053評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼峦剔,長吁一口氣:“原來是場噩夢啊……” “哼档礁!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起吝沫,我...
    開封第一講書人閱讀 37,797評論 0 268
  • 序言:老撾萬榮一對情侶失蹤呻澜,失蹤者是張志新(化名)和其女友劉穎递礼,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體羹幸,經(jīng)...
    沈念sama閱讀 44,250評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡脊髓,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,570評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了栅受。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片将硝。...
    茶點故事閱讀 38,711評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖屏镊,靈堂內(nèi)的尸體忽然破棺而出依疼,到底是詐尸還是另有隱情,我是刑警寧澤而芥,帶...
    沈念sama閱讀 34,388評論 4 332
  • 正文 年R本政府宣布涛贯,位于F島的核電站,受9級特大地震影響蔚出,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜虫腋,卻給世界環(huán)境...
    茶點故事閱讀 40,018評論 3 316
  • 文/蒙蒙 一骄酗、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧悦冀,春花似錦趋翻、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,796評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至历等,卻和暖如春讨惩,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背寒屯。 一陣腳步聲響...
    開封第一講書人閱讀 32,023評論 1 266
  • 我被黑心中介騙來泰國打工荐捻, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人寡夹。 一個月前我還...
    沈念sama閱讀 46,461評論 2 360
  • 正文 我出身青樓处面,卻偏偏與公主長得像,于是被迫代替她去往敵國和親菩掏。 傳聞我的和親對象是個殘疾皇子魂角,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,595評論 2 350

推薦閱讀更多精彩內(nèi)容