使用scrapy 爬糗百

自學(xué)Python上渴，還在學(xué)習(xí)中岸梨，如有問(wèn)題請(qǐng)留言，大家共勉

開(kāi)發(fā)工具：PyCharm
使用框架：srcapy

步驟

1 安裝Scrapy：pip3 install srcapy
2 創(chuàng)建工程:scrapy startproject mySpider
3 目錄結(jié)構(gòu)如下：
mySpider/
scrapy.cfg
mySpider/
init.py
items.py
pipelines.py
settings.py
spiders/
init.py
- mySpider/:工程目錄
- scrapy.cfg: 項(xiàng)目的配置文件
- mySpider/items.py: 項(xiàng)目中的item文件.
- mySpider/pipelines.py: 項(xiàng)目中的pipelines文件.
- mySpider/settings.py: 項(xiàng)目的設(shè)置文件.
- mySpider/spiders/: 放置spider代碼的目錄.
4 添加代碼
- 在items.py 中添加類QiuBaiItem稠氮，代碼如下：
  class QiuBaiItem(Item):
  userName = scrapy.Field()
  content = scrapy.Field()
- 在spiders目錄下創(chuàng)建python 文件 qiubai_spider.py
- 在該文件中創(chuàng)建類 QiubaiSpider曹阔，代碼如下：
  class QiubaiSpider(Spider):
  name = 'qiubai'
  start_urls = [
  'http://www.qiushibaike.com'
  ]
  def parse(self, response):
  for item in response.xpath('//div[@id="content-left"]/div[@class="article block untagged mb15"]'):
  qiubai = QiuBaiItem()
  userName = item.xpath('./div[@class="author clearfix"]/a[2]/h2/text()').extract()
  if userName:
  userName = userName[0]
  qiubai['userName'] = userName
```
                        content = item.xpath('./a[@class="contentHerf"]/div[@class="content"]/span/text()').extract()            
                        if content:                
                                 con = ''                
                                 for str in content:                    
                                          con += str                
                                          qiubai['content'] = con        

                        yield qiubai
```
5 在 items.py 同級(jí)目錄下創(chuàng)建 manage.py，代碼如下：
from scrapy.cmdline import
```
  executeexecute()
```
6 點(diǎn)擊Run -> Edit Configuraction括袒，
Name：糗百（這個(gè)隨意）次兆；
Scrip 選在 manage.py稿茉；
Script parameters 填寫 crawl qiubai
7 進(jìn)入settings.py锹锰，添加USER_AGENT
在線查看USER_AGENT
USER_AGENT = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_2) AppleWebKit/602.3.12 (KHTML, like Gecko) Version/10.0.2 Safari/602.3.12'

完成以上7 步就可以直接運(yùn)行了。
如果你想輸出到文件漓库，則可以在 Script parameters 填寫

     crawl qiubai -o qiubai_items.json

最后編輯于：2017.12.05 03:32:40

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末恃慧，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子渺蒿，更是在濱河造成了極大的恐慌痢士，老刑警劉巖，帶你破解...
沈念sama閱讀 206,126評(píng)論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異怠蹂，居然都是意外死亡善延，警方通過(guò)查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,254評(píng)論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門城侧，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)易遣，“玉大人，你說(shuō)我怎么就攤上這事嫌佑《姑＃” “怎么了？”我有些...
開(kāi)封第一講書人閱讀 152,445評(píng)論 0贊 341
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵屋摇，是天一觀的道長(zhǎng)揩魂。經(jīng)常有香客問(wèn)我，道長(zhǎng)炮温，這世上最難降的妖魔是什么火脉？我笑而不...
開(kāi)封第一講書人閱讀 55,185評(píng)論 1贊 278
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮柒啤，結(jié)果婚禮上忘分，老公的妹妹穿的比我還像新娘。我一直安慰自己白修，他們只是感情好妒峦，可當(dāng)我...
茶點(diǎn)故事閱讀 64,178評(píng)論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布。她就那樣靜靜地躺著兵睛，像睡著了一般肯骇。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上祖很，一...
開(kāi)封第一講書人閱讀 48,970評(píng)論 1贊 284
城市分裂傳說(shuō)
那天笛丙，我揣著相機(jī)與錄音，去河邊找鬼假颇。笑死胚鸯，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的笨鸡。我是一名探鬼主播姜钳，決...
沈念sama閱讀 38,276評(píng)論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼形耗！你這毒婦竟也來(lái)了哥桥？” 一聲冷哼從身側(cè)響起，我...
開(kāi)封第一講書人閱讀 36,927評(píng)論 0贊 259
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤激涤，失蹤者是張志新（化名）和其女友劉穎拟糕，沒(méi)想到半個(gè)月后，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 43,400評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡送滞，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,883評(píng)論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年侠草，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片犁嗅。...
茶點(diǎn)故事閱讀 37,997評(píng)論 1贊 333
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡梦抢，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出愧哟，到底是詐尸還是另有隱情奥吩，我是刑警寧澤，帶...
沈念sama閱讀 33,646評(píng)論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布蕊梧，位于F島的核電站霞赫，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏肥矢。R本人自食惡果不足惜端衰，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,213評(píng)論 3贊 307
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望甘改。院中可真熱鬧旅东，春花似錦、人聲如沸十艾。這莊子的主人今日做“春日...
開(kāi)封第一講書人閱讀 30,204評(píng)論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)忘嫉。三九已至荤牍，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間庆冕，已是汗流浹背康吵。一陣腳步聲響...
開(kāi)封第一講書人閱讀 31,423評(píng)論 1贊 260
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留访递，地道東北人晦嵌。一個(gè)月前我還...
沈念sama閱讀 45,423評(píng)論 2贊 352
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像拷姿，于是被迫代替她去往敵國(guó)和親惭载。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,722評(píng)論 2贊 345

使用scrapy 爬糗百

自學(xué)Python上渴，還在學(xué)習(xí)中岸梨，如有問(wèn)題請(qǐng)留言，大家共勉

步驟

推薦閱讀更多精彩內(nèi)容