? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 實驗報告
趙靜 ? ?信管 ? 2014141093041
阿里云? IP:120.24.46.77? ? ? 系統(tǒng)用戶名: root
第一步:連接服務器
第二步:激活并且進入虛擬環(huán)境
第三步:本地編寫spider代碼并上傳
抓取html
此時文件為py文件店诗,并且把它放入name下的spiders文件夾下面
scrapy crawl slx_quotes
find / -name slx-quotes-1.html
生成html文件
第四步:Scrapy爬取多頁Json數(shù)據(jù)
本地編寫Spiders文件
crapy crawl slx_quotes_spider -o zj_777777.json
生成json文件