之前給大家分享如何用excel爬取網(wǎng)站數(shù)據(jù)稽坤,有人說(shuō)我還要裝個(gè)excel丈甸,而且office是收費(fèi)的,有沒(méi)有可以推薦我們小白用戶(hù)的方法呢尿褪?
今天我就給大家介紹一個(gè)方法睦擂,你的電腦只需要有一個(gè)瀏覽器即可,今天我們給大家分享一個(gè)數(shù)據(jù)爬取的網(wǎng)站造數(shù)杖玲,我用了快半年顿仇,基本上網(wǎng)站稍微復(fù)雜一些的,我就會(huì)用他去爬取數(shù)據(jù)天揖,他具有可視化操作界面夺欲。
我們今天就抓取京東購(gòu)物網(wǎng)站的筆記本商品列表頁(yè),作為案例分享給大家今膊。
Step1我們把網(wǎng)址放進(jìn)網(wǎng)站里些阅,點(diǎn)擊開(kāi)始爬取
Step2鼠標(biāo)選中想爬取的數(shù)據(jù),我選中商品詳情頁(yè)斑唬,價(jià)格市埋,商品標(biāo)題,評(píng)分?jǐn)?shù)量恕刘,以及商品標(biāo)簽等缤谎,點(diǎn)擊完成創(chuàng)建。
Step3 點(diǎn)擊立即執(zhí)行褐着,網(wǎng)站就開(kāi)始爬取你想要的數(shù)據(jù)
Step4坷澡,爬取完成后,你可以選擇在線(xiàn)預(yù)覽含蓉,也可以選擇下載到本地
這個(gè)時(shí)候有的同學(xué)會(huì)問(wèn)我如果爬取數(shù)據(jù)有分頁(yè)怎么辦频敛,這個(gè)也可以解決项郊。
首先你在京東商品列表中,多點(diǎn)擊幾次下一頁(yè)斟赚,發(fā)現(xiàn)網(wǎng)址的規(guī)律“着降?page=頁(yè)數(shù)”;
然后在爬取網(wǎng)址設(shè)置選擇網(wǎng)址生成規(guī)則
整個(gè)爬取工作就完成了拗军,是不是很容易哈任洞。下次分享給大家如果有的網(wǎng)站需要登錄才能爬取數(shù)據(jù)的解決方法?