在使用過(guò)多種爬蟲軟件后,終于找到一個(gè)簡(jiǎn)單易用且免費(fèi)的數(shù)據(jù)采集器拆吆。對(duì)于編程基礎(chǔ)不是很強(qiáng)的數(shù)據(jù)分析人員來(lái)說(shuō)狼电,爬一爬采集器簡(jiǎn)直像是量身定做蜘渣。在使用過(guò)程中有幾點(diǎn)感受必須大贊特贊菇用。
免費(fèi) / 操作簡(jiǎn)單 / 跨平臺(tái) / 高效率
下面簡(jiǎn)單給大家介紹下使用方法,讓更多人用最簡(jiǎn)單的方式采集到所需的數(shù)據(jù)澜术。
1.首先去爬一爬官網(wǎng)(http://www.pa1pa.com)下載爬一爬采集器的谷歌瀏覽器插件艺蝴。
2.點(diǎn)擊瀏覽器工具欄右側(cè)按鈕->更多工具->擴(kuò)展程序∧穹希或在地址欄中輸入:chrome://extensions/ ?
3. 把下載好的插件拖入瀏覽器中“擴(kuò)展程序”的頁(yè)面猜敢,點(diǎn)擊“添加擴(kuò)展程序”,這樣插件就安裝完成了盒延∷趵蓿“爬”標(biāo)志出現(xiàn)在右側(cè)插件欄。
4. 確保賬號(hào)已登錄添寺,打開要采集的網(wǎng)站胯盯,點(diǎn)擊瀏覽器插件欄的“爬”圖標(biāo),啟動(dòng)插件计露。
5. 依次點(diǎn)擊選取所要抓取的元素博脑。如果色彩框沒(méi)有包含所有的任務(wù)數(shù)據(jù),點(diǎn)擊所選元素右側(cè)的“轉(zhuǎn)換”按鈕,切換算法票罐,直到選中所有的任務(wù)數(shù)據(jù)叉趣。
6. 如果要抓取多個(gè)頁(yè)面,點(diǎn)擊分頁(yè)設(shè)置的箭頭该押,選中頁(yè)碼所在的區(qū)域疗杉。
7. 確認(rèn)色彩框選中全部數(shù)據(jù)后,先點(diǎn)擊“完成”按鈕沈善,再點(diǎn)擊“測(cè)試”按鈕乡数,測(cè)試數(shù)據(jù)采集是否成功椭蹄。(注:測(cè)試模式下最多抓取5頁(yè)數(shù)據(jù))
8. 確認(rèn)測(cè)試成功后闻牡,點(diǎn)擊”O(jiān)K”關(guān)閉測(cè)試窗口。填寫任務(wù)名稱(長(zhǎng)度為4-32的字符绳矩,必填)罩润,并根據(jù)個(gè)人需要修改列名。
9. 點(diǎn)擊“提交”按鈕翼馆,任務(wù)創(chuàng)建成功割以。您可在網(wǎng)站的“任務(wù)”頁(yè)面下運(yùn)行并管理該任務(wù)金度。
10. 在任務(wù)運(yùn)行的同時(shí),您可點(diǎn)擊該任務(wù)的"管理"頁(yè)面查看任務(wù)運(yùn)行的狀態(tài)及日志严沥。
11. 任務(wù)運(yùn)行結(jié)束后猜极,點(diǎn)擊"任務(wù)”頁(yè)面的數(shù)據(jù)選項(xiàng)即可查看并下載數(shù)據(jù)。
? ? 教程就簡(jiǎn)單給大家分享一下消玄,操作很簡(jiǎn)單跟伏,又是免費(fèi)的,功能也很強(qiáng)大翩瓜。希望這次分享能給一些需要采集數(shù)據(jù)工作者或者需要數(shù)據(jù)支持的企業(yè)有所幫助受扳!