關(guān)于怎么爬取網(wǎng)上的信息劝贸,有時(shí)候我們經(jīng)常在網(wǎng)頁(yè)上看到很多表格數(shù)據(jù),有些不能直接復(fù)制粘貼到文檔或者Excel表格中逗宁,有些能復(fù)制但是格式會(huì)發(fā)生很多錯(cuò)亂映九,要是信息量大的話,修改格式都是一項(xiàng)大工程了瞎颗。
舉個(gè)例子件甥,之前有同學(xué)在網(wǎng)上看到一個(gè)表格數(shù)據(jù):
要是我們直接復(fù)制很難把表格格式也復(fù)制進(jìn)去,尤其對(duì)于一些每天都在變化的數(shù)據(jù)哼拔,也不能同步更新數(shù)據(jù)嚼蚀。
所以我們可以把網(wǎng)頁(yè)的數(shù)據(jù)用Excel表格,導(dǎo)入網(wǎng)頁(yè)的鏈接實(shí)現(xiàn)表格數(shù)據(jù)爬取管挟,同步自動(dòng)更新表格數(shù)據(jù)
首先我們需要復(fù)制表格數(shù)據(jù)所在網(wǎng)頁(yè)的鏈接
然后打開(kāi)Excel表格轿曙。
注意:Excel表格需要2016以上的版本才可以。
找到功能欄的數(shù)據(jù)一項(xiàng)僻孝,選擇新建查詢导帝,再選擇從其他來(lái)源:自網(wǎng)站
然后把我們剛才復(fù)制好的數(shù)據(jù)所在網(wǎng)頁(yè)鏈接粘貼進(jìn)去,按確定
稍等片刻穿铆,就會(huì)自動(dòng)獲取網(wǎng)頁(yè)所有表格數(shù)據(jù)您单,我們找到我們需要獲取的數(shù)據(jù)表格,然后點(diǎn)擊加載進(jìn)Excel表格中荞雏。
加載到Excel表格中后虐秦,我們可以對(duì)外部數(shù)據(jù)進(jìn)行編輯等其他參數(shù)調(diào)整
因?yàn)槭侵苯荧@取外部的鏈接數(shù)據(jù),所以要是外部數(shù)據(jù)變化凤优,我們也可以設(shè)置自定數(shù)據(jù)更新悦陋。
在表格屬性設(shè)計(jì)中找到刷新選項(xiàng)的查看鏈接屬性,然后可以自定義設(shè)置一些自動(dòng)更新時(shí)間筑辨。
如下動(dòng)態(tài)圖演示:
同時(shí)我們可以直接復(fù)制進(jìn)Word文檔中俺驶,選擇性粘貼保留原格式,那么也可以跟Excel和網(wǎng)頁(yè)數(shù)據(jù)實(shí)現(xiàn)同步更新了