前幾天喷市,Tony老師幫朋友寫了一個爬蟲工具相种,抓取網(wǎng)頁上的股票信息,后來有人問我东抹,有其它更方便的方法嗎蚂子?
還真有!不用編程缭黔,鼠標(biāo)點(diǎn)幾下食茎,就把網(wǎng)頁的信息抓取到表格里面去,然后還能直接分析數(shù)據(jù)馏谨,而且軟件也免費(fèi)别渔。。。
這么牛逼的軟件是什么呢哎媚?那就是Power BI喇伯。
接下來,Tony老師會開一系列課程拨与,教大家學(xué)習(xí)Power BI稻据,如果你有興趣學(xué)Power BI,歡迎加入QQ群买喧,共同探討:282308215
我們以一個實(shí)際案例來學(xué)習(xí)如何抓取網(wǎng)頁數(shù)據(jù):
統(tǒng)計過去一個月上海的天氣情況捻悯。
在Google上搜索上海天氣,第三個鏈接應(yīng)該是這個:
http://tianqi.2345.com/wea_history/58362.htm
打開Power BI淤毛,在數(shù)據(jù)源的地方選擇Web今缚,并輸入網(wǎng)址。
選擇Table 0低淡,點(diǎn)Load姓言,我們看到天氣的數(shù)據(jù)已經(jīng)被我們抓取到表格里面了。
我們看到最高氣溫和最低氣溫是字符串28℃蔗蹋,這樣沒辦法做數(shù)據(jù)對比何荚,我們要把28和℃分開。
這就要用到一個Power Query的工具纸颜。
順便提一下兽泣,使用Power BI的順序(一定記住了):
Power Query -> Power Pivot -> Power View
在菜單欄點(diǎn)Edit Queries
選中要分列的字段點(diǎn)右鍵,選中【拆分列】-【按照從數(shù)字到非數(shù)字轉(zhuǎn)換】
然后把數(shù)字字段轉(zhuǎn)換為浮點(diǎn)數(shù)據(jù)類型胁孙,同樣通過點(diǎn)右鍵【更改類型】-【小數(shù)】
我們可以點(diǎn)【高級編輯】唠倦,看一下M語言
Power BI里面有兩種語言,一個是M語言涮较,是在Power Query里整理數(shù)據(jù)源的時候的語言稠鼻,另外一種是DAX語言,類似于Excel公式的一種語言狂票。
點(diǎn)擊左上角的【關(guān)閉并應(yīng)用】候齿,關(guān)閉Power Query。
在View界面的可視化點(diǎn)【折線】并設(shè)置如下參數(shù):
點(diǎn)【堆積條形圖】闺属,并設(shè)置如下參數(shù):
瞬間可以做出下面的圖表:
是不是很神奇慌盯,Tony老師試了幾個能夠展現(xiàn)出Table樣式的網(wǎng)頁,基本上都能抓取成功掂器,包括股票亚皂,天氣,成績国瓮。灭必。狞谱。。禁漓。跟衅。
如果你想學(xué)Power BI,歡迎關(guān)注Tony老師播歼×骢危或者加入QQ群,共同學(xué)習(xí):282308215
今天先講到這里秘狞,謝謝撩穿。