前幾天發(fā)現(xiàn)了巨硬(學名:微軟)公司出品的可視化神器-Power BI擂找,機智如我嘗試了一番發(fā)現(xiàn)果然 powerful。其用途如下:
Power BI 是商務(wù)分析工具套件,可用來分析數(shù)據(jù)及共享深入信息合武。 Power BI 儀表板可為商務(wù)使用者提供全方位的觀點,將所關(guān)注的重要計量全部集中在一處并實時更新涡扼,讓使用者隨時都能從其裝置存取這些數(shù)據(jù)稼跳。只要單擊,使用者就能透過操作簡便的工具探索儀表板中潛藏的信息吃沪,迅速獲得所需要的答案岂贩。建立儀表板十分容易;這要歸功于專家預先建立的儀表板巷波,連接了超過 50 項以上的熱門商務(wù)應(yīng)用程序,讓您很快就能上手使用卸伞。無論您身在何處抹镊,都能透過 Power BI Mobile 應(yīng)用程序存取您的數(shù)據(jù)及報表,而且應(yīng)用程序還會隨著數(shù)據(jù)變更而自動更新荤傲。
是不是看不懂...(這種英譯中過來的文案真是不知所云)實際上這款工具的便捷之處在于發(fā)現(xiàn)各種復雜的數(shù)據(jù)之間的內(nèi)在關(guān)系垮耳,并通過其內(nèi)置的極其人性化的工具(即圖表)將數(shù)據(jù)的關(guān)系展現(xiàn)出來。Power BI提供移動版遂黍、桌面版和網(wǎng)頁版终佛,你可以隨時隨地訪問你的數(shù)據(jù)并可以生成網(wǎng)頁發(fā)給老板裝X。
廢話少說雾家,馬上教大家如何裝這個X铃彰。
第一步:了解軟件
到Power BI官網(wǎng)找到桌面版下載安裝,打開后會發(fā)現(xiàn)這幅圖景芯咧。
你可以在圖表配置區(qū)域選擇你想要使用的圖表類型牙捉,使用效果會自動呈現(xiàn)在預覽區(qū)。 了解這些基本情況后就可以正式導入數(shù)據(jù)了敬飒,目前Power BI支持導入excel,csv,xml等文件邪铲,當然不僅如此,它還支持從網(wǎng)頁无拗、Facebook带到、Github等等數(shù)十種軟件、工具中導入數(shù)據(jù)英染。本文以IMDB Top250排行榜網(wǎng)頁的導入揽惹,分析優(yōu)秀電影與年代的關(guān)系為案例被饿,向大家介紹一下這款軟件的具體使用。(視頻教程請見Power BI的Youtube視頻專區(qū))
第二步:導入數(shù)據(jù)
在數(shù)據(jù)編輯區(qū)域找到導入數(shù)據(jù)永丝,從一列來源中選擇web锹漱,此時會提示你輸入url,將IMDD的Top 250網(wǎng)頁的網(wǎng)址輸入即可慕嚷。
導入之后bi會分析網(wǎng)頁中包含的各項數(shù)據(jù)哥牍,并生成幾個表格,依次查看后找到包含電影名與排名的表格導喝检,這時先不要直接導入嗅辣,從網(wǎng)頁上導入的數(shù)據(jù)由于機器識別的問題不可能百分之百符合我們的要求,所以要先選擇編輯挠说。
第三步:清洗數(shù)據(jù)
上面已經(jīng)講到澡谭,網(wǎng)頁導入的數(shù)據(jù)需要我們清洗掉無效的東西并進行整理,這是最關(guān)鍵也是很繁瑣的一步损俭。凝練蛙奖、有效的數(shù)據(jù)是后面可視化工作的基礎(chǔ),數(shù)據(jù)有問題杆兵,可視化做的再漂亮也沒用雁仲。
在編輯狀態(tài)下,只保留電影名和評分兩項琐脏,選中這兩列并點擊保留資料列攒砖,其余刪除。
還沒完日裙,這時候需要將「排名與電影名」一列中的排名吹艇、電影名和電影年份分割成單獨的三列,以便于后期數(shù)據(jù)的分析與比較昂拂。這里要用到「分割資料行-按分割符號分割」選項受神。在分割排名時,選取的分隔符為數(shù)字與電影名之間的「句號」(注意:所有的字符必須在英文輸入法狀態(tài)下輸入政钟,下同)在分割年份時路克,選取的分隔符為電影名與年份之間的「(」,即開小括號养交,詳見下圖精算。
還沒完+1,如果直接分析年份與電影排名的話碎连,年份太多灰羽,意義不大。這時需要將數(shù)據(jù)合并,加入「Decade」數(shù)據(jù)列廉嚼,即十年為一組玫镐,將每個電影所處的Decade作為單獨一列放到最后,以便于以后的分析怠噪。點擊數(shù)據(jù)編輯區(qū)的「新增資料行-新增自訂資料行」恐似,此時需要一個公式根據(jù)電影的年份計算其所處的年代,別擔心傍念,這里函數(shù)已經(jīng)給出矫夷,即「Text.Start([Year],3)&"0s"」,大家直接復制即可。(同樣憋槐,公式中的每一個字符必須在英文輸入法狀態(tài)下輸入)詳見下圖双藕。
此時數(shù)據(jù)大致清洗完畢,直接點擊左上角區(qū)域的「關(guān)閉并套用」阳仔。
第四步:繪制圖表
數(shù)據(jù)清洗完忧陪,終于可以到酷炫的一步了,繪制圖表近范!這里要注意的是圖表的選擇要符合數(shù)據(jù)的關(guān)系嘶摊,不要一味的追求效果,選擇的圖表可以表達出數(shù)據(jù)的關(guān)系即可评矩。這里更卒,為了跟大家介紹,我選取了四個基本的圖表稚照,并以選取餅圖為代表介紹。(關(guān)于圖表的樣式俯萌,大家可以到官網(wǎng)下載并導入使用)
在圖表配置區(qū)果录,首先選擇「餅圖」,然后將右側(cè)里需要展示在餅圖中的數(shù)據(jù)拖動到「圖例」和「值」中咐熙,這時圖表預覽區(qū)就會展示出來弱恒,你可將圖表放大,或者回到圖表配置區(qū)繼續(xù)調(diào)整顏色等等棋恼。這樣返弹,將其它可能展現(xiàn)出數(shù)據(jù)關(guān)系的圖表按此理做好,調(diào)整大小爪飘,使其完美的呈現(xiàn)在展示區(qū)义起。
熟悉Excel同學會發(fā)現(xiàn)這個和數(shù)據(jù)透視表很相像,但是透視表做出的表格是「死」的师崎,不能達到以下的效果默终。
(Gif錄制工具為免費的「LICEcap」,僅不到500k) 當你點擊一個圖中的一個數(shù)據(jù)時,該數(shù)據(jù)同時也會展現(xiàn)在其它圖中齐蔽。這種的圖表間的互動更能凸顯出各項數(shù)據(jù)的關(guān)系两疚。
第五步:發(fā)布圖表
制作完成后可以保存為本地文件,同時也可以上傳到云端含滴,便于你在網(wǎng)頁端查看和編輯诱渤,以及公司內(nèi)部的數(shù)據(jù)查詢與協(xié)作。
如果是第一次使用的話谈况,如果要發(fā)布到云端需要你輸入一個公司或者學校的郵箱進行注冊勺美。我用科大郵箱注冊成功。還要注意的是云端的文件是可以生成一個網(wǎng)址的鸦做,便于郵件傳送励烦。
至此,教程結(jié)束泼诱。
如果你想深入學習Power BI坛掠,還可以訂閱微軟為其在Youtube上開設(shè)的教程頻道,同時還可以直接打開官網(wǎng)治筒,找到使用指南屉栓。更多的細節(jié)和功能還需要進一步探索,如果你想跟我一起學習就關(guān)注我吧耸袜!