最近在練習(xí)專(zhuān)注力,這是我用來(lái)聯(lián)系的第一本書(shū)僧家,大概總耗時(shí)是4小時(shí)屯掖。這本書(shū)的觀點(diǎn)很有意思瓢谢,作者會(huì)講很多商業(yè)故事來(lái)為自己的觀點(diǎn)做鋪墊,所以還是挺適合練習(xí)專(zhuān)注力和速讀的兔辅。關(guān)于數(shù)據(jù)可視化的時(shí)候腊敲,我度了《數(shù)據(jù)可視化之美》,主要是講述關(guān)于什么是數(shù)據(jù)可視化维苔,如何進(jìn)行數(shù)據(jù)可視化碰辅,對(duì)可視化講的非常細(xì)節(jié)。這本書(shū)相對(duì)比較不太一樣介时,更多是從商業(yè)的角度來(lái)講述為什么要進(jìn)行數(shù)據(jù)可視化没宾,數(shù)據(jù)可視化的好處忍法,以及數(shù)據(jù)可視化在大數(shù)據(jù)中的位置,從一個(gè)較為宏觀的角度來(lái)講故事榕吼。
Tableau是一家專(zhuān)職做數(shù)據(jù)可視化工具的公司饿序,這樣一家公司,在2013年的5月羹蚣,于華爾街上市原探,得到了2.5億美元的融資。在大數(shù)據(jù)如此廣泛的今日顽素,可能還有的人還沒(méi)有停過(guò)數(shù)據(jù)可視化這個(gè)詞咽弦,而早在五年前,便有人早早的看到了數(shù)據(jù)可視化的價(jià)值胁出。
動(dòng)圖無(wú)法上傳型型,因此貼出網(wǎng)址)
上圖便是滴滴用大數(shù)據(jù)描繪出全國(guó)400城24小時(shí)的出行熱力變化圖。通過(guò)動(dòng)圖的方式全蝶,可以看到人們出行的高峰時(shí)間闹蒜、人們集中在哪些城市等等信息。數(shù)據(jù)可視化就是這樣一種工具抑淫,通過(guò)可視化的方式绷落,將大量的數(shù)據(jù)甚至是成PB級(jí)的數(shù)據(jù),直觀的展示給觀眾始苇,不再只是一些枯燥的數(shù)據(jù)砌烁。
可以說(shuō),數(shù)據(jù)可視化降低了數(shù)據(jù)分析的門(mén)檻催式,即使觀眾不是統(tǒng)計(jì)學(xué)專(zhuān)家函喉,不懂各種復(fù)雜的數(shù)學(xué)公式,也一樣可以快速的從圖中發(fā)現(xiàn)一些問(wèn)題荣月,探察到潛在的商業(yè)價(jià)值管呵,從而幫助制定更好的商業(yè)決策。同時(shí)喉童,數(shù)據(jù)可視化工具也降低了觀眾的學(xué)習(xí)成本撇寞,觀眾并不需要了解那些專(zhuān)業(yè)的統(tǒng)計(jì)學(xué)工具顿天、建模工具堂氯,如Matlab等如何使用,也不需要回任何編程語(yǔ)言牌废,只需要將數(shù)據(jù)連接上咽白,通過(guò)托拉拽等方式,就可以很容易地構(gòu)建出相對(duì)定制化的可視化圖形來(lái)供其進(jìn)行研究鸟缕。
數(shù)據(jù)可視化為什么是大數(shù)據(jù)中重要的一環(huán)
大數(shù)據(jù)是當(dāng)今非常炙手可熱的話題晶框。很多公司通過(guò)正當(dāng)或非正當(dāng)?shù)氖侄螌⒁恍┯脩?hù)數(shù)據(jù)收集起來(lái)?yè)?jù)為己有排抬,之前螞蟻金服鬧的沸沸揚(yáng)揚(yáng)的用一個(gè)很扯的年度關(guān)鍵字來(lái)誘使用戶(hù)同意其收集數(shù)據(jù)就是一個(gè)很好的案例。關(guān)于數(shù)據(jù)的產(chǎn)生授段,這幾年隨著互聯(lián)網(wǎng)的發(fā)展越發(fā)的快速了起來(lái)蹲蒲,曾有統(tǒng)計(jì)顯示,全球數(shù)據(jù)量正以平均年增長(zhǎng)率50%的速度在增長(zhǎng)著侵贵,而當(dāng)前數(shù)據(jù)總量的80%都是最近兩年產(chǎn)生的届搁。由此可見(jiàn),現(xiàn)在正是數(shù)據(jù)的時(shí)代窍育。
面對(duì)如此龐大的數(shù)據(jù)量卡睦,如何利用是一個(gè)關(guān)鍵。大數(shù)據(jù)可以做很多事漱抓,例如預(yù)測(cè)表锻、推薦引擎等,而在這之前便是方向和目標(biāo)的確定乞娄。這就是數(shù)據(jù)可視化的目的瞬逊。借用Tableau的目標(biāo):
- 使數(shù)據(jù)能被更好地理解
- 與其他工具一道,使企業(yè)能夠把握不斷增長(zhǎng)的數(shù)據(jù)流
- 促進(jìn)數(shù)據(jù)發(fā)現(xiàn)
- 幫助人們進(jìn)行更好地決策
大數(shù)據(jù)是把雙刃劍仪或,用好了可以造福用戶(hù)码耐,如自動(dòng)駕駛、阿爾法狗都是人類(lèi)智慧溶其、機(jī)器智能和大數(shù)據(jù)的結(jié)晶骚腥,而如果用不好,其實(shí)就是對(duì)資源的浪費(fèi)和對(duì)個(gè)人隱私的侵犯瓶逃,如攜程滴滴的殺熟束铭、棱鏡門(mén)事件都是很好的佐證。借用狄更斯的話:
這是最好的時(shí)代厢绝,也是最壞的時(shí)代契沫;這是智慧的年代,也是愚蠢的年代昔汉;這是信仰的時(shí)期懈万,也是懷疑的時(shí)期;這是光明的季節(jié)靶病,也是黑暗的季節(jié)会通;這是希望的春天,也是失望的冬天娄周;大伙兒面前應(yīng)有盡有涕侈,大伙兒面前一無(wú)所有。
數(shù)據(jù)可視化與報(bào)表
對(duì)于數(shù)據(jù)可視化這個(gè)詞以及數(shù)據(jù)可視化工具與報(bào)表和傳統(tǒng)的報(bào)表工具如Excel煤辨、PPT有什么區(qū)別呢裳涛?確實(shí)二者有很多相似之處木张,而且很多數(shù)據(jù)可視化的展示就是靜態(tài)報(bào)表。然而數(shù)據(jù)可視化很重要的一點(diǎn)在于其交互性端三,如上面滴滴的例子舷礼,通過(guò)動(dòng)態(tài)的方式來(lái)展示,相較于靜態(tài)的報(bào)表涵蓋的信息量更大郊闯,講的故事也多且轨。
如Excel等的報(bào)表工具在現(xiàn)在也依舊很好的工具,但是相較于數(shù)據(jù)可視化工具來(lái)說(shuō)虚婿,其數(shù)據(jù)來(lái)源更加單一旋奢,可展示的數(shù)據(jù)量也有很大的限制。數(shù)據(jù)可視化工具可以直接與用戶(hù)的數(shù)據(jù)庫(kù)相連然痊,可以更高效的達(dá)到數(shù)據(jù)展示的目的至朗,同時(shí)很多工具還支持分布式工具如Hadoop等。
不過(guò)想提一個(gè)個(gè)人觀點(diǎn)剧浸,數(shù)據(jù)可視化工具雖然具備很大的優(yōu)勢(shì)锹引,但并不是必需品。如果一個(gè)企業(yè)的數(shù)據(jù)沒(méi)有達(dá)到一定量級(jí)唆香,數(shù)據(jù)沒(méi)有較大的復(fù)雜性嫌变,或許使用數(shù)據(jù)可視化工具是個(gè)良好的開(kāi)端,但并不一定會(huì)被持續(xù)使用躬它,畢竟Excel就可以很好的達(dá)到其目標(biāo)腾啥。不能被持續(xù)使用的工具,學(xué)習(xí)使用它或許只是對(duì)時(shí)間的浪費(fèi)冯吓。
不是銀彈
數(shù)據(jù)可視化是大數(shù)據(jù)中重要的一環(huán)倘待,是幫助企業(yè)更好地利用數(shù)據(jù)進(jìn)行商業(yè)決策的一個(gè)步驟。然而數(shù)據(jù)可視化并不是銀彈组贺,其強(qiáng)烈依賴(lài)對(duì)于受眾的良好把握凸舵、真實(shí)有效的大數(shù)據(jù)的支撐、良好的可視化設(shè)計(jì)以及其他一些因素失尖。
把握好受眾
天下并不存在放之四海皆準(zhǔn)的真理啊奄,數(shù)據(jù)可視化也同樣如此,并非所有的數(shù)據(jù)可視化都面向同樣的手中掀潮,對(duì)于某一群手中起作用的可視化對(duì)于另一群手中未必起作用菇夸。因此把握好手中非常關(guān)鍵。
真實(shí)有效的數(shù)據(jù)支撐
英國(guó)數(shù)學(xué)家和發(fā)明家Charles Babbage曾說(shuō)胧辽,
利用不充分?jǐn)?shù)據(jù)印方的錯(cuò)誤更甚于那些完全不用數(shù)據(jù)的錯(cuò)誤
真實(shí)有效的數(shù)據(jù)支撐是利用數(shù)據(jù)可視化進(jìn)行決策非常重要的一個(gè)前提峻仇。利用書(shū)中的一句話公黑,數(shù)據(jù)可視化和大數(shù)據(jù)只是增加了做出更優(yōu)決策和實(shí)現(xiàn)更大成果的機(jī)會(huì)而已邑商,更重要的是摄咆,可視化并不代表“絕對(duì)的”和“永恒的”真理。數(shù)據(jù)可以操縱我們人断,混淆我們吭从,也可以導(dǎo)致糟糕的決策。
良好的可視化設(shè)計(jì)
援引《英國(guó)衛(wèi)報(bào)》數(shù)據(jù)記者John Burn-Murdoch的話:
即使簡(jiǎn)單如配色也會(huì)對(duì)可視化所呈現(xiàn)信息的可信度感知造成顯著影響--通常這種影響較數(shù)據(jù)源的真實(shí)權(quán)威性還更強(qiáng)烈恶迈。
良好的可視化設(shè)計(jì)可以幫助用戶(hù)更好的理解數(shù)據(jù)涩金,從而制定明智的決策。而糟糕的設(shè)計(jì)暇仲,則會(huì)混淆用戶(hù)的感知步做,將信息完全掩蓋住,使用戶(hù)制定糟糕的決策奈附。