最近有在了解數(shù)據(jù)可視化相關(guān)的內(nèi)容抛人,翻看一些數(shù)據(jù)領(lǐng)域的文章,多數(shù)只是對(duì)數(shù)據(jù)可視化工具進(jìn)行了簡(jiǎn)單羅列,并沒(méi)有對(duì)每種工具的特性及其使用場(chǎng)景進(jìn)行細(xì)致剖析芒炼,對(duì)從事數(shù)據(jù)領(lǐng)域的人提供的參考價(jià)值不大锉走。況且在工作過(guò)一段時(shí)間之后滨彻,數(shù)據(jù)人員從事的業(yè)務(wù)領(lǐng)域其實(shí)決定了其使用該類工具的局限性,這意味著在一個(gè)業(yè)務(wù)領(lǐng)域其實(shí)不必掌握可視化的方方面面挪蹭,抓住其中一小部分的共通點(diǎn)和核心往往就足以應(yīng)付絕大部分的業(yè)務(wù)需求亭饵。
通常來(lái)說(shuō),數(shù)據(jù)可視化要求:
(1)實(shí)時(shí)性:數(shù)據(jù)可視化工具必須適應(yīng)大數(shù)據(jù)時(shí)代數(shù)據(jù)量的爆炸式增長(zhǎng)需求梁厉,必須快速的收集分析數(shù)據(jù)辜羊、并對(duì)數(shù)據(jù)信息進(jìn)行實(shí)時(shí)更新;
(2)簡(jiǎn)單操作:數(shù)據(jù)可視化工具滿足快速開(kāi)發(fā)、易于操作的特性词顾,能滿足互聯(lián)網(wǎng)時(shí)代信息多變的特點(diǎn);
(3)更豐富的展現(xiàn):數(shù)據(jù)可視化工具需具有更豐富的展現(xiàn)方式八秃,能充分滿足數(shù)據(jù)展現(xiàn)的多維度要求;
(4)多種數(shù)據(jù)集成支持方式:數(shù)據(jù)的來(lái)源不僅僅局限于數(shù)據(jù)庫(kù),數(shù)據(jù)可視化工具將支持團(tuán)隊(duì)協(xié)作數(shù)據(jù)肉盹、數(shù)據(jù)倉(cāng)庫(kù)昔驱、文本等多種方式,并能夠通過(guò)互聯(lián)網(wǎng)進(jìn)行展現(xiàn)上忍。
由于作者從事的是在線視頻行業(yè)骤肛,所負(fù)責(zé)產(chǎn)品為后臺(tái)大數(shù)據(jù)產(chǎn)品,需要為各個(gè)端提供數(shù)據(jù)處理分析及決策支持窍蓝,故而涉及到大量的數(shù)據(jù)指標(biāo)收集腋颠、處理和展示。盡管當(dāng)前系統(tǒng)大部分?jǐn)?shù)據(jù)展示模塊用ECharts工具足以展示吓笙,但其在分析層面并不能做到很深入的程度淑玫,多維度數(shù)據(jù)的交叉分析更是無(wú)可奈何。通過(guò)調(diào)研一些國(guó)外數(shù)據(jù)可視化工具面睛,總結(jié)了以下可能會(huì)結(jié)合到工作中的產(chǎn)品絮蒿。
(1)D3.js
D3(Data Driven Documents)是支持SVG渲染的另一種JavaScript庫(kù),能夠提供大量線性圖和條形圖之外的復(fù)雜圖表樣式叁鉴,例如Voronoi圖歌径、樹(shù)形圖、圓形集群和單詞云等亲茅。
例1:數(shù)據(jù)可視化之地域分布-面臨冰雪融化災(zāi)難的阿拉斯加土著居民分布
http://www.theguardian.com/environment/interactive/2013/may/14/alaska-villages-frontline-global-warming
通過(guò)D3回铛,右邊的地域分布圖很好地與左邊的tab及數(shù)據(jù)圖表聯(lián)動(dòng)起來(lái)狗准,極為形象生動(dòng)地展現(xiàn)了當(dāng)今環(huán)境變化引發(fā)的生態(tài)問(wèn)題,令人印象深刻茵肃。數(shù)據(jù)的及時(shí)響應(yīng)方面也做的十分出色腔长,基本上做到了區(qū)域間數(shù)據(jù)的無(wú)縫切換。
例2:數(shù)據(jù)可視化之時(shí)間分布-航空準(zhǔn)時(shí)情況表現(xiàn)
http://square.github.io/crossfilter/
上半部分的四個(gè)圖表分別為四個(gè)查詢維度验残,每個(gè)維度都支持單獨(dú)的區(qū)間選擇捞附,下方的表格則實(shí)時(shí)展示所選查詢維度下的指標(biāo)數(shù)據(jù)。這種方法提供了很好的多維度實(shí)時(shí)查詢功能您没,手動(dòng)選擇區(qū)間也讓用戶有更直觀的體驗(yàn)和參與感鸟召。
PS:帶著以下幾個(gè)趣味問(wèn)題看上面的數(shù)據(jù)的話,就差不多算是步入數(shù)據(jù)挖掘和數(shù)據(jù)分析的大門(mén)啦~
1.When is the best time of day/day of week/time of year to fly to minimise delays?
2.Do older planes suffer more delays?
3.How does the number of people flying between different locations change over time?
4.How well does weather predict plane delays?
5.Can you detect cascading failures as delays in one airport create delays in others? Are there critical links in the system?
(2)Visual.ly
http://visual.ly/solutions/data-visualization-information-design
以下數(shù)據(jù)可視化方式供參考
- Area Charts(面積圖氨鹏,將折線圖與橫軸圍起來(lái)的面積進(jìn)行填充計(jì)算)
- Bar Charts(條形圖欧募,橫的)
- Choropleth Maps(專題地圖,用色塊填充區(qū)域表示數(shù)據(jù)變量)
- Column Charts(柱狀圖仆抵,豎的)
- Common Chart Types(常用圖表類型)
- Coxcomb Chart(雞冠花圖跟继,有時(shí)也稱作極地區(qū)域圖)
- Create Interactive Infographics(交互圖,可以對(duì)數(shù)據(jù)進(jìn)行操作)
- Create Motion Graphics(使用電子媒體加以解釋)
- Create the Best Explainer Videos(說(shuō)明視頻)
- Creating Infographics: The Basics(包含更多內(nèi)容的信息圖)
- Donut Charts(甜甜圈圖镣丑,功能類似于餅圖)
- Heat Maps(往往有著二維數(shù)據(jù)的熱力圖)
- Histograms(直方圖)
- Isopleth Maps(等值線圖)
- Line Charts(折線圖)
- Pie Charts(餅圖)
- Pin Maps(引腳圖)
- Scatter Plots & Regression Lines(散點(diǎn)圖與回歸線)
- Time Series Visualizations(時(shí)間序列可視化)
- Timelines
- Treemaps(樹(shù)圖舔糖,使用嵌套矩陣代表整體,展示數(shù)據(jù)繼承關(guān)系)
- Word Clouds(標(biāo)簽云)