如今學習應(yīng)用數(shù)據(jù)可視化的渠道有很多泌豆,你可以跟蹤一些專家博客定庵,但更重要的一點是實踐/實操,你必須對目前可用的數(shù)據(jù)可視化工具有個大致了解踪危。以下是二十大數(shù)據(jù)可視化工具蔬浙,無論你是準備制作簡單的圖表還是復(fù)雜的圖譜或者信息圖,這些工具都能滿足你的需要贞远。 更加美妙的是畴博,這些工具大多免費。
第一部分:入門級工具
1.Excel
Excel的圖形化功能并不強大蓝仲,但Excel是分析數(shù)據(jù)的理想工具俱病,上圖是Excel生成的熱力地圖
作為一個入門級工具,Excel是快速分析數(shù)據(jù)的理想工具袱结,也能創(chuàng)建供內(nèi)部使用的數(shù)據(jù)圖亮隙,但是Excel在顏色、線條和樣式上可選擇的范圍有限垢夹,這也意味著用Excel很難制作出能符合專業(yè)出版物和網(wǎng)站需要的數(shù)據(jù)圖溢吻。但是作為一個高效的內(nèi)部溝通工具,Excel應(yīng)當是你百寶箱中必備的工具之一果元。
2.CSV/JSON
CSV(逗號分隔值)和JSON(JavaScript對象注釋)雖然并不是真正的可視化工具促王,但卻是常見的數(shù)據(jù)格式。你必須理解他們的結(jié)構(gòu)而晒,并懂得如何從這些文件中導(dǎo)入或者導(dǎo)出數(shù)據(jù)蝇狼。以下將要介紹的所有數(shù)據(jù)可視化工具都支持CSV、JSON中至少一種格式倡怎。
第二部分:在線數(shù)據(jù)可視化工具
3.Google Chart API
Google Chart API工具集中取消了靜態(tài)圖片功能迅耘,目前只提供動態(tài)圖表工具贱枣。能夠在所有支持SVGCanvas和VML的瀏覽器中使用,但是Google Chart的一個大問題是:圖表在客戶端生成豹障,這意味著那些不支持JavaScript的設(shè)備將無法使用冯事,此外也無法離線使用或者將結(jié)果另存其他格式,之前的靜態(tài)圖片就不存在這個問題血公。盡管存在上述問題昵仅,不可否認的是Google Chart API的功能異常豐富,如果沒有特別的定制化需要累魔,或者對Google視覺風格的抵觸摔笤,那么你大可以從Google Chart開始。
4.Flot
Flot 是一個優(yōu)秀的線框圖表庫垦写,支持所有支持canvas的瀏覽器(目前主流的瀏覽器如火狐吕世、IE、Chrome等都支持)梯投。
5.Rapha?l
Rapha?l 是創(chuàng)建圖表和圖形的JavaScript庫命辖,與其他庫最大的不同是輸出格式僅限SVG和VML。SVG是矢量格式分蓖,在任何分辨率下的顯示效果都很好尔艇。
6.D3
D3 (Data Driven Documents)是支持SVG渲染的另一種JavaScript庫。但是D3能夠提供大量線性圖和條形圖之外的復(fù)雜圖表樣式么鹤,例如Voronoi圖终娃、樹形圖、圓形集群和單詞云等蒸甜。雖然D3能夠提供非程母花哨的互動圖表,但你在選擇數(shù)據(jù)可視化工具時柠新,需要牢記的一點是:知道在何時保持簡潔窍荧。
7.Visual.ly
如果你需要制作信息圖而不僅僅是數(shù)據(jù)可視化,目前也有大把的工具可用恨憎。 Visual.ly 就是最流行的一個選擇蕊退。雖然Visual.ly的主要定位是:“信息圖設(shè)計師的在線集市”,但是也提供了大量信息圖模板框咙。雖然功能還有很多限制,但是Visual.ly絕對是個能激發(fā)你靈感的地方痢甘。
第三部分:互動圖形用戶界面(GUI)控制
如果數(shù)據(jù)可視化的互動性強大到可以作為GUI界面會怎樣?隨著在線數(shù)據(jù)可視化的發(fā)展喇嘱,按鈕、下拉列表和滑塊都在進化成更加復(fù)雜的界面元素塞栅,例如能夠調(diào)整數(shù)據(jù)范圍的互動圖形元素者铜,推拉這些圖形元素時輸入?yún)?shù)和輸出結(jié)果數(shù)據(jù)會同步改變,在這種情況下,圖形控制和內(nèi)容已經(jīng)合為一體作烟。以下這些工具能夠幫你實現(xiàn)這些功能:
8.Crossfilter
當我們?yōu)榉奖憧蛻魹g覽數(shù)據(jù)開發(fā)出更加復(fù)雜的工具時愉粤,我們已經(jīng)能夠創(chuàng)建出既是圖表,又是互動圖形用戶界面的小程序拿撩。JavaScript庫 Crossfilter 就是這樣的工具衣厘。
Crossfilter應(yīng)用:當你調(diào)整一個圖表中的輸入范圍時,其他關(guān)聯(lián)圖表的數(shù)據(jù)也會隨之改變压恒。
9.Tangle
JavaScript庫 Tangle 進一步模糊了內(nèi)容與控制之間的界限影暴。在下圖這個應(yīng)用實例中,Tangle生成了一個負載的互動方程探赫,讀者可以調(diào)整輸入值獲得相應(yīng)數(shù)據(jù)型宙。
第四部分:地圖工具
地圖生成是web上最困難的任務(wù)之一。Google Maps的出現(xiàn)完全顛覆了過去人們對在線地圖功能的認識伦吠。而Google發(fā)布的 Maps API 則讓所有的開發(fā)者都能在自己的網(wǎng)站中植入地圖功能妆兑。
近年來,在線地圖的市場成熟了很多毛仪,如果你需要在數(shù)據(jù)可視化項目中植入定制化的地圖方案搁嗓,目前市場上已經(jīng)有很多選擇,但是知道在何時選擇何種地圖方案則成了一個很關(guān)鍵的業(yè)務(wù)決策潭千。地圖方案看上去功能都很強大谱姓,但是切忌:“有了一把錘子,看什么都像釘子刨晴√肜矗”
- Modest Maps
顧名思義, Modest Maps 是一個很小的地圖庫狈癞,只有10KB大小茄靠,是目前最小的可用地圖庫。這似乎意味著Modest Maps只提供一些基本的地圖功能蝶桶,但是不要被這一點迷惑了慨绳。在一些擴展庫的配合下,例如 Wax 真竖,Modest Maps立刻會變成一個強大的地圖工具脐雪。
11.Leaflet
CloudMade團隊為大家?guī)砹?Leaflet ,這是另外一個小型化的地圖框架恢共,通過小型化和輕量化來滿足移動網(wǎng)頁的需要战秋。Leaflet和Modest Maps都是開源項目,有強大的社區(qū)支持讨韭,是在網(wǎng)站中整合地圖應(yīng)用的理想選擇脂信。
- PolyMaps
Polymaps 是另外一個地圖庫癣蟋,但主要面向數(shù)據(jù)可視化用戶。Polymaps在地圖風格化方面有獨到之處狰闪,類似CSS樣式表的選擇器疯搅,是不可錯過的好東西。
13.OpenLayers
OpenLayers 可能是所有地圖庫中可靠性最高的一個埋泵。雖然文檔注釋并不完善幔欧,且學習曲線非常陡峭,但是對于一些特定的任務(wù)來說秋泄,OpenLayers無可匹敵琐馆。例如能夠提供一些其他地圖庫都沒有的特殊工具。
14.Kartograph
Kartograph的標記線是對地圖繪制的重新思考恒序,我們都已經(jīng)習慣了莫卡托投影( Mercator projection )瘦麸,但是Kartograph為我們帶來了更多的選擇。如果你不需要調(diào)用全球數(shù)據(jù)歧胁,而僅僅是生成某一區(qū)域的地圖滋饲,那么Kartogaph將使你脫穎而出。
15.CartoDB
CartoDB 是一個不可錯過的網(wǎng)站喊巍。你可以用CartoDB很輕易就把表格數(shù)據(jù)和地圖關(guān)聯(lián)起來屠缭,這方面CartoDB是最優(yōu)秀的選擇。例如崭参,你可以輸入CSV通訊地址文件呵曹,CartDB能將地址字符串自動轉(zhuǎn)化成經(jīng)度/維度數(shù)據(jù)并在地圖上標記出來。目前CartoDB支持免費生成五張地圖數(shù)據(jù)表何暮,更多使用需要支付月費奄喂。
Charting Fonts
(隨著iPad3等高清移動設(shè)備的普及)web開發(fā)的一個最新趨勢是將符號字體與字體整合(把符號變成字體),創(chuàng)建出漂亮的矢量化圖標海洼。在這些新型字體中跨新,例如 FF Chartwell 和 Chartjunk 是專門用來顯示圖表和圖形的。他們與OpenType碰到的問題一樣坏逢,就是不能被所有的瀏覽器支持域帐,但是不久的未來這些矢量字體將是數(shù)據(jù)可視化工作中需要考慮到的因素。
第五部分:進階工具
如果你準備用數(shù)據(jù)可視化做一些“嚴肅”的工作是整,那么你可能不會對在線可視化工具或者web小程序有太大興趣肖揣,你需要的是桌面應(yīng)用和編程環(huán)境。
- Processing
Processing 是數(shù)據(jù)可視化的招牌工具浮入。你只需要編寫一些簡單的代碼龙优,然后編譯成Java。目前還有一個 Processing.js 項目舵盈,可以讓網(wǎng)站在沒有Java Applets的情況下更容易地使用Processing陋率。由于端口支持Objective-C,你也可以在iOS上使用Processing秽晚。雖然Processing是一個桌面應(yīng)用瓦糟,但也可以在幾乎所有平臺上運行,此外經(jīng)過數(shù)年發(fā)展赴蝇,Processing社區(qū)目前已近擁有大量實例和代碼菩浙。
17.NodeBox
NodeBox 是OS X上創(chuàng)建二維圖形和可視化的應(yīng)用程序。你需要了解Python程序句伶,NodeBox與Processing類似劲蜻,但是沒有Processing的互動功能。
第六部分:專家級工具
與Excel相對的是專業(yè)數(shù)據(jù)分析工具考余。如果你是一個專業(yè)的數(shù)據(jù)分析師先嬉,那么你就必須對下面將要介紹的工具有所了解(如果不是精通的話)。眾所周知楚堤, SPSS 和 SAS 是數(shù)據(jù)分析行業(yè)的標準工具疫蔓,但是這些工具的費用不菲,只有大型組織和學術(shù)機構(gòu)才有機會使用身冬,下面我們介紹幾種免費的替代工具衅胀,這些開源工具的共同特征是都有強大的社區(qū)支持。開源分析工具性能不輸老牌專業(yè)工具酥筝,插件的支持甚至更好滚躯。
18.R
作為用來分析大數(shù)據(jù)集的統(tǒng)計組件包,R是一個非常復(fù)雜的工具嘿歌,需要較長的學習實踐掸掏,學習曲線也是本文所介紹工具中最陡峭的。但是R擁有強大的社區(qū)和組件庫搅幅,而且還在不斷成長阅束。當你能駕馭R的時候,一切付出都是物有所值的茄唐。
19.Weka
當你成長成一名數(shù)據(jù)科學家的時候息裸,你需要將個人能力從數(shù)據(jù)可視化擴展到數(shù)據(jù)挖掘領(lǐng)域。Weka是一個能根據(jù)屬性分類和集群大量數(shù)據(jù)的優(yōu)秀工具沪编,Weka不但是數(shù)據(jù)分析的強大工具呼盆,還能生成一些簡單的圖表。
- Gephi
Gephi 是進行社交圖譜數(shù)據(jù)可視化分析的工具蚁廓,不但能處理大規(guī)模數(shù)據(jù)集并生成漂亮的可視化圖形访圃,還能對數(shù)據(jù)進行清洗和分類。Gephi是一種非常特殊的軟件相嵌,也非常復(fù)雜腿时,先于他人掌握Gephi將使你一騎絕塵
人工智能况脆、大數(shù)據(jù)、云計算和物聯(lián)網(wǎng)的未來發(fā)展值得重視批糟,均為前沿產(chǎn)業(yè)格了,多智時代專注于人工智能和大數(shù)據(jù)的入門和科譜,在此為你推薦幾篇優(yōu)質(zhì)好文:
1.在學習大數(shù)據(jù)之前徽鼎,需要具備什么基礎(chǔ)
http://www.duozhishidai.com/article-12916-1.html
2.大數(shù)據(jù)工程師培訓盛末,需要學習的有哪些課程?
http://www.duozhishidai.com/article-15081-1.html
3.大數(shù)據(jù)的特點是什么,大數(shù)據(jù)與Hadoop有什么關(guān)系否淤?
http://www.duozhishidai.com/article-13276-1.html