如今學(xué)習(xí)應(yīng)用數(shù)據(jù)可視化的渠道有很多,你可以跟蹤一些專家博客结胀,但更重要的一點是實踐/實操责循,你必須對目前可用的數(shù)據(jù)可視化工具有個大致了解。以下是Netmagzine列舉的二十大數(shù)據(jù)可視化工具秸抚,無論你是準(zhǔn)備制作簡單的圖表還是復(fù)雜的圖譜或者信息圖歹垫,這些工具都能滿足你的需要。更加美妙的是吭敢,這些工具大多免費暮芭。
第一部分:入門級工具
1.Excel
Excel的圖形化功能并不強大,但Excel是分析數(shù)據(jù)的理想工具辕宏,上圖是Excel生成的熱力地圖
作為一個入門級工具瑞筐,Excel是快速分析數(shù)據(jù)的理想工具,也能創(chuàng)建供內(nèi)部使用的數(shù)據(jù)圖,但是Excel在顏色扫步、線條和樣式上可選擇的范圍有限匈子,這也意味著用Excel很難制作出能符合專業(yè)出版物和網(wǎng)站需要的數(shù)據(jù)圖虎敦。但是作為一個高效的內(nèi)部溝通工具,Excel應(yīng)當(dāng)是你百寶箱中必備的工具之一胚迫。
2.CSV/JSON
CSV(逗號分隔值)和JSON(JavaScript對象注釋)雖然并不是真正的可視化工具唾那,但卻是常見的數(shù)據(jù)格式。你必須理解他們的結(jié)構(gòu)期犬,并懂得如何從這些文件中導(dǎo)入或者導(dǎo)出數(shù)據(jù)避诽。以下將要介紹的所有數(shù)據(jù)可視化工具都支持CSV沙庐、JSON中至少一種格式。
第二部分:在線數(shù)據(jù)可視化工具
3.Google Chart API
Google Chart API工具集中取消了靜態(tài)圖片功能棉安,目前只提供動態(tài)圖表工具古涧。能夠在所有支持SVG\Canvas和VML的瀏覽器中使用,但是Google Chart的一個大問題是:圖表在客戶端生成菇爪,這意味著那些不支持JavaScript的設(shè)備將無法使用柒昏,此外也無法離線使用或者將結(jié)果另存其他格式职祷,之前的靜態(tài)圖片就不存在這個問題届囚。盡管存在上述問題是尖,不可否認(rèn)的是Google Chart API的功能異常豐富,如果沒有特別的定制化需要蛔添,或者對Google視覺風(fēng)格的抵觸兜辞,那么你大可以從Google Chart開始逸吵。
4.Flot
Flot是一個優(yōu)秀的線框圖表庫,支持所有支持canvas的瀏覽器(目前主流的瀏覽器如火狐足绅、IE啸罢、Chrome等都支持)扰才。
5.Rapha?l
Rapha?l是創(chuàng)建圖表和圖形的JavaScript庫厕怜,與其他庫最大的不同是輸出格式僅限SVG和VML。SVG是矢量格式琅捏,在任何分辨率下的顯示效果都很好递雀。
6.D3
D3(Data Driven Documents)是支持SVG渲染的另一種JavaScript庫缀程。但是D3能夠提供大量線性圖和條形圖之外的復(fù)雜圖表樣式,例如Voronoi圖滤奈、樹形圖撩满、圓形集群和單詞云等。雖然D3能夠提供非痴烟桑花哨的互動圖表领炫,但你在選擇數(shù)據(jù)可視化工具時,需要牢記的一點是:知道在何時保持簡潔针史。
7.Visual.ly
如果你需要制作信息圖而不僅僅是數(shù)據(jù)可視化碟狞,目前也有大把的工具可用。Visual.ly就是最流行的一個選擇频祝。雖然Visual.ly的主要定位是:“信息圖設(shè)計師的在線集市”脆淹,但是也提供了大量信息圖模板盖溺。雖然功能還有很多限制,但是Visual.ly絕對是個能激發(fā)你靈感的地方昆禽。
第三部分:互動圖形用戶界面(GUI)控制
如果數(shù)據(jù)可視化的互動性強大到可以作為GUI界面會怎樣蝇庭?隨著在線數(shù)據(jù)可視化的發(fā)展,按鈕盗棵、下拉列表和滑塊都在進化成更加復(fù)雜的界面元素北发,例如能夠調(diào)整數(shù)據(jù)范圍的互動圖形元素鲫竞,推拉這些圖形元素時輸入?yún)?shù)和輸出結(jié)果數(shù)據(jù)會同步改變,在這種情況下寄疏,圖形控制和內(nèi)容已經(jīng)合為一體。以下這些工具能夠幫你實現(xiàn)這些功能:
8.Crossfilter
當(dāng)我們?yōu)榉奖憧蛻魹g覽數(shù)據(jù)開發(fā)出更加復(fù)雜的工具時驳棱,我們已經(jīng)能夠創(chuàng)建出既是圖表农曲,又是互動圖形用戶界面的小程序乳规。JavaScript庫Crossfilter就是這樣的工具。
Crossfilter應(yīng)用:當(dāng)你調(diào)整一個圖表中的輸入范圍時笙以,其他關(guān)聯(lián)圖表的數(shù)據(jù)也會隨之改變冻辩。
9.Tangle
JavaScript庫Tangle進一步模糊了內(nèi)容與控制之間的界限恨闪。在下圖這個應(yīng)用實例中,Tangle生成了一個負(fù)載的互動方程老玛,讀者可以調(diào)整輸入值獲得相應(yīng)數(shù)據(jù)钧敞。
第四部分:地圖工具
地圖生成是web上最困難的任務(wù)之一。Google Maps的出現(xiàn)完全顛覆了過去人們對在線地圖功能的認(rèn)識。而Google發(fā)布的Maps API則讓所有的開發(fā)者都能在自己的網(wǎng)站中植入地圖功能炊昆。
近年來威根,在線地圖的市場成熟了很多洛搀,如果你需要在數(shù)據(jù)可視化項目中植入定制化的地圖方案,目前市場上已經(jīng)有很多選擇彰檬,但是知道在何時選擇何種地圖方案則成了一個很關(guān)鍵的業(yè)務(wù)決策。地圖方案看上去功能都很強大捧颅,但是切忌:“有了一把錘子较雕,看什么都像釘子】鄣洌”
10. Modest Maps
顧名思義贮尖,Modest Maps是一個很小的地圖庫凄吏,只有10KB大小,是目前最小的可用地圖庫图柏。這似乎意味著Modest Maps只提供一些基本的地圖功能任连,但是不要被這一點迷惑了随抠。在一些擴展庫的配合下,例如Wax二驰,Modest Maps立刻會變成一個強大的地圖工具秉沼。
11.Leaflet
CloudMade團隊為大家?guī)砹?a target="_blank" rel="nofollow">Leaflet唬复,這是另外一個小型化的地圖框架,通過小型化和輕量化來滿足移動網(wǎng)頁的需要棘捣。Leaflet和Modest Maps都是開源項目休建,有強大的社區(qū)支持评疗,是在網(wǎng)站中整合地圖應(yīng)用的理想選擇壤巷。
12. PolyMaps
Polymaps是另外一個地圖庫胧华,但主要面向數(shù)據(jù)可視化用戶宙彪。Polymaps在地圖風(fēng)格化方面有獨到之處,類似CSS樣式表的選擇器悲没,是不可錯過的好東西男图。
13.OpenLayers
OpenLayers可能是所有地圖庫中可靠性最高的一個逊笆。雖然文檔注釋并不完善,且學(xué)習(xí)曲線非常陡峭子檀,但是對于一些特定的任務(wù)來說乃戈,OpenLayers無可匹敵症虑。例如能夠提供一些其他地圖庫都沒有的特殊工具。
14.Kartograph
Kartograph的標(biāo)記線是對地圖繪制的重新思考驶冒,我們都已經(jīng)習(xí)慣了莫卡托投影(Mercator projection)韵卤,但是Kartograph為我們帶來了更多的選擇沈条。如果你不需要調(diào)用全球數(shù)據(jù)诅炉,而僅僅是生成某一區(qū)域的地圖,那么Kartogaph將使你脫穎而出月而。
15.CartoDB
CartoDB是一個不可錯過的網(wǎng)站父款。你可以用CartoDB很輕易就把表格數(shù)據(jù)和地圖關(guān)聯(lián)起來,這方面CartoDB是最優(yōu)秀的選擇世杀。例如肝集,你可以輸入CSV通訊地址文件杏瞻,CartDB能將地址字符串自動轉(zhuǎn)化成經(jīng)度/維度數(shù)據(jù)并在地圖上標(biāo)記出來。目前CartoDB支持免費生成五張地圖數(shù)據(jù)表浮创,更多使用需要支付月費树肃。
Charting Fonts
(隨著iPad3等高清移動設(shè)備的普及)web開發(fā)的一個最新趨勢是將符號字體與字體整合(把符號變成字體),創(chuàng)建出漂亮的矢量化圖標(biāo)胸嘴。在這些新型字體中劣像,例如FF Chartwell和Chartjunk是專門用來顯示圖表和圖形的。他們與OpenType碰到的問題一樣绑青,就是不能被所有的瀏覽器支持屋群,但是不久的未來這些矢量字體將是數(shù)據(jù)可視化工作中需要考慮到的因素芍躏。
第五部分:進階工具
如果你準(zhǔn)備用數(shù)據(jù)可視化做一些“嚴(yán)肅”的工作,那么你可能不會對在線可視化工具或者web小程序有太大興趣庇楞,你需要的是桌面應(yīng)用和編程環(huán)境。
16. Processing
Processing是數(shù)據(jù)可視化的招牌工具蛋褥。你只需要編寫一些簡單的代碼烙心,然后編譯成Java柏靶。目前還有一個Processing.js項目,可以讓網(wǎng)站在沒有Java Applets的情況下更容易地使用Processing痘昌。由于端口支持Objective-C炬转,你也可以在iOS上使用Processing扼劈。雖然Processing是一個桌面應(yīng)用,但也可以在幾乎所有平臺上運行骑冗,此外經(jīng)過數(shù)年發(fā)展先煎,Processing社區(qū)目前已近擁有大量實例和代碼薯蝎。
17.NodeBox
NodeBox是OS X上創(chuàng)建二維圖形和可視化的應(yīng)用程序。你需要了解Python程序袒哥,NodeBox與Processing類似堡称,但是沒有Processing的互動功能艺演。
第六部分:專家級工具
與Excel相對的是專業(yè)數(shù)據(jù)分析工具婿失。如果你是一個專業(yè)的數(shù)據(jù)分析師,那么你就必須對下面將要介紹的工具有所了解(如果不是精通的話)哩照。眾所周知飘弧,SPSS和SAS是數(shù)據(jù)分析行業(yè)的標(biāo)準(zhǔn)工具,但是這些工具的費用不菲痴昧,只有大型組織和學(xué)術(shù)機構(gòu)才有機會使用冠王,下面我們介紹幾種免費的替代工具柱彻,這些開源工具的共同特征是都有強大的社區(qū)支持。開源分析工具性能不輸老牌專業(yè)工具瘤载,插件的支持甚至更好卖擅。
18.R
作為用來分析大數(shù)據(jù)集的統(tǒng)計組件包惩阶,R是一個非常復(fù)雜的工具琳猫,需要較長的學(xué)習(xí)實踐,學(xué)習(xí)曲線也是本文所介紹工具中最陡峭的脐嫂。但是R擁有強大的社區(qū)和組件庫账千,而且還在不斷成長。當(dāng)你能駕馭R的時候鞭衩,一切付出都是物有所值的。
19.Weka
當(dāng)你成長成一名數(shù)據(jù)科學(xué)家的時候,你需要將個人能力從數(shù)據(jù)可視化擴展到數(shù)據(jù)挖掘領(lǐng)域坯台。Weka是一個能根據(jù)屬性分類和集群大量數(shù)據(jù)的優(yōu)秀工具蜒蕾,Weka不但是數(shù)據(jù)分析的強大工具,還能生成一些簡單的圖表首启。
20. Gephi
Gephi是進行社交圖譜數(shù)據(jù)可視化分析的工具毅桃,不但能處理大規(guī)模數(shù)據(jù)集并生成漂亮的可視化圖形愁溜,還能對數(shù)據(jù)進行清洗和分類冕象。Gephi是一種非常特殊的軟件,也非常復(fù)雜论悴,先于他人掌握Gephi將使你一騎絕塵墓律。
原文鏈接:二十大數(shù)據(jù)可視化工具點評 | Public Library of Bioinformatics