超級干貨 :一文讀懂?dāng)?shù)據(jù)可視化(自己學(xué)習(xí))

數(shù)據(jù)可視化捅厂,是指將相對晦澀的的數(shù)據(jù)通過可視的避乏、交互的方式進(jìn)行展示爷耀,從而形象、直觀地表達(dá)數(shù)據(jù)蘊(yùn)含的信息和規(guī)律拍皮。

早期的數(shù)據(jù)可視化作為咨詢機(jī)構(gòu)歹叮、金融企業(yè)的專業(yè)工具,其應(yīng)用領(lǐng)域較為單一铆帽,應(yīng)用形態(tài)較為保守咆耿。步入大數(shù)據(jù)時(shí)代,各行各業(yè)對數(shù)據(jù)的重視程度與日俱增爹橱,隨之而來的是對數(shù)據(jù)進(jìn)行一站式整合萨螺、挖掘、分析愧驱、可視化的需求日益迫切慰技,數(shù)據(jù)可視化呈現(xiàn)出愈加旺盛的生命力,表現(xiàn)之一就是視覺元素越來越多樣组砚,從樸素的柱狀圖/餅狀圖/折線圖吻商,擴(kuò)展到地圖、氣泡圖糟红、樹圖艾帐、儀表盤等各式圖形。表現(xiàn)之二是可用的開發(fā)工具越來越豐富盆偿,從專業(yè)的數(shù)據(jù)庫/財(cái)務(wù)軟件掩蛤,擴(kuò)展到基于各類編程語言的可視化庫,相應(yīng)的應(yīng)用門檻也越來越低陈肛。

數(shù)據(jù)可視化揍鸟,不僅僅是統(tǒng)計(jì)圖表。本質(zhì)上句旱,任何能夠借助于圖形的方式展示事物原理阳藻、規(guī)律、邏輯的方法都叫數(shù)據(jù)可視化谈撒。

數(shù)據(jù)可視化不僅是一門包含各種算法的技術(shù), 還是一個(gè)具有方法論的學(xué)科腥泥。一般而言,完整的可視化流程包括以下內(nèi)容:

可視化輸入:包括可視化任務(wù)的描述啃匿,數(shù)據(jù)的來源與用途蛔外,數(shù)據(jù)的基本屬性蛆楞、概念模型等;

可視化處理:對輸入的數(shù)據(jù)進(jìn)行各種算法加工夹厌,包括數(shù)據(jù)清洗豹爹、篩選、降維矛纹、聚類等操作臂聋,并將數(shù)據(jù)與視覺編碼進(jìn)行映射;

可視化輸出:基于視覺原理和任務(wù)特性或南,選擇合理的生成工具和方法孩等,生成可視化作品。


實(shí)際上采够,從“數(shù)據(jù)可視化”的命名肄方,便很容易看出數(shù)據(jù)可視化從業(yè)者如何開始可視化設(shè)計(jì),那便是:處理數(shù)據(jù)蹬癌,設(shè)計(jì)視覺扒秸,完成從數(shù)據(jù)空間到可視空間的映射, 必要時(shí)重復(fù)數(shù)據(jù)處理和圖形繪制的循環(huán)組合。

1. 分析數(shù)據(jù)


首先冀瓦,我們需要對數(shù)據(jù)做一個(gè)全面而細(xì)致的解讀,數(shù)據(jù)的特點(diǎn)決定著可視化的設(shè)計(jì)原則写烤。每項(xiàng)數(shù)據(jù)都有特定的屬性(或稱特征翼闽、維度)和對應(yīng)的值,一組屬性構(gòu)成特征列表洲炊。按照屬性的類型感局,數(shù)據(jù)可以分為數(shù)值型、有序型暂衡、類別型询微,數(shù)值型又可以進(jìn)一步分為固定零點(diǎn)和非固定零點(diǎn)。其中狂巢,固定零點(diǎn)數(shù)據(jù)囊括了我們大多數(shù)的數(shù)據(jù)對象撑毛,它們都可以對應(yīng)到數(shù)軸上的某個(gè)點(diǎn);非固定零點(diǎn)主要包括以數(shù)值表示的特定含義唧领,如表示地理信息的經(jīng)緯度藻雌、表示日期的年月日等,在分析非固定零點(diǎn)數(shù)據(jù)時(shí)斩个,我們更在意的是它們的區(qū)間胯杭。

在對數(shù)據(jù)做過預(yù)處理和分析之后,我們就能夠觀察出待處理數(shù)據(jù)的分布和維度受啥,再結(jié)合業(yè)務(wù)邏輯和可視化目標(biāo)做个,有可能還要對數(shù)據(jù)做某些變換鸽心,這些變換包括:

標(biāo)準(zhǔn)化,常用的手段包括(0居暖,1)標(biāo)準(zhǔn)化或(-1顽频,1)標(biāo)準(zhǔn)化,分別對應(yīng)的是sigmoid函數(shù)和tanh函數(shù)膝但,這么做的目的在于使數(shù)據(jù)合法和美觀冲九,但在這一過程中可能丟失影響數(shù)據(jù)分布、維度跟束、趨勢的信息莺奸,應(yīng)該予以特別注意;

擬合/平滑冀宴,為表現(xiàn)數(shù)據(jù)變化趨勢灭贷,使受眾對數(shù)據(jù)發(fā)展有所預(yù)測,我們會引入回歸來對數(shù)據(jù)進(jìn)行擬合略贮,以達(dá)到減少噪音甚疟,凸顯數(shù)據(jù)趨勢的目的;

采樣逃延,有些情況下览妖,數(shù)據(jù)點(diǎn)過多,以至于不易可視化或者影響視覺體驗(yàn)揽祥,我們會使用隨機(jī)采樣的方法抽取部分?jǐn)?shù)據(jù)點(diǎn)讽膏,抽樣結(jié)果與全集近似分布,同時(shí)不影響可視化元素的對比或趨勢拄丰;

降維府树,一般而言,同一可視化圖表中能夠承載的維度有限(很難超過3個(gè)維度)料按,必須對整個(gè)數(shù)據(jù)集進(jìn)行降維處理奄侠。

2. 可視化設(shè)計(jì)


在開始設(shè)計(jì)之前,我們需要對人類視覺以及注意力作簡要分析载矿,這決定著我們?nèi)绾卧诘谝粫r(shí)間抓住受眾的注意力垄潮。

人類視覺感知到心理認(rèn)知的過程要經(jīng)過信息的獲取、分析闷盔、歸納魂挂、解碼、儲存馁筐、概念涂召、提取、使用等一系列加工階段敏沉,每個(gè)階段需要不同的人體組織和器官參與果正。簡單來講炎码,人類視覺的特點(diǎn)是:

對亮度、運(yùn)動秋泳、差異更敏感潦闲,對紅色相對于其他顏色更為敏感;

對于具備某些特點(diǎn)的視覺元素具備很強(qiáng)的“腦補(bǔ)”能力迫皱,比如空間距離較近的點(diǎn)往往被認(rèn)為具有某些共同的特點(diǎn)歉闰;

對眼球中心正面物體的分辨率更高,這是由于人類晶狀體中心區(qū)域錐體細(xì)胞分布最為密集卓起;

人們在觀察事物時(shí)習(xí)慣于將具有某種方向上的趨勢的物體視為連續(xù)物體和敬;

人們習(xí)慣于使用“經(jīng)驗(yàn)”去感知事物整體,而忽略局部信息戏阅。

這里引入一個(gè)概念——可視編碼昼弟,它數(shù)據(jù)信息映射為可視化元素的技術(shù),其通常具有表達(dá)直觀奕筐、易于理解和記憶的特性舱痘。數(shù)據(jù)包含屬性和值,相應(yīng)可視編碼也由兩部分組成:標(biāo)記和視覺通道离赫,標(biāo)記代表數(shù)據(jù)屬性的分類芭逝,視覺通道表示人眼所能看到的各種元素的屬性,包括大小渊胸、形狀旬盯、顏色等,往往用來展示屬性的定量信息蹬刷。例如,對于柱狀圖而言频丘,標(biāo)記就是矩形办成,視覺通道就是矩形的顏色、高度或?qū)挾鹊取?/p>

數(shù)據(jù)可視化的設(shè)計(jì)目標(biāo)和制作原則在于信搂漠、達(dá)迂卢、雅,即一要精準(zhǔn)展現(xiàn)數(shù)據(jù)的差異桐汤、趨勢而克、規(guī)律,二要準(zhǔn)確傳遞核心思想怔毛,三要簡潔美觀员萍,不攜帶冗余信息。結(jié)合人的視覺特點(diǎn)拣度,很容易總結(jié)出好的數(shù)據(jù)可視化作品的基本特征:

讓用戶的視線聚焦在可視化結(jié)果中最重要的部分碎绎;

對于有對比需求的數(shù)據(jù),使用亮度、大小踢械、形狀來進(jìn)行編碼更佳贱枣;

使用盡量少的視覺通道編碼數(shù)據(jù),避免干擾信息日麸。

3. 可視編碼的選擇


如同只學(xué)過視聽語言并不能設(shè)計(jì)出可用的電影分鏡一樣寄啼,數(shù)據(jù)可視化這一藝術(shù)設(shè)計(jì)色彩濃厚的工作絕非做過幾個(gè)餅圖、柱狀圖就能勝任代箭。在開始涉足實(shí)踐講解之前墩划,我們需要解決以下疑問:?

可視化設(shè)計(jì)中優(yōu)先選擇哪些視覺通道?有多少種視覺通道可供使用梢卸?某個(gè)視覺通道能編碼什么信息走诞,能包含多少信息量?視覺通道表達(dá)信息能力的區(qū)別蛤高?哪些視覺通道互不相關(guān)而哪些又相互影響蚣旱??

看看下圖,或許能從一定程度上給出答案:

上圖列舉了數(shù)據(jù)可視化作品中常用的視覺編碼通道戴陡,針對同種數(shù)據(jù)類型塞绿,采用不同的視覺通道帶來的主觀認(rèn)知差異很大。數(shù)值型適合用能夠量化的視覺通道表示恤批,如坐標(biāo)异吻、長度等,使用顏色表示的效果就大打折扣喜庞,且容易引起歧義诀浪;類似地,序列型適合用區(qū)分度明顯的視覺通道表示延都,類別型適合用易于分組的視覺通道雷猪。

需要指出的是,上圖蘊(yùn)含的理念可以應(yīng)對絕大多數(shù)應(yīng)用場景下可視化圖形的設(shè)計(jì)“套路”晰房,但數(shù)據(jù)可視化作為視覺設(shè)計(jì)的本質(zhì)決定了“山無常勢求摇,水無常形”,任何可視化效果都拒絕生搬硬套殊者,更不要說數(shù)據(jù)可視化的應(yīng)用還要受到業(yè)務(wù)与境、場景和受眾的影響。

4. 配色


相信每一個(gè)碼農(nóng)出身的數(shù)據(jù)分析師在做可視化設(shè)計(jì)時(shí)猖吴,都會對色彩如何搭配產(chǎn)生過困惑摔刁。色彩理論看起來簡單卻又乏味,用起來卻不是那么得心應(yīng)手海蔽。那么簸搞,如何讓數(shù)據(jù)可視化作品簡約扁位、靈動、美觀趁俊?下面介紹一些通用技巧域仇。

1)色調(diào)與明度的跨度都要大

要確保配色非常容易辨識與區(qū)分,它們的明度差異一定要夠大寺擂。明度差異需要全局考慮暇务。但是,有一組明度跨度大的配色還不夠怔软。配色越多樣垦细,用戶越容易將數(shù)據(jù)與圖像聯(lián)系起來。如果能善加利用色調(diào)的變化挡逼,就能使用戶接受起來更加輕松括改。對于明度與色調(diào),跨度越大家坎,就能承載越多的數(shù)據(jù)嘱能。下圖展示了相同色系下不同明度的色階對比:

2)仿照自然的配色

各行各業(yè)的設(shè)計(jì)師都知道這個(gè)小秘密,對于數(shù)據(jù)可視化工程師而言虱疏,這招更是屢試不爽惹骂。一個(gè)簡單有效的方法是:找出心儀的圖片,比如唯美的風(fēng)景照片做瞪,使用photoshop中“濾鏡—馬賽克—調(diào)整多邊形形狀和大小”即可看到該圖片中包含的各種顏色对粪,然后利用吸管工具選出幾種顏色即可:


3)使用漸變

無論你需要2種顏色還是10種,漸變中都能提取出這些顏色装蓬,讓可視化圖表感覺自然著拭,同時(shí)保有足夠的色調(diào)與明度差異。一個(gè)使用漸變的好方法就是:在Photoshop中拉輔助線到斷點(diǎn)位置牍帚,與數(shù)據(jù)的數(shù)量對應(yīng)上儡遮,然后持續(xù)對漸變進(jìn)行測試與調(diào)整。

可以看到履羞,配色表緊挨著頂部的灰度漸變峦萎,調(diào)整漸變疊加(之后就能得到精確的漸變色值)屡久,然后從那些斷點(diǎn)處選取顏色忆首,測試配色在實(shí)際運(yùn)用中的效果。

4)使用配色工具

網(wǎng)上各種免費(fèi)資源比比皆是被环,對于想設(shè)計(jì)出靚麗效果又無計(jì)可施的人而言糙及,多參考以下這些工具是一個(gè)好辦法:

ColorHunt——高質(zhì)量配色方案,能夠快速預(yù)覽筛欢,如果你只需要4種顏色浸锨,這是絕佳的資源唇聘;

Kuler——photoshop配色工具,Adobe家出的柱搜,應(yīng)該錯(cuò)不了迟郎;

Chroma.js——Chroma.js是一個(gè)微型的JavaScript庫,適用于各種顏色處理的聪蘸,可實(shí)現(xiàn)各種顏色的轉(zhuǎn)換和色階處理宪肖;

Color brewer——地圖配色利器,如果你對基于地圖的可視化配色方案感到困惑健爬,這個(gè)在線工具應(yīng)該能夠幫到你控乾。

此外,關(guān)于配色還有一些小技巧可供參考:遵循公司既定的品牌風(fēng)格娜遵;根據(jù)數(shù)據(jù)描述的對象來定蜕衡,如數(shù)據(jù)描述的是咖啡,則可以考慮使用咖色系设拟;使用季節(jié)或者節(jié)日相關(guān)主題的色彩慨仿;如果你實(shí)在對顏色搭配感到頭疼,那就多使用萬能的“灰色”和陰影蒜绽。

統(tǒng)計(jì)圖表


統(tǒng)計(jì)圖表是使用最早的可視化圖形镶骗,在數(shù)百年的進(jìn)化過程中,逐漸形成了基本“套路”躲雅,符合人類感知和認(rèn)知鼎姊,進(jìn)而被廣泛接受。

常見于各種分析報(bào)告的有柱狀圖相赁、折線圖相寇、餅圖、散點(diǎn)圖钮科、氣泡圖唤衫、雷達(dá)圖,對于這些最常用的圖表類型绵脯,下表可以為你指明大致方向:


我們在制作可視化圖表時(shí)佳励,首先要從業(yè)務(wù)出發(fā),優(yōu)先挑選合理的蛆挫、符合慣例的圖表赃承,尤其是如果你的用戶層次比較多樣的情況下,請兼顧各個(gè)年齡段或者不同認(rèn)知能力的用戶的需求悴侵;其次是根據(jù)數(shù)據(jù)的各種屬性和統(tǒng)計(jì)圖表的特點(diǎn)來選擇瞧剖,例如餅圖并不適合用作展示絕對數(shù)值,只適用于反映各部分的比例。對于常用圖表抓于,帶著目的出發(fā)做粤,遵循各種約束,相信你能找到合適的圖表:


除了常用的圖表之外捉撮,可供我們選擇的還有:

漏斗圖:漏斗圖適用于業(yè)務(wù)流程比較規(guī)范怕品、周期長、環(huán)節(jié)多的流程分析巾遭,通過漏斗各環(huán)節(jié)業(yè)務(wù)數(shù)據(jù)的比較堵泽,能夠直觀地發(fā)現(xiàn)和說明問題所在。

(矩形)樹圖:一種有效的實(shí)現(xiàn)層次結(jié)構(gòu)可視化的圖表結(jié)構(gòu)恢总,適用于表示類似文件目錄結(jié)構(gòu)的數(shù)據(jù)集迎罗;

熱力圖:以特殊高亮的形式顯示訪客熱衷的頁面區(qū)域和訪客所在的地理區(qū)域的圖示,它基于GIS坐標(biāo)片仿,用于顯示人或物品的相對密度纹安;

關(guān)系圖:基于3D空間中的點(diǎn)—線組合,再加以顏色砂豌、粗細(xì)等維度的修飾厢岂,適用于表征各節(jié)點(diǎn)之間的關(guān)系;

詞云:各種關(guān)鍵詞的集合阳距,往往以字體的大小或顏色代表對應(yīng)詞的頻次塔粒;

桑基圖:一種有一定寬度的曲線集合表示的圖表筐摘,適用于展現(xiàn)分類維度間的相關(guān)性卒茬,以流的形式呈現(xiàn)共享同一類別的元素?cái)?shù)量,比如展示特定群體的人數(shù)分布等咖熟;

日歷圖:顧名思義圃酵,以日歷為基本維度的對單元格加以修飾的圖表。

數(shù)據(jù)可視化的工具

新型的數(shù)據(jù)可視化產(chǎn)品層出不窮馍管,基本上各種語言都有自己的可視化庫郭赐,傳統(tǒng)數(shù)據(jù)分析及BI軟件也都擴(kuò)展出一定的可視化功能,再加上專門的用于可視化的成品軟件确沸,我們的可選范圍實(shí)在是太多了捌锭。那么,我們要選擇的可視化工具罗捎,必須滿足互聯(lián)網(wǎng)爆發(fā)的大數(shù)據(jù)需求观谦,必須快速的收集、篩選宛逗、分析坎匿、歸納盾剩、展現(xiàn)決策者所需要的信息雷激,并根據(jù)新增的數(shù)據(jù)進(jìn)行實(shí)時(shí)更新替蔬。

實(shí)時(shí)性:數(shù)據(jù)可視化工具必須適應(yīng)大數(shù)據(jù)時(shí)代數(shù)據(jù)量的爆炸式增長需求,必須快速的收集分析數(shù)據(jù)屎暇、并對數(shù)據(jù)信息進(jìn)行實(shí)時(shí)更新承桥;

簡單操作:數(shù)據(jù)可視化工具滿足快速開發(fā)、易于操作的特性根悼,能滿足互聯(lián)網(wǎng)時(shí)代信息多變的特點(diǎn)凶异;

更豐富的展現(xiàn):數(shù)據(jù)可視化工具需具有更豐富的展現(xiàn)方式,能充分滿足數(shù)據(jù)展現(xiàn)的多維度要求挤巡;

多種數(shù)據(jù)集成支持方式:數(shù)據(jù)的來源不僅僅局限于數(shù)據(jù)庫剩彬;很多數(shù)據(jù)可視化工具都支持團(tuán)隊(duì)協(xié)作數(shù)據(jù)、數(shù)據(jù)倉庫矿卑、文本等多種方式喉恋,并能夠通過互聯(lián)網(wǎng)進(jìn)行展現(xiàn)。

數(shù)據(jù)可視化主要通過編程和非編程兩類工具實(shí)現(xiàn)母廷。主流編程工具包括以下三種類型:從藝術(shù)的角度創(chuàng)作的數(shù)據(jù)可視化轻黑,比較典型的工具是 Processing,它是為藝術(shù)家提供的編程語言琴昆;從統(tǒng)計(jì)和數(shù)據(jù)處理的角度氓鄙,既可以做數(shù)據(jù)分析,又可以做圖形處理业舍,如R抖拦,SAS;介于兩者之間的工具舷暮,既要兼顧數(shù)據(jù)處理蟋座,又要兼顧展現(xiàn)效果,D3.js脚牍、Echarts都是很不錯(cuò)的選擇向臀,二者這種基于Javascript的數(shù)據(jù)可視化工具更適合在互聯(lián)網(wǎng)上互動的展示數(shù)據(jù)。


1. 入門級


入門級的意思是該工具是可視化工作者必須掌握的技能诸狭,難度不一定小券膀、門檻也不一定低。相反驯遇,對于可視化大拿來說芹彬,這些工具依舊起到四兩撥千斤的妙用。


Excel


別以為EXCEL只會處理表格叉庐,你可以把它當(dāng)成數(shù)據(jù)庫舒帮,也可以把它當(dāng)成IDE,甚至可以把它當(dāng)成數(shù)據(jù)可視化工具來使用。它可以創(chuàng)建專業(yè)的數(shù)據(jù)透視表和基本的統(tǒng)計(jì)圖表玩郊,但由于默認(rèn)設(shè)置了顏色肢执、線條和風(fēng)格,使其難以創(chuàng)建用于看上去“高大上”視覺效果译红。盡管如此预茄,我仍然推薦你使用Excel。?

Tableau


相信每一個(gè)接觸到數(shù)據(jù)可視化的人都聽說過Tableau侦厚,它需要一些結(jié)構(gòu)化的數(shù)據(jù)耻陕, 也需要你懂一些BI。 它不需要編程刨沦,而僅僅通過簡單的拖拽操作即可完成驚艷的效果诗宣。對比Excel,它是專業(yè)應(yīng)對數(shù)據(jù)可視化方案的利器想诅,主要表現(xiàn)在數(shù)據(jù)可視化梧田、聚焦/深挖、靈活分析侧蘸、交互設(shè)計(jì)等功能裁眯。Tableau最大的缺點(diǎn)在于它是商業(yè)軟件,個(gè)人使用的話只有14天的免費(fèi)期讳癌,而官方售價(jià)不菲穿稳。

2. 在線數(shù)據(jù)可視化

Google Charts

Google Charts是一個(gè)免費(fèi)的開源js庫,使用起來非常簡單晌坤,只需要在script標(biāo)簽中將src指向https://www.gstatic.com/charts/loader.js然后即可開始繪制逢艘。它支持HTML5/SVG,可以跨平臺部署骤菠,并特意為兼容舊版本的IE采用了vml它改。


在新版google?charts 發(fā)布之前,google有個(gè)類似的產(chǎn)品叫做Google Charts API商乎,不同之處在于后者使用http請求的方式將參數(shù)提交到api央拖,而后接口返回一張png圖片。如打開http://chart.googleapis.com/chart?cht=bvg&chs=250x150&chd=s:Monkeys&chxt=x,y&chxs=0,ff0000,12,0,lt|1,0000ff,10,1,lt鹉戚,即可顯示下圖:


Flot


Flot是一個(gè)很棒的線圖和條形圖創(chuàng)建工具鲜戒,可以運(yùn)用于支持canvas的所有瀏覽器——意味著大多數(shù)主流瀏覽器。這是一個(gè)jQuery庫抹凳,如果你已經(jīng)熟悉jQuery遏餐,你就可以容易的對圖像進(jìn)行回調(diào)、風(fēng)格和行為操作赢底。?浮懸的優(yōu)點(diǎn)是你可以訪問大量的調(diào)用函數(shù)失都,這樣就可以運(yùn)行你自己的代碼柏蘑。設(shè)定一種風(fēng)格,可以讓在用戶懸停鼠標(biāo)粹庞、點(diǎn)擊咳焚、移開鼠標(biāo)時(shí)展示不同的效果。比起其他制圖工具信粮,浮懸給予你更多的靈活空間。浮懸提供的選項(xiàng)不多趁啸,但它可以很好地執(zhí)行常見的功能强缘。?

D3


D3(Data Driven Documents)是支持SVG渲染的另一種JavaScript庫。但是D3能夠提供大量線性圖和條形圖之外的復(fù)雜圖表樣式不傅,例如Voronoi圖旅掂、樹形圖、圓形集群和單詞云等访娶。D3.js是數(shù)據(jù)驅(qū)動文件(Data-Driven Documents)的縮寫商虐,他通過使用HTML\CSS和SVG來渲染精彩的圖表和分析圖。D3對網(wǎng)頁標(biāo)準(zhǔn)的強(qiáng)調(diào)足以滿足在所有主流瀏覽器上使用的可能性崖疤,使你免于被其他類型架構(gòu)所捆綁的苦惱秘车,它可以將視覺效果很棒的組件和數(shù)據(jù)驅(qū)動方法結(jié)合在一起。

Echarts


百度出品的優(yōu)秀產(chǎn)品之一劫哼,也是國內(nèi)目前開源項(xiàng)目中少有的精品叮趴。一個(gè)純 Javascript 的圖表庫,可以流暢的運(yùn)行在 PC 和移動設(shè)備上权烧,兼容當(dāng)前絕大部分瀏覽器,底層依賴輕量級的 Canvas 類庫 ZRender妻率,提供直觀板祝,生動宫静,可交互,可高度個(gè)性化定制的數(shù)據(jù)可視化圖表囊嘉。3.0版本中更是加入了更多豐富的交互功能以及更多的可視化效果革为,并且對移動端做了深度的優(yōu)化扭粱。Echarts最令人心動的是它豐富的圖表類型,以及極低的上手難度琢蛤。

Highcharts


在Echarts出現(xiàn)之初,功能還不是那么完善套才,可視化工作者往往會選擇HighCharts慕淡。Highcharts 系列軟件包含 Highcharts JS,Highstock JS傻寂,Highmaps JS 共三款軟件携兵,均為純 JavaScript 編寫的 HTML5 圖表庫。Highcharts 是一個(gè)用純 JavaScript 編寫的一個(gè)圖表庫静檬, 能夠很簡單便捷的在 Web 網(wǎng)站或是 Web 應(yīng)用程序添加有交互性的圖表并级。Highstock 是用純 JavaScript 編寫的股票圖表控件嘲碧,可以開發(fā)股票走勢或大數(shù)據(jù)量的時(shí)間軸圖表,Highmaps 是一款基于 HTML5 的優(yōu)秀地圖組件钉迷。

R


嚴(yán)格來說钠署,R是一種數(shù)據(jù)分析語言,與matlab舰蟆、GNU Octave并列狸棍。然而ggplot2的出現(xiàn)讓R成功躋身于可視化工具的行列草戈,作為R中強(qiáng)大的作圖軟件包,ggplot2牛在其自成一派的數(shù)據(jù)可視化理念唐片。它將數(shù)據(jù)、數(shù)據(jù)相關(guān)繪圖茧球、數(shù)據(jù)無關(guān)繪圖分離抢埋,并采用圖層式的開發(fā)邏輯弹灭,且不拘泥于規(guī)則穷吮,各種圖形要素可以自由組合福侈。當(dāng)熟悉了ggplot2的基本套路后卢未,數(shù)據(jù)可視化工作將變得非常輕松而有條理。

DataV


阿里出品的數(shù)據(jù)可視化解決方案伟墙,之所以推薦DataV這個(gè)后起之秀戳葵,完全是因?yàn)樘詫氹p“11”活動中實(shí)時(shí)互動大屏幕太搶眼了汉匙。DataV支持多種數(shù)據(jù)源,尤其是和阿里系各種數(shù)據(jù)庫完美銜接戏自,如果你的數(shù)據(jù)本身就存在阿里云上伤锚,那選用DataV肯定是個(gè)省時(shí)省力的好辦法屯援。圖表方面,DataV內(nèi)置了豐富的圖表模板弯淘,支持實(shí)時(shí)數(shù)據(jù)采集和解析吉懊。

3. 類GUI數(shù)據(jù)可視化

?

Crossfilter?


Crossfilter 是一個(gè)用來展示大數(shù)據(jù)集的 JavaScript 庫,它可以把數(shù)據(jù)可視化和GUI控件結(jié)合起來废登,按鈕郁惜、下拉和滑塊演變成更復(fù)雜的界面元素兆蕉,使你擴(kuò)展內(nèi)容,同時(shí)改變輸入?yún)?shù)和數(shù)據(jù)易稠。交互速度超快包蓝,甚至在上百萬或者更多數(shù)據(jù)下都很快测萎。Crossfilter也是一種JavaScript庫,它可以在幾乎不影響速度的前提下對數(shù)據(jù)創(chuàng)建過濾器份乒,將過濾后的數(shù)據(jù)用于展示或辖,且涉及有限維度枣接,因此可以完成對海量數(shù)據(jù)集的篩選與加載月腋。

4. 進(jìn)階工具

?

Processing?


Processing 是用 Java 編程語言寫的,并且 Java 語言也是在語言樹中最接近 Processing 的片拍。所以捌省,如果您熟悉 C 或 Java 語言碉钠,Processing 將很容易學(xué)卷拘。Processing 并不包括 Java 語言的一些較為高級的特性栗弟,但這些特性中的很多特性均已集成到了 Processing工闺。如今陆蟆,圍繞它已經(jīng)形成了一個(gè)專門的社區(qū)(https://www.openprocessing.org),致力于構(gòu)建各種庫以供用這種語言和環(huán)境進(jìn)行動畫改鲫、可視化像棘、網(wǎng)絡(luò)編程以及很多其他的應(yīng)用诊县。

Processing 是一個(gè)很棒的進(jìn)行數(shù)據(jù)可視化的環(huán)境依痊,具有一個(gè)簡單的接口怎披、一個(gè)功能強(qiáng)大的語言以及一套豐富的用于數(shù)據(jù)以及應(yīng)用程序?qū)С龅臋C(jī)制凉逛。

Weka


Weka是一個(gè)能根據(jù)屬性分類和集群大量數(shù)據(jù)的優(yōu)秀工具,Weka不但是數(shù)據(jù)分析的強(qiáng)大工具毫胜,還能生成一些簡單的圖表酵使。weka首先是一個(gè)數(shù)據(jù)挖掘的利器焙糟,它能夠快速導(dǎo)入我們的結(jié)構(gòu)化數(shù)據(jù)穿撮,然后對數(shù)據(jù)屬性做分類痪欲、聚類分析业踢,幫助我們理解數(shù)據(jù)礁扮。但他的可視化功能同樣不遜色深员,選擇界面中的visualization,你會立刻明白:是它讓你理解數(shù)據(jù)遮糖,然后你才讓用戶可視化數(shù)據(jù)叠赐。

結(jié)語

我們所處的這個(gè)時(shí)代芭概,是一個(gè)知識大爆發(fā)的時(shí)代罢洲。僅就編程這項(xiàng)技能來說,現(xiàn)在幾乎人人都能寫上一兩行殿较,程序員這個(gè)群體也比十年前有了更多維度上的擴(kuò)展桩蓉。各種工具的使用門檻越來越低院究,帶來的是行業(yè)壁壘日漸消弭。會用某種可視化手段伙窃,并不是區(qū)分小白與專家的唯一標(biāo)準(zhǔn)对供,筆者曾聽說有人拿unity、易語言這樣的神器來實(shí)現(xiàn)可視化鹅髓。所以窿冯,眼花繚亂的工具永遠(yuǎn)只是輔助确徙,真正決定你在可視化道路上走多遠(yuǎn)的鄙皇,是你對可視化理念的準(zhǔn)確把握和執(zhí)著堅(jiān)守。

參考資料:

1. 清華大學(xué)數(shù)據(jù)可視化課程講義——張松海

2.《基本圖表的特點(diǎn)和適用場合》

3.《20 款數(shù)據(jù)可視化工具》

4.《50個(gè)大數(shù)據(jù)可視化分析工具》

END

轉(zhuǎn)自:數(shù)據(jù)派THU 公眾號缠沈;本文獲授權(quán)洲愤;

版權(quán)聲明:本號內(nèi)容部分來自互聯(lián)網(wǎng)顷锰,轉(zhuǎn)載請注明原文鏈接和作者官紫,如有侵權(quán)或出處有誤請和我們聯(lián)系。

關(guān)聯(lián)閱讀

原創(chuàng)系列文章:

1:從0開始搭建自己的數(shù)據(jù)運(yùn)營指標(biāo)體系(概括篇)

2 :從0開始搭建自己的數(shù)據(jù)運(yùn)營指標(biāo)體系(定位篇)

3 :從0開始搭建自己的數(shù)據(jù)運(yùn)營體系(業(yè)務(wù)理解篇)

4 :數(shù)據(jù)指標(biāo)的構(gòu)建流程與邏輯

5 :系列 :從數(shù)據(jù)指標(biāo)到數(shù)據(jù)運(yùn)營指標(biāo)體系

6: ??實(shí)戰(zhàn) :為自己的公號搭建一個(gè)數(shù)據(jù)運(yùn)營指標(biāo)體系

數(shù)據(jù)運(yùn)營關(guān)聯(lián)文章閱讀:

運(yùn)營入門慎框,從0到1搭建數(shù)據(jù)分析知識體系

推薦 :數(shù)據(jù)分析師與運(yùn)營協(xié)作的9個(gè)好習(xí)慣

干貨 :手把手教你搭建數(shù)據(jù)化用戶運(yùn)營體系

推薦 :最用心的運(yùn)營數(shù)據(jù)指標(biāo)解讀

干貨 : 如何構(gòu)建數(shù)據(jù)運(yùn)營指標(biāo)體系

從零開始,構(gòu)建數(shù)據(jù)化運(yùn)營體系

干貨 :解讀產(chǎn)品薪丁、運(yùn)營和數(shù)據(jù)三個(gè)基友關(guān)系

干貨 :從0到1搭建數(shù)據(jù)運(yùn)營體系

數(shù)據(jù)分析严嗜、數(shù)據(jù)產(chǎn)品?關(guān)聯(lián)文章閱讀:

干貨 :數(shù)據(jù)分析團(tuán)隊(duì)的搭建和思考

關(guān)于用戶畫像那些事洲敢,看這一文章就夠了

數(shù)據(jù)分析師必需具備的10種分析思維。

如何構(gòu)建大數(shù)據(jù)層級體系渗常,看這一文章就夠了

干貨 : 聚焦于用戶行為分析的數(shù)據(jù)產(chǎn)品

如何構(gòu)建大數(shù)據(jù)層級體系汗盘,看這一文章就夠了

80%的運(yùn)營注定了打雜隐孽?因?yàn)槟銢]有搭建出一套有效的用戶運(yùn)營體系

從底層到應(yīng)用菱阵,那些數(shù)據(jù)人的必備技能

讀懂用戶運(yùn)營體系:用戶分層和分群

做運(yùn)營必須掌握的數(shù)據(jù)分析思維,你還敢說不會做數(shù)據(jù)分析

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末褪贵,一起剝皮案震驚了整個(gè)濱河市脆丁,隨后出現(xiàn)的幾起案子动雹,更是在濱河造成了極大的恐慌胰蝠,老刑警劉巖茸塞,帶你破解...
    沈念sama閱讀 206,378評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異噪窘,居然都是意外死亡倔监,警方通過查閱死者的電腦和手機(jī)菌仁,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,356評論 2 382
  • 文/潘曉璐 我一進(jìn)店門济丘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人辱士,你說我怎么就攤上這事听绳∫握酰” “怎么了?”我有些...
    開封第一講書人閱讀 152,702評論 0 342
  • 文/不壞的土叔 我叫張陵峡竣,是天一觀的道長适掰。 經(jīng)常有香客問我荠列,道長肌似,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,259評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮固额,結(jié)果婚禮上斗躏,老公的妹妹穿的比我還像新娘瑟捣。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,263評論 5 371
  • 文/花漫 我一把揭開白布桑李。 她就那樣靜靜地躺著贵白,像睡著了一般。 火紅的嫁衣襯著肌膚如雪猬膨。 梳的紋絲不亂的頭發(fā)上勃痴,一...
    開封第一講書人閱讀 49,036評論 1 285
  • 那天热康,我揣著相機(jī)與錄音姐军,去河邊找鬼。 笑死著觉,一個(gè)胖子當(dāng)著我的面吹牛固惯,可吹牛的內(nèi)容都是我干的缴守。 我是一名探鬼主播屡穗,決...
    沈念sama閱讀 38,349評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼村砂,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了汛骂?” 一聲冷哼從身側(cè)響起帘瞭,我...
    開封第一講書人閱讀 36,979評論 0 259
  • 序言:老撾萬榮一對情侶失蹤蝶念,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后担敌,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體全封,經(jīng)...
    沈念sama閱讀 43,469評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡刹悴,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,938評論 2 323
  • 正文 我和宋清朗相戀三年颂跨,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了扯饶。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片尾序。...
    茶點(diǎn)故事閱讀 38,059評論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡每币,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出梦鉴,到底是詐尸還是另有隱情肥橙,我是刑警寧澤秸侣,帶...
    沈念sama閱讀 33,703評論 4 323
  • 正文 年R本政府宣布椭坚,位于F島的核電站搏色,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏巾表。R本人自食惡果不足惜集币,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,257評論 3 307
  • 文/蒙蒙 一鞠苟、第九天 我趴在偏房一處隱蔽的房頂上張望当娱。 院中可真熱鬧考榨,春花似錦、人聲如沸冀惭。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,262評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽扔嵌。三九已至痢缎,卻和暖如春牺弄,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背蛇捌。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評論 1 262
  • 我被黑心中介騙來泰國打工络拌, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留回溺,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,501評論 2 354
  • 正文 我出身青樓逸嘀,卻偏偏與公主長得像崭倘,于是被迫代替她去往敵國和親类垫。 傳聞我的和親對象是個(gè)殘疾皇子悉患,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,792評論 2 345

推薦閱讀更多精彩內(nèi)容

  • 基礎(chǔ)篇 第一章 數(shù)據(jù)可視化簡介 1.1 可視化釋義 在計(jì)算機(jī)學(xué)科的分類中:利用人眼的感知能力對數(shù)據(jù)進(jìn)行交互的可視表...
    TWLESVCNZ閱讀 4,883評論 1 12
  • 定義 數(shù)據(jù)可視化的目的其實(shí)就是直觀地展現(xiàn)數(shù)據(jù),例如讓花費(fèi)數(shù)小時(shí)甚至更久才能歸納的數(shù)據(jù)量售躁,轉(zhuǎn)化成一眼就能讀懂的指標(biāo)坞淮;...
    Kemr閱讀 3,096評論 0 20
  • 戀愛是甜蜜的 戀愛是浪漫的 可是談了很久了 為何對方還不想結(jié)婚碾盐? 有時(shí)候,一方覺得合適結(jié)婚了揩局,而另外一方始終無動于...
    45742a27dffe閱讀 284評論 0 0
  • 3月1日 星期三 晴 今天是二月初四了毫玖,按照農(nóng)歷算二妹都十個(gè)月了凌盯,也是我決定隔奶的第四天付枫,實(shí)際上已經(jīng)是第五天...
    鄭宇雅芯媽閱讀 292評論 0 0
  • 如果你百度千帆皆不能安裝通過那么請注意一下 npm 的版本npm WARN deprecated socks@1....
    Easy_VO閱讀 3,172評論 0 1