數(shù)據(jù)可視化捅厂,是指將相對晦澀的的數(shù)據(jù)通過可視的避乏、交互的方式進(jìn)行展示爷耀,從而形象、直觀地表達(dá)數(shù)據(jù)蘊(yùn)含的信息和規(guī)律拍皮。
早期的數(shù)據(jù)可視化作為咨詢機(jī)構(gòu)歹叮、金融企業(yè)的專業(yè)工具,其應(yīng)用領(lǐng)域較為單一铆帽,應(yīng)用形態(tài)較為保守咆耿。步入大數(shù)據(jù)時(shí)代,各行各業(yè)對數(shù)據(jù)的重視程度與日俱增爹橱,隨之而來的是對數(shù)據(jù)進(jìn)行一站式整合萨螺、挖掘、分析愧驱、可視化的需求日益迫切慰技,數(shù)據(jù)可視化呈現(xiàn)出愈加旺盛的生命力,表現(xiàn)之一就是視覺元素越來越多樣组砚,從樸素的柱狀圖/餅狀圖/折線圖吻商,擴(kuò)展到地圖、氣泡圖糟红、樹圖艾帐、儀表盤等各式圖形。表現(xiàn)之二是可用的開發(fā)工具越來越豐富盆偿,從專業(yè)的數(shù)據(jù)庫/財(cái)務(wù)軟件掩蛤,擴(kuò)展到基于各類編程語言的可視化庫,相應(yīng)的應(yīng)用門檻也越來越低陈肛。
數(shù)據(jù)可視化揍鸟,不僅僅是統(tǒng)計(jì)圖表。本質(zhì)上句旱,任何能夠借助于圖形的方式展示事物原理阳藻、規(guī)律、邏輯的方法都叫數(shù)據(jù)可視化谈撒。
數(shù)據(jù)可視化不僅是一門包含各種算法的技術(shù), 還是一個(gè)具有方法論的學(xué)科腥泥。一般而言,完整的可視化流程包括以下內(nèi)容:
可視化輸入:包括可視化任務(wù)的描述啃匿,數(shù)據(jù)的來源與用途蛔外,數(shù)據(jù)的基本屬性蛆楞、概念模型等;
可視化處理:對輸入的數(shù)據(jù)進(jìn)行各種算法加工夹厌,包括數(shù)據(jù)清洗豹爹、篩選、降維矛纹、聚類等操作臂聋,并將數(shù)據(jù)與視覺編碼進(jìn)行映射;
可視化輸出:基于視覺原理和任務(wù)特性或南,選擇合理的生成工具和方法孩等,生成可視化作品。
實(shí)際上采够,從“數(shù)據(jù)可視化”的命名肄方,便很容易看出數(shù)據(jù)可視化從業(yè)者如何開始可視化設(shè)計(jì),那便是:處理數(shù)據(jù)蹬癌,設(shè)計(jì)視覺扒秸,完成從數(shù)據(jù)空間到可視空間的映射, 必要時(shí)重復(fù)數(shù)據(jù)處理和圖形繪制的循環(huán)組合。
1. 分析數(shù)據(jù)
首先冀瓦,我們需要對數(shù)據(jù)做一個(gè)全面而細(xì)致的解讀,數(shù)據(jù)的特點(diǎn)決定著可視化的設(shè)計(jì)原則写烤。每項(xiàng)數(shù)據(jù)都有特定的屬性(或稱特征翼闽、維度)和對應(yīng)的值,一組屬性構(gòu)成特征列表洲炊。按照屬性的類型感局,數(shù)據(jù)可以分為數(shù)值型、有序型暂衡、類別型询微,數(shù)值型又可以進(jìn)一步分為固定零點(diǎn)和非固定零點(diǎn)。其中狂巢,固定零點(diǎn)數(shù)據(jù)囊括了我們大多數(shù)的數(shù)據(jù)對象撑毛,它們都可以對應(yīng)到數(shù)軸上的某個(gè)點(diǎn);非固定零點(diǎn)主要包括以數(shù)值表示的特定含義唧领,如表示地理信息的經(jīng)緯度藻雌、表示日期的年月日等,在分析非固定零點(diǎn)數(shù)據(jù)時(shí)斩个,我們更在意的是它們的區(qū)間胯杭。
在對數(shù)據(jù)做過預(yù)處理和分析之后,我們就能夠觀察出待處理數(shù)據(jù)的分布和維度受啥,再結(jié)合業(yè)務(wù)邏輯和可視化目標(biāo)做个,有可能還要對數(shù)據(jù)做某些變換鸽心,這些變換包括:
標(biāo)準(zhǔn)化,常用的手段包括(0居暖,1)標(biāo)準(zhǔn)化或(-1顽频,1)標(biāo)準(zhǔn)化,分別對應(yīng)的是sigmoid函數(shù)和tanh函數(shù)膝但,這么做的目的在于使數(shù)據(jù)合法和美觀冲九,但在這一過程中可能丟失影響數(shù)據(jù)分布、維度跟束、趨勢的信息莺奸,應(yīng)該予以特別注意;
擬合/平滑冀宴,為表現(xiàn)數(shù)據(jù)變化趨勢灭贷,使受眾對數(shù)據(jù)發(fā)展有所預(yù)測,我們會引入回歸來對數(shù)據(jù)進(jìn)行擬合略贮,以達(dá)到減少噪音甚疟,凸顯數(shù)據(jù)趨勢的目的;
采樣逃延,有些情況下览妖,數(shù)據(jù)點(diǎn)過多,以至于不易可視化或者影響視覺體驗(yàn)揽祥,我們會使用隨機(jī)采樣的方法抽取部分?jǐn)?shù)據(jù)點(diǎn)讽膏,抽樣結(jié)果與全集近似分布,同時(shí)不影響可視化元素的對比或趨勢拄丰;
降維府树,一般而言,同一可視化圖表中能夠承載的維度有限(很難超過3個(gè)維度)料按,必須對整個(gè)數(shù)據(jù)集進(jìn)行降維處理奄侠。
2. 可視化設(shè)計(jì)
在開始設(shè)計(jì)之前,我們需要對人類視覺以及注意力作簡要分析载矿,這決定著我們?nèi)绾卧诘谝粫r(shí)間抓住受眾的注意力垄潮。
人類視覺感知到心理認(rèn)知的過程要經(jīng)過信息的獲取、分析闷盔、歸納魂挂、解碼、儲存馁筐、概念涂召、提取、使用等一系列加工階段敏沉,每個(gè)階段需要不同的人體組織和器官參與果正。簡單來講炎码,人類視覺的特點(diǎn)是:
對亮度、運(yùn)動秋泳、差異更敏感潦闲,對紅色相對于其他顏色更為敏感;
對于具備某些特點(diǎn)的視覺元素具備很強(qiáng)的“腦補(bǔ)”能力迫皱,比如空間距離較近的點(diǎn)往往被認(rèn)為具有某些共同的特點(diǎn)歉闰;
對眼球中心正面物體的分辨率更高,這是由于人類晶狀體中心區(qū)域錐體細(xì)胞分布最為密集卓起;
人們在觀察事物時(shí)習(xí)慣于將具有某種方向上的趨勢的物體視為連續(xù)物體和敬;
人們習(xí)慣于使用“經(jīng)驗(yàn)”去感知事物整體,而忽略局部信息戏阅。
這里引入一個(gè)概念——可視編碼昼弟,它數(shù)據(jù)信息映射為可視化元素的技術(shù),其通常具有表達(dá)直觀奕筐、易于理解和記憶的特性舱痘。數(shù)據(jù)包含屬性和值,相應(yīng)可視編碼也由兩部分組成:標(biāo)記和視覺通道离赫,標(biāo)記代表數(shù)據(jù)屬性的分類芭逝,視覺通道表示人眼所能看到的各種元素的屬性,包括大小渊胸、形狀旬盯、顏色等,往往用來展示屬性的定量信息蹬刷。例如,對于柱狀圖而言频丘,標(biāo)記就是矩形办成,視覺通道就是矩形的顏色、高度或?qū)挾鹊取?/p>
數(shù)據(jù)可視化的設(shè)計(jì)目標(biāo)和制作原則在于信搂漠、達(dá)迂卢、雅,即一要精準(zhǔn)展現(xiàn)數(shù)據(jù)的差異桐汤、趨勢而克、規(guī)律,二要準(zhǔn)確傳遞核心思想怔毛,三要簡潔美觀员萍,不攜帶冗余信息。結(jié)合人的視覺特點(diǎn)拣度,很容易總結(jié)出好的數(shù)據(jù)可視化作品的基本特征:
讓用戶的視線聚焦在可視化結(jié)果中最重要的部分碎绎;
對于有對比需求的數(shù)據(jù),使用亮度、大小踢械、形狀來進(jìn)行編碼更佳贱枣;
使用盡量少的視覺通道編碼數(shù)據(jù),避免干擾信息日麸。
3. 可視編碼的選擇
如同只學(xué)過視聽語言并不能設(shè)計(jì)出可用的電影分鏡一樣寄啼,數(shù)據(jù)可視化這一藝術(shù)設(shè)計(jì)色彩濃厚的工作絕非做過幾個(gè)餅圖、柱狀圖就能勝任代箭。在開始涉足實(shí)踐講解之前墩划,我們需要解決以下疑問:?
可視化設(shè)計(jì)中優(yōu)先選擇哪些視覺通道?有多少種視覺通道可供使用梢卸?某個(gè)視覺通道能編碼什么信息走诞,能包含多少信息量?視覺通道表達(dá)信息能力的區(qū)別蛤高?哪些視覺通道互不相關(guān)而哪些又相互影響蚣旱??
看看下圖,或許能從一定程度上給出答案:
上圖列舉了數(shù)據(jù)可視化作品中常用的視覺編碼通道戴陡,針對同種數(shù)據(jù)類型塞绿,采用不同的視覺通道帶來的主觀認(rèn)知差異很大。數(shù)值型適合用能夠量化的視覺通道表示恤批,如坐標(biāo)异吻、長度等,使用顏色表示的效果就大打折扣喜庞,且容易引起歧義诀浪;類似地,序列型適合用區(qū)分度明顯的視覺通道表示延都,類別型適合用易于分組的視覺通道雷猪。
需要指出的是,上圖蘊(yùn)含的理念可以應(yīng)對絕大多數(shù)應(yīng)用場景下可視化圖形的設(shè)計(jì)“套路”晰房,但數(shù)據(jù)可視化作為視覺設(shè)計(jì)的本質(zhì)決定了“山無常勢求摇,水無常形”,任何可視化效果都拒絕生搬硬套殊者,更不要說數(shù)據(jù)可視化的應(yīng)用還要受到業(yè)務(wù)与境、場景和受眾的影響。
4. 配色
相信每一個(gè)碼農(nóng)出身的數(shù)據(jù)分析師在做可視化設(shè)計(jì)時(shí)猖吴,都會對色彩如何搭配產(chǎn)生過困惑摔刁。色彩理論看起來簡單卻又乏味,用起來卻不是那么得心應(yīng)手海蔽。那么簸搞,如何讓數(shù)據(jù)可視化作品簡約扁位、靈動、美觀趁俊?下面介紹一些通用技巧域仇。
1)色調(diào)與明度的跨度都要大
要確保配色非常容易辨識與區(qū)分,它們的明度差異一定要夠大寺擂。明度差異需要全局考慮暇务。但是,有一組明度跨度大的配色還不夠怔软。配色越多樣垦细,用戶越容易將數(shù)據(jù)與圖像聯(lián)系起來。如果能善加利用色調(diào)的變化挡逼,就能使用戶接受起來更加輕松括改。對于明度與色調(diào),跨度越大家坎,就能承載越多的數(shù)據(jù)嘱能。下圖展示了相同色系下不同明度的色階對比:
2)仿照自然的配色
各行各業(yè)的設(shè)計(jì)師都知道這個(gè)小秘密,對于數(shù)據(jù)可視化工程師而言虱疏,這招更是屢試不爽惹骂。一個(gè)簡單有效的方法是:找出心儀的圖片,比如唯美的風(fēng)景照片做瞪,使用photoshop中“濾鏡—馬賽克—調(diào)整多邊形形狀和大小”即可看到該圖片中包含的各種顏色对粪,然后利用吸管工具選出幾種顏色即可:
3)使用漸變
無論你需要2種顏色還是10種,漸變中都能提取出這些顏色装蓬,讓可視化圖表感覺自然著拭,同時(shí)保有足夠的色調(diào)與明度差異。一個(gè)使用漸變的好方法就是:在Photoshop中拉輔助線到斷點(diǎn)位置牍帚,與數(shù)據(jù)的數(shù)量對應(yīng)上儡遮,然后持續(xù)對漸變進(jìn)行測試與調(diào)整。
可以看到履羞,配色表緊挨著頂部的灰度漸變峦萎,調(diào)整漸變疊加(之后就能得到精確的漸變色值)屡久,然后從那些斷點(diǎn)處選取顏色忆首,測試配色在實(shí)際運(yùn)用中的效果。
4)使用配色工具
網(wǎng)上各種免費(fèi)資源比比皆是被环,對于想設(shè)計(jì)出靚麗效果又無計(jì)可施的人而言糙及,多參考以下這些工具是一個(gè)好辦法:
ColorHunt——高質(zhì)量配色方案,能夠快速預(yù)覽筛欢,如果你只需要4種顏色浸锨,這是絕佳的資源唇聘;
Kuler——photoshop配色工具,Adobe家出的柱搜,應(yīng)該錯(cuò)不了迟郎;
Chroma.js——Chroma.js是一個(gè)微型的JavaScript庫,適用于各種顏色處理的聪蘸,可實(shí)現(xiàn)各種顏色的轉(zhuǎn)換和色階處理宪肖;
Color brewer——地圖配色利器,如果你對基于地圖的可視化配色方案感到困惑健爬,這個(gè)在線工具應(yīng)該能夠幫到你控乾。
此外,關(guān)于配色還有一些小技巧可供參考:遵循公司既定的品牌風(fēng)格娜遵;根據(jù)數(shù)據(jù)描述的對象來定蜕衡,如數(shù)據(jù)描述的是咖啡,則可以考慮使用咖色系设拟;使用季節(jié)或者節(jié)日相關(guān)主題的色彩慨仿;如果你實(shí)在對顏色搭配感到頭疼,那就多使用萬能的“灰色”和陰影蒜绽。
統(tǒng)計(jì)圖表
統(tǒng)計(jì)圖表是使用最早的可視化圖形镶骗,在數(shù)百年的進(jìn)化過程中,逐漸形成了基本“套路”躲雅,符合人類感知和認(rèn)知鼎姊,進(jìn)而被廣泛接受。
常見于各種分析報(bào)告的有柱狀圖相赁、折線圖相寇、餅圖、散點(diǎn)圖钮科、氣泡圖唤衫、雷達(dá)圖,對于這些最常用的圖表類型绵脯,下表可以為你指明大致方向:
我們在制作可視化圖表時(shí)佳励,首先要從業(yè)務(wù)出發(fā),優(yōu)先挑選合理的蛆挫、符合慣例的圖表赃承,尤其是如果你的用戶層次比較多樣的情況下,請兼顧各個(gè)年齡段或者不同認(rèn)知能力的用戶的需求悴侵;其次是根據(jù)數(shù)據(jù)的各種屬性和統(tǒng)計(jì)圖表的特點(diǎn)來選擇瞧剖,例如餅圖并不適合用作展示絕對數(shù)值,只適用于反映各部分的比例。對于常用圖表抓于,帶著目的出發(fā)做粤,遵循各種約束,相信你能找到合適的圖表:
除了常用的圖表之外捉撮,可供我們選擇的還有:
漏斗圖:漏斗圖適用于業(yè)務(wù)流程比較規(guī)范怕品、周期長、環(huán)節(jié)多的流程分析巾遭,通過漏斗各環(huán)節(jié)業(yè)務(wù)數(shù)據(jù)的比較堵泽,能夠直觀地發(fā)現(xiàn)和說明問題所在。
(矩形)樹圖:一種有效的實(shí)現(xiàn)層次結(jié)構(gòu)可視化的圖表結(jié)構(gòu)恢总,適用于表示類似文件目錄結(jié)構(gòu)的數(shù)據(jù)集迎罗;
熱力圖:以特殊高亮的形式顯示訪客熱衷的頁面區(qū)域和訪客所在的地理區(qū)域的圖示,它基于GIS坐標(biāo)片仿,用于顯示人或物品的相對密度纹安;
關(guān)系圖:基于3D空間中的點(diǎn)—線組合,再加以顏色砂豌、粗細(xì)等維度的修飾厢岂,適用于表征各節(jié)點(diǎn)之間的關(guān)系;
詞云:各種關(guān)鍵詞的集合阳距,往往以字體的大小或顏色代表對應(yīng)詞的頻次塔粒;
桑基圖:一種有一定寬度的曲線集合表示的圖表筐摘,適用于展現(xiàn)分類維度間的相關(guān)性卒茬,以流的形式呈現(xiàn)共享同一類別的元素?cái)?shù)量,比如展示特定群體的人數(shù)分布等咖熟;
日歷圖:顧名思義圃酵,以日歷為基本維度的對單元格加以修飾的圖表。
數(shù)據(jù)可視化的工具
新型的數(shù)據(jù)可視化產(chǎn)品層出不窮馍管,基本上各種語言都有自己的可視化庫郭赐,傳統(tǒng)數(shù)據(jù)分析及BI軟件也都擴(kuò)展出一定的可視化功能,再加上專門的用于可視化的成品軟件确沸,我們的可選范圍實(shí)在是太多了捌锭。那么,我們要選擇的可視化工具罗捎,必須滿足互聯(lián)網(wǎng)爆發(fā)的大數(shù)據(jù)需求观谦,必須快速的收集、篩選宛逗、分析坎匿、歸納盾剩、展現(xiàn)決策者所需要的信息雷激,并根據(jù)新增的數(shù)據(jù)進(jìn)行實(shí)時(shí)更新替蔬。
實(shí)時(shí)性:數(shù)據(jù)可視化工具必須適應(yīng)大數(shù)據(jù)時(shí)代數(shù)據(jù)量的爆炸式增長需求,必須快速的收集分析數(shù)據(jù)屎暇、并對數(shù)據(jù)信息進(jìn)行實(shí)時(shí)更新承桥;
簡單操作:數(shù)據(jù)可視化工具滿足快速開發(fā)、易于操作的特性根悼,能滿足互聯(lián)網(wǎng)時(shí)代信息多變的特點(diǎn)凶异;
更豐富的展現(xiàn):數(shù)據(jù)可視化工具需具有更豐富的展現(xiàn)方式,能充分滿足數(shù)據(jù)展現(xiàn)的多維度要求挤巡;
多種數(shù)據(jù)集成支持方式:數(shù)據(jù)的來源不僅僅局限于數(shù)據(jù)庫剩彬;很多數(shù)據(jù)可視化工具都支持團(tuán)隊(duì)協(xié)作數(shù)據(jù)、數(shù)據(jù)倉庫矿卑、文本等多種方式喉恋,并能夠通過互聯(lián)網(wǎng)進(jìn)行展現(xiàn)。
數(shù)據(jù)可視化主要通過編程和非編程兩類工具實(shí)現(xiàn)母廷。主流編程工具包括以下三種類型:從藝術(shù)的角度創(chuàng)作的數(shù)據(jù)可視化轻黑,比較典型的工具是 Processing,它是為藝術(shù)家提供的編程語言琴昆;從統(tǒng)計(jì)和數(shù)據(jù)處理的角度氓鄙,既可以做數(shù)據(jù)分析,又可以做圖形處理业舍,如R抖拦,SAS;介于兩者之間的工具舷暮,既要兼顧數(shù)據(jù)處理蟋座,又要兼顧展現(xiàn)效果,D3.js脚牍、Echarts都是很不錯(cuò)的選擇向臀,二者這種基于Javascript的數(shù)據(jù)可視化工具更適合在互聯(lián)網(wǎng)上互動的展示數(shù)據(jù)。
1. 入門級
入門級的意思是該工具是可視化工作者必須掌握的技能诸狭,難度不一定小券膀、門檻也不一定低。相反驯遇,對于可視化大拿來說芹彬,這些工具依舊起到四兩撥千斤的妙用。
Excel
別以為EXCEL只會處理表格叉庐,你可以把它當(dāng)成數(shù)據(jù)庫舒帮,也可以把它當(dāng)成IDE,甚至可以把它當(dāng)成數(shù)據(jù)可視化工具來使用。它可以創(chuàng)建專業(yè)的數(shù)據(jù)透視表和基本的統(tǒng)計(jì)圖表玩郊,但由于默認(rèn)設(shè)置了顏色肢执、線條和風(fēng)格,使其難以創(chuàng)建用于看上去“高大上”視覺效果译红。盡管如此预茄,我仍然推薦你使用Excel。?
Tableau
相信每一個(gè)接觸到數(shù)據(jù)可視化的人都聽說過Tableau侦厚,它需要一些結(jié)構(gòu)化的數(shù)據(jù)耻陕, 也需要你懂一些BI。 它不需要編程刨沦,而僅僅通過簡單的拖拽操作即可完成驚艷的效果诗宣。對比Excel,它是專業(yè)應(yīng)對數(shù)據(jù)可視化方案的利器想诅,主要表現(xiàn)在數(shù)據(jù)可視化梧田、聚焦/深挖、靈活分析侧蘸、交互設(shè)計(jì)等功能裁眯。Tableau最大的缺點(diǎn)在于它是商業(yè)軟件,個(gè)人使用的話只有14天的免費(fèi)期讳癌,而官方售價(jià)不菲穿稳。
2. 在線數(shù)據(jù)可視化
Google Charts
Google Charts是一個(gè)免費(fèi)的開源js庫,使用起來非常簡單晌坤,只需要在script標(biāo)簽中將src指向https://www.gstatic.com/charts/loader.js然后即可開始繪制逢艘。它支持HTML5/SVG,可以跨平臺部署骤菠,并特意為兼容舊版本的IE采用了vml它改。
在新版google?charts 發(fā)布之前,google有個(gè)類似的產(chǎn)品叫做Google Charts API商乎,不同之處在于后者使用http請求的方式將參數(shù)提交到api央拖,而后接口返回一張png圖片。如打開http://chart.googleapis.com/chart?cht=bvg&chs=250x150&chd=s:Monkeys&chxt=x,y&chxs=0,ff0000,12,0,lt|1,0000ff,10,1,lt鹉戚,即可顯示下圖:
Flot
Flot是一個(gè)很棒的線圖和條形圖創(chuàng)建工具鲜戒,可以運(yùn)用于支持canvas的所有瀏覽器——意味著大多數(shù)主流瀏覽器。這是一個(gè)jQuery庫抹凳,如果你已經(jīng)熟悉jQuery遏餐,你就可以容易的對圖像進(jìn)行回調(diào)、風(fēng)格和行為操作赢底。?浮懸的優(yōu)點(diǎn)是你可以訪問大量的調(diào)用函數(shù)失都,這樣就可以運(yùn)行你自己的代碼柏蘑。設(shè)定一種風(fēng)格,可以讓在用戶懸停鼠標(biāo)粹庞、點(diǎn)擊咳焚、移開鼠標(biāo)時(shí)展示不同的效果。比起其他制圖工具信粮,浮懸給予你更多的靈活空間。浮懸提供的選項(xiàng)不多趁啸,但它可以很好地執(zhí)行常見的功能强缘。?
D3
D3(Data Driven Documents)是支持SVG渲染的另一種JavaScript庫。但是D3能夠提供大量線性圖和條形圖之外的復(fù)雜圖表樣式不傅,例如Voronoi圖旅掂、樹形圖、圓形集群和單詞云等访娶。D3.js是數(shù)據(jù)驅(qū)動文件(Data-Driven Documents)的縮寫商虐,他通過使用HTML\CSS和SVG來渲染精彩的圖表和分析圖。D3對網(wǎng)頁標(biāo)準(zhǔn)的強(qiáng)調(diào)足以滿足在所有主流瀏覽器上使用的可能性崖疤,使你免于被其他類型架構(gòu)所捆綁的苦惱秘车,它可以將視覺效果很棒的組件和數(shù)據(jù)驅(qū)動方法結(jié)合在一起。
Echarts
百度出品的優(yōu)秀產(chǎn)品之一劫哼,也是國內(nèi)目前開源項(xiàng)目中少有的精品叮趴。一個(gè)純 Javascript 的圖表庫,可以流暢的運(yùn)行在 PC 和移動設(shè)備上权烧,兼容當(dāng)前絕大部分瀏覽器,底層依賴輕量級的 Canvas 類庫 ZRender妻率,提供直觀板祝,生動宫静,可交互,可高度個(gè)性化定制的數(shù)據(jù)可視化圖表囊嘉。3.0版本中更是加入了更多豐富的交互功能以及更多的可視化效果革为,并且對移動端做了深度的優(yōu)化扭粱。Echarts最令人心動的是它豐富的圖表類型,以及極低的上手難度琢蛤。
Highcharts
在Echarts出現(xiàn)之初,功能還不是那么完善套才,可視化工作者往往會選擇HighCharts慕淡。Highcharts 系列軟件包含 Highcharts JS,Highstock JS傻寂,Highmaps JS 共三款軟件携兵,均為純 JavaScript 編寫的 HTML5 圖表庫。Highcharts 是一個(gè)用純 JavaScript 編寫的一個(gè)圖表庫静檬, 能夠很簡單便捷的在 Web 網(wǎng)站或是 Web 應(yīng)用程序添加有交互性的圖表并级。Highstock 是用純 JavaScript 編寫的股票圖表控件嘲碧,可以開發(fā)股票走勢或大數(shù)據(jù)量的時(shí)間軸圖表,Highmaps 是一款基于 HTML5 的優(yōu)秀地圖組件钉迷。
R
嚴(yán)格來說钠署,R是一種數(shù)據(jù)分析語言,與matlab舰蟆、GNU Octave并列狸棍。然而ggplot2的出現(xiàn)讓R成功躋身于可視化工具的行列草戈,作為R中強(qiáng)大的作圖軟件包,ggplot2牛在其自成一派的數(shù)據(jù)可視化理念唐片。它將數(shù)據(jù)、數(shù)據(jù)相關(guān)繪圖茧球、數(shù)據(jù)無關(guān)繪圖分離抢埋,并采用圖層式的開發(fā)邏輯弹灭,且不拘泥于規(guī)則穷吮,各種圖形要素可以自由組合福侈。當(dāng)熟悉了ggplot2的基本套路后卢未,數(shù)據(jù)可視化工作將變得非常輕松而有條理。
DataV
阿里出品的數(shù)據(jù)可視化解決方案伟墙,之所以推薦DataV這個(gè)后起之秀戳葵,完全是因?yàn)樘詫氹p“11”活動中實(shí)時(shí)互動大屏幕太搶眼了汉匙。DataV支持多種數(shù)據(jù)源,尤其是和阿里系各種數(shù)據(jù)庫完美銜接戏自,如果你的數(shù)據(jù)本身就存在阿里云上伤锚,那選用DataV肯定是個(gè)省時(shí)省力的好辦法屯援。圖表方面,DataV內(nèi)置了豐富的圖表模板弯淘,支持實(shí)時(shí)數(shù)據(jù)采集和解析吉懊。
3. 類GUI數(shù)據(jù)可視化
?
Crossfilter?
Crossfilter 是一個(gè)用來展示大數(shù)據(jù)集的 JavaScript 庫,它可以把數(shù)據(jù)可視化和GUI控件結(jié)合起來废登,按鈕郁惜、下拉和滑塊演變成更復(fù)雜的界面元素兆蕉,使你擴(kuò)展內(nèi)容,同時(shí)改變輸入?yún)?shù)和數(shù)據(jù)易稠。交互速度超快包蓝,甚至在上百萬或者更多數(shù)據(jù)下都很快测萎。Crossfilter也是一種JavaScript庫,它可以在幾乎不影響速度的前提下對數(shù)據(jù)創(chuàng)建過濾器份乒,將過濾后的數(shù)據(jù)用于展示或辖,且涉及有限維度枣接,因此可以完成對海量數(shù)據(jù)集的篩選與加載月腋。
4. 進(jìn)階工具
?
Processing?
Processing 是用 Java 編程語言寫的,并且 Java 語言也是在語言樹中最接近 Processing 的片拍。所以捌省,如果您熟悉 C 或 Java 語言碉钠,Processing 將很容易學(xué)卷拘。Processing 并不包括 Java 語言的一些較為高級的特性栗弟,但這些特性中的很多特性均已集成到了 Processing工闺。如今陆蟆,圍繞它已經(jīng)形成了一個(gè)專門的社區(qū)(https://www.openprocessing.org),致力于構(gòu)建各種庫以供用這種語言和環(huán)境進(jìn)行動畫改鲫、可視化像棘、網(wǎng)絡(luò)編程以及很多其他的應(yīng)用诊县。
Processing 是一個(gè)很棒的進(jìn)行數(shù)據(jù)可視化的環(huán)境依痊,具有一個(gè)簡單的接口怎披、一個(gè)功能強(qiáng)大的語言以及一套豐富的用于數(shù)據(jù)以及應(yīng)用程序?qū)С龅臋C(jī)制凉逛。
Weka
Weka是一個(gè)能根據(jù)屬性分類和集群大量數(shù)據(jù)的優(yōu)秀工具,Weka不但是數(shù)據(jù)分析的強(qiáng)大工具毫胜,還能生成一些簡單的圖表酵使。weka首先是一個(gè)數(shù)據(jù)挖掘的利器焙糟,它能夠快速導(dǎo)入我們的結(jié)構(gòu)化數(shù)據(jù)穿撮,然后對數(shù)據(jù)屬性做分類痪欲、聚類分析业踢,幫助我們理解數(shù)據(jù)礁扮。但他的可視化功能同樣不遜色深员,選擇界面中的visualization,你會立刻明白:是它讓你理解數(shù)據(jù)遮糖,然后你才讓用戶可視化數(shù)據(jù)叠赐。
結(jié)語
我們所處的這個(gè)時(shí)代芭概,是一個(gè)知識大爆發(fā)的時(shí)代罢洲。僅就編程這項(xiàng)技能來說,現(xiàn)在幾乎人人都能寫上一兩行殿较,程序員這個(gè)群體也比十年前有了更多維度上的擴(kuò)展桩蓉。各種工具的使用門檻越來越低院究,帶來的是行業(yè)壁壘日漸消弭。會用某種可視化手段伙窃,并不是區(qū)分小白與專家的唯一標(biāo)準(zhǔn)对供,筆者曾聽說有人拿unity、易語言這樣的神器來實(shí)現(xiàn)可視化鹅髓。所以窿冯,眼花繚亂的工具永遠(yuǎn)只是輔助确徙,真正決定你在可視化道路上走多遠(yuǎn)的鄙皇,是你對可視化理念的準(zhǔn)確把握和執(zhí)著堅(jiān)守。
參考資料:
1. 清華大學(xué)數(shù)據(jù)可視化課程講義——張松海
2.《基本圖表的特點(diǎn)和適用場合》
3.《20 款數(shù)據(jù)可視化工具》
4.《50個(gè)大數(shù)據(jù)可視化分析工具》
END
轉(zhuǎn)自:數(shù)據(jù)派THU 公眾號缠沈;本文獲授權(quán)洲愤;
版權(quán)聲明:本號內(nèi)容部分來自互聯(lián)網(wǎng)顷锰,轉(zhuǎn)載請注明原文鏈接和作者官紫,如有侵權(quán)或出處有誤請和我們聯(lián)系。
關(guān)聯(lián)閱讀
原創(chuàng)系列文章:
1:從0開始搭建自己的數(shù)據(jù)運(yùn)營指標(biāo)體系(概括篇)
2 :從0開始搭建自己的數(shù)據(jù)運(yùn)營指標(biāo)體系(定位篇)
3 :從0開始搭建自己的數(shù)據(jù)運(yùn)營體系(業(yè)務(wù)理解篇)
4 :數(shù)據(jù)指標(biāo)的構(gòu)建流程與邏輯
5 :系列 :從數(shù)據(jù)指標(biāo)到數(shù)據(jù)運(yùn)營指標(biāo)體系
6: ??實(shí)戰(zhàn) :為自己的公號搭建一個(gè)數(shù)據(jù)運(yùn)營指標(biāo)體系
數(shù)據(jù)運(yùn)營關(guān)聯(lián)文章閱讀:
運(yùn)營入門慎框,從0到1搭建數(shù)據(jù)分析知識體系
推薦 :數(shù)據(jù)分析師與運(yùn)營協(xié)作的9個(gè)好習(xí)慣
干貨 :手把手教你搭建數(shù)據(jù)化用戶運(yùn)營體系
推薦 :最用心的運(yùn)營數(shù)據(jù)指標(biāo)解讀
干貨 : 如何構(gòu)建數(shù)據(jù)運(yùn)營指標(biāo)體系
從零開始,構(gòu)建數(shù)據(jù)化運(yùn)營體系
干貨 :解讀產(chǎn)品薪丁、運(yùn)營和數(shù)據(jù)三個(gè)基友關(guān)系
干貨 :從0到1搭建數(shù)據(jù)運(yùn)營體系
數(shù)據(jù)分析严嗜、數(shù)據(jù)產(chǎn)品?關(guān)聯(lián)文章閱讀:
干貨 :數(shù)據(jù)分析團(tuán)隊(duì)的搭建和思考
如何構(gòu)建大數(shù)據(jù)層級體系渗常,看這一文章就夠了
干貨 : 聚焦于用戶行為分析的數(shù)據(jù)產(chǎn)品
如何構(gòu)建大數(shù)據(jù)層級體系汗盘,看這一文章就夠了
80%的運(yùn)營注定了打雜隐孽?因?yàn)槟銢]有搭建出一套有效的用戶運(yùn)營體系