常用圖形
散點圖
散點圖用來表征兩個(如果多個就分面,如上圖)數(shù)值型變量間的關(guān)系汤善,每個點的位置(即x軸和y軸坐標(biāo))映射著兩個變量的值碰煌。當(dāng)然對于三個數(shù)值型變量吆视,也有三維散點圖捷枯,不過用得不多主慰。
氣泡圖
在散點圖的基礎(chǔ)上加一個維度苞尝,把各個點的面積大小映射一個新的變量霹购,這樣不僅點的位置還有大小表示數(shù)據(jù)特征柔滔。
折線圖
把散點圖各個散點用折線連接起來就成了折線圖溢陪,當(dāng)然不僅僅只是為了好看,當(dāng)散點越多睛廊,折線就越平滑地趨近于曲線形真,能更加貼切地反映連續(xù)型變量的規(guī)律。
面積圖
面積圖
把折線圖進一步往坐標(biāo)軸投影就成了面積圖超全,本質(zhì)其實跟折線圖沒區(qū)別咆霜,只是看起來更加飽滿一點邓馒。
柱狀圖
柱狀圖是一種用得很廣泛的圖形,它表征分類型變量 vs 數(shù)值型變量的關(guān)系蛾坯。如果分類型變量的每一個取值還能繼續(xù)分類光酣,那么簡單的柱狀圖就變成了復(fù)雜的柱狀圖,每一個類別僅由一根柱變成多根柱脉课,多根柱可以串列救军,也可以并列。
值得一提的是倘零,柱狀圖一般需要排序:如果分類型變量是有序的唱遭,按照它本身的順序排列即可;如果分類型變量無序呈驶,那么則根據(jù)數(shù)值型變量的大小進行排序胆萧,使柱狀圖的高度單調(diào)變化。(排序的宗旨是直觀的表達(dá)出想展示的規(guī)律)
條形圖
條形圖
只不過把柱狀圖坐標(biāo)旋轉(zhuǎn)一下俐东,豎著的變成橫著的跌穗,這個可根據(jù)版面自由選擇。上圖示例就是串列的堆疊條形圖虏辫。
南丁格爾玫瑰圖
玫瑰圖
本質(zhì)還是柱狀圖蚌吸,只不過把直角坐標(biāo)系映射成極坐標(biāo)系∑鲎看起來比柱狀圖更美觀羹唠。
瀑布圖
瀑布圖
瀑布圖是柱狀圖的一種延伸,它一般表示某個指標(biāo)隨時間的漲跌規(guī)律娄昆,每一個柱狀也不都是從0開始的佩微,而是從前一個柱狀的終點位置開始,這樣既反映了每一個時刻的漲跌情況萌焰,也反映了數(shù)值指標(biāo)在每一個時刻的值锣枝。
餅圖
餅圖
餅圖的本質(zhì)仍是柱狀圖,只不過餅圖一般用來表示各個類別的比例即彪,而不是絕對的數(shù)值甥啄,用角度來映射大小。
值得一提的是撼玄,因為一個圓餅只有360度夺姑,如果類別太多了,這個餅會被切割得非常細(xì)掌猛,不利于閱讀盏浙;這種情況下老老實實地用柱狀圖。
圓環(huán)圖
圓環(huán)圖
本質(zhì)就是餅圖,只不過把實心圓換成了空心的圓環(huán)废膘;如果清一色的餅圖太過單調(diào)竹海,可以考慮換個環(huán)形圖。
sunburst chart
sunburst chart
sunburst chart看起來跟餅圖比較像殖卑,但比餅圖更復(fù)雜得多站削。它從中心向外輻射,每輻射一層就細(xì)分一層孵稽,用來表示多個變量多層之間的比例關(guān)系许起。
馬賽克圖
馬賽克圖
馬賽克圖比較復(fù)雜,與柱狀圖相比菩鲜,它的分類變量就多了幾個园细,而且還能實現(xiàn)交叉映射,所以比柱狀圖更抽象接校,更細(xì)化猛频。
馬賽克圖隱含著大量的數(shù)據(jù)信息。例如:(1)從船員到頭等艙蛛勉,存活率陡然提高鹿寻;(2)大部分孩子都處在三等艙和二等艙中;(3)在頭等艙中的大部分女性都存活了下來诽凌,而三等艙中僅有一半女性存活毡熏;(4)船員中女性很少,導(dǎo)致該組的Survived標(biāo)簽重疊(圖底部的No和Yes)侣诵。繼續(xù)觀察痢法,你將發(fā)現(xiàn)更多有趣的信息。關(guān)注矩形的相對寬度和高度杜顺,你還能發(fā)現(xiàn)那晚其他什么秘密嗎财搁?
擴展的馬賽克圖添加了顏色和陰影來表示擬合模型的殘差值。在本例中躬络,藍(lán)色陰影表明尖奔,在假定生存率與船艙等級、性別和年齡層無關(guān)的條件下洗鸵,該類別下的生存率通常超過預(yù)期值越锈。紅色陰影則含義相反。一定要運行該例子的代碼膘滨,這樣你可以真實感受下著色圖形的效果。圖形表明稀拐,在模型的獨立條件下火邓,頭等艙女性存活數(shù)和男性船員死亡數(shù)超過模型預(yù)期值。如果存活數(shù)與船艙等級、性別和年齡層獨立铲咨,三等艙男性的存活數(shù)比模型預(yù)期值低躲胳。嘗試運行example(mosaic),可以了解更多馬賽克圖的細(xì)節(jié)纤勒。
直方圖
直方圖
<ins class="adsbygoogle" data-ad-layout="in-article" data-ad-format="fluid" data-ad-client="ca-pub-4251327906175578" data-ad-slot="2389390544" data-adsbygoogle-status="done" style="padding: 0px; margin: 0px; box-sizing: border-box; outline: none; display: block; text-align: center; height: 174px;"><ins id="aswift_1_expand" tabindex="0" title="Advertisement" aria-label="Advertisement" style="padding: 0px; margin: 0px; box-sizing: border-box; outline: none; display: inline-table; border: none; height: 174px; position: relative; visibility: visible; width: 696px; background-color: transparent;"><ins id="aswift_1_anchor" style="padding: 0px; margin: 0px; box-sizing: border-box; outline: none; display: block; border: none; height: 174px; position: relative; visibility: visible; width: 696px; background-color: transparent;"><iframe id="aswift_1" name="aswift_1" sandbox="allow-forms allow-popups allow-popups-to-escape-sandbox allow-same-origin allow-scripts allow-top-navigation-by-user-activation" width="696" height="174" frameborder="0" src="https://googleads.g.doubleclick.net/pagead/ads?guci=2.2.0.0.2.2.0.0&client=ca-pub-4251327906175578&output=html&h=174&slotname=2389390544&adk=1547160957&adf=2242710858&pi=t.ma~as.2389390544&w=696&fwrn=4&lmt=1608292375&rafmt=11&psa=1&format=696x174&url=https%3A%2F%2Fwemp.app%2Fposts%2F73c25cce-8802-4a61-be99-509a18436526&flash=0&wgl=1&uach=WyJXaW5kb3dzIiwiNi4xIiwieDg2IiwiIiwiODcuMC40MjgwLjg4IixbXV0.&tt_state=W3siaXNzdWVyT3JpZ2luIjoiaHR0cHM6Ly9hZHNlcnZpY2UuZ29vZ2xlLmNvbSIsInN0YXRlIjowfSx7Imlzc3Vlck9yaWdpbiI6Imh0dHBzOi8vYXR0ZXN0YXRpb24uYW5kcm9pZC5jb20iLCJzdGF0ZSI6MH1d&dt=1608291358225&bpp=8&bdt=629&idt=181&shv=r20201203&cbv=r20190131&ptt=9&saldr=aa&abxe=1&cookie=ID%3D3c59e5b8d892f057-22b80cb83dc5006a%3AT%3D1608214593%3ART%3D1608214593%3AS%3DALNI_MYyidpWGJBdchLHe8sdgpN9-3tV3g&prev_fmts=730x183%2C0x0%2C1903x937&nras=2&correlator=2900462400338&frm=20&pv=1&ga_vid=493208741.1608214605&ga_sid=1608291358&ga_hid=2036430223&ga_fc=0&rplot=4&u_tz=540&u_his=2&u_java=0&u_h=1080&u_w=1920&u_ah=1040&u_aw=1920&u_cd=24&u_nplug=3&u_nmime=4&adx=362&ady=11659&biw=1903&bih=880&scr_x=0&scr_y=8173&eid=21066699%2C21066792%2C42530672%2C21068944%2C21069711&oid=3&psts=AGkb-H9_5w2HaNE542OPJDPkl5PVvEuXuLY-J2vUThf_G2kso0yJGAmkNGnRR7Got7qJ&pvsid=4016868165384604&pem=729&rx=0&eae=0&fc=896&brdim=0%2C0%2C0%2C0%2C1920%2C0%2C1920%2C1040%2C1920%2C880&vis=1&rsz=%7C%7CeEbr%7C&abl=CS&pfx=0&fu=8320&bc=31&ifi=2&uci=a!2&btvi=1&fsb=1&xpc=WWPkzawZwZ&p=https%3A//wemp.app&dtd=M" marginwidth="0" marginheight="0" vspace="0" hspace="0" allowtransparency="true" scrolling="no" allowfullscreen="true" data-google-container-id="a!2" data-google-query-id="CPbjgfi71-0CFceDlgodSC0OAg" data-load-complete="true" style="padding: 0px; margin: 0px; box-sizing: border-box; outline: none; left: 0px; position: absolute; top: 0px; border: 0px; width: 696px; height: 174px;"></iframe></ins></ins></ins>
直方圖看起來跟柱狀圖很像坯苹,但其實本質(zhì)并不一樣 (這一點需要注意)。直方圖用來表征一個數(shù)值型變量的分布摇天,具體來說就是把這個連續(xù)型變量劃分成多個區(qū)間粹湃,然后統(tǒng)計各個區(qū)間的頻數(shù)。直方圖橫軸是數(shù)值型變量本身的值泉坐,縱軸是頻數(shù)为鳄。
概率密度曲線圖
概率密度曲線圖
概率密度曲線圖本質(zhì)與直方圖類似,不過縱軸不是頻數(shù)而是頻率腕让。正如折線圖和面積圖一樣孤钦,概率密度曲線圖也可自由選擇要不要面積投影。這個圖太學(xué)術(shù)了纯丸,一般出現(xiàn)在數(shù)學(xué)教材中(比如正態(tài)分布……)偏形。
雷達(dá)圖
雷達(dá)圖
很多游戲中的人物能力極向?qū)Ρ染褪且岳走_(dá)圖表示的。柱狀圖一般是一個分類型變量不同類別間的比較觉鼻,雷達(dá)圖可以是多個數(shù)值不在同一個scale之下俊扭;更具體地說,柱狀圖一般是橫向比較滑凉,雷達(dá)圖既可以多個觀測之間的縱向比較统扳,也可以是一個觀測在不同變量間的橫向比較。
值得一提的是畅姊,雷達(dá)圖如果用來橫向比較咒钟,需先把各個數(shù)值變量作歸一化處理。
箱線圖
箱線圖亦稱盒須圖若未,也是挺學(xué)術(shù)的一個圖朱嘴。它用來表征各個數(shù)值型變量的分布狀況,每一條橫線代表分位數(shù)粗合,盒內(nèi)部的橫線代表中位數(shù)萍嬉,點代表異常值。
小提琴圖
小提琴圖本質(zhì)與直方圖一樣隙疚,都是表征數(shù)值型變量的分布壤追,每一個小提琴的寬度代表它在該高度處的頻率范圍。
熱力圖
熱力圖一般以顏色來映射密度或者其他數(shù)值變量供屉,一般來說行冰,顏色最深的地方表示數(shù)據(jù)最集中溺蕉。(比較常用,對于熱圖的解釋還需要看圖例的含義)
日歷圖
日歷圖
日歷圖是熱力圖的變種悼做,它把每一個矩形重新排列成日歷的形狀疯特,這樣可以方便地觀察一段時間內(nèi)每一天的數(shù)值特征。
地圖
地圖
地圖用來可視化地理數(shù)據(jù)肛走,這些數(shù)據(jù)一般由國家地理測繪部門提供漓雅,在一些網(wǎng)站上也能找到,常用的數(shù)據(jù)格式有shp朽色、JSON邻吞、csv等。
地圖的繪制原理是基于大量的散點纵搁,勾勒成曲線吃衅,再連接成多邊形——其中每一塊多代形代表一個地區(qū),可以是國家腾誉、省徘层、市、區(qū)縣等利职。
地圖的應(yīng)用主兩有種情況:一是如上圖一樣以顏色填充每一個多邊形來映射一個指標(biāo)趣效,這種情況下地圖跟柱狀圖本質(zhì)相同,但是多了多邊形之間的位置關(guān)系猪贪;另一種是在地圖上疊加散點或者曲線跷敬,來表征各個點之間的地理位置。
地球圖
地球圖
地圖是二維的热押,三維的就是地球圖西傀。這種圖形一般是交互的,也就是說你可以用鼠標(biāo)實現(xiàn)地球的旋轉(zhuǎn)和縮放等操作桶癣。
值得一提的是拥褂,不要僅僅為了3D就使用地球圖,要看數(shù)據(jù)本身的情況牙寞。如果你的數(shù)據(jù)范圍本來就覆蓋全球饺鹃,用地球圖很合適;但如果你的數(shù)據(jù)范圍小间雀,就一個國內(nèi)悔详,甚至一個省市內(nèi)的,搞個地球圖就太浮夸惹挟,而且整個球上只有一個非常小的區(qū)域有數(shù)據(jù)茄螃,是很不和諧的。
網(wǎng)絡(luò)圖
網(wǎng)絡(luò)圖的元素包含點和邊连锯,邊分為無向邊责蝠、單向邊和雙向邊來表征點與點的連接關(guān)系党巾,邊的粗細(xì)可以映射這種關(guān)系的強弱萎庭。
arc diagram
arc diagram
arc diagram也是一種網(wǎng)絡(luò)圖霜医,只不過它把所有的節(jié)點一字排開,以弧線來表示邊驳规。這樣看起來藝術(shù)感更強肴敛,適合于節(jié)點較多的網(wǎng)絡(luò)關(guān)系可視化。
和弦圖
和弦圖一般用來表示雙向的網(wǎng)絡(luò)關(guān)系(比如AB兩個城市相互流入流出了多少人)吗购,數(shù)據(jù)結(jié)構(gòu)一般為鄰接矩陣医男。當(dāng)節(jié)點很多的時候,各種弧線交叉得就非常密密麻麻捻勉,這種情況下镀梭,要么交互,要么考慮別的圖形踱启。
hierarchical edge bundling
hierarchical edge bundling
hierarchical edge bundling也表示節(jié)點間的網(wǎng)絡(luò)關(guān)系报账,不過它把邊扭曲成曲線,這樣就適合節(jié)點比較多的可視化埠偿。
矩形樹圖
矩形樹圖
矩形樹圖本質(zhì)就是決策樹的可視化透罢,只不過排成矩形。它也是把各個變量層層細(xì)分冠蒋,這一點跟sunburst圖類似羽圃。當(dāng)變量比較多的時候,做成交互可縮放的形式更合適抖剿。
平行坐標(biāo)圖
平行坐標(biāo)圖
平行坐標(biāo)圖的優(yōu)點是可以把多個變量并形排開朽寞,把每一個記錄都以折線連接上。這樣當(dāng)數(shù)據(jù)量大的時候斩郎,其實可以很方便地觀察各個變量的分布情況脑融。
桑基圖
啥终疲基圖看起來跟平行坐標(biāo)圖有點像,但含義不一樣脓恕。赡に危基圖主要的用法是表征流量在各個層級的流動關(guān)系,上一層如何向下一層分散炼幔,下一層如何由下一層匯聚秋茫。
漏斗圖
漏斗圖
互聯(lián)網(wǎng)運營有一個很重要的概念就是層級轉(zhuǎn)化,這個每層的轉(zhuǎn)化率用漏斗圖來可視化乃秀,形神俱佳肛著。如果兩層之間的寬度近似圆兵,表征該層的轉(zhuǎn)化率高;如果兩層之間的寬度一下子減小了很多枢贿,表示轉(zhuǎn)化率低殉农。
儀表盤
儀表盤
儀表盤的觀賞性大于實用性,實際上它的功能很簡單局荚,就是表征一個數(shù)值型變量在最小值和最大值之間的什么分位超凳。
象柱形圖
象柱形圖
象柱形圖其實就是柱形圖,只不過把柱子換成了其它的圖形耀态。如果數(shù)據(jù)本身有比較具體轮傍、形象的含義和背景,那么用象柱形圖是一種比較新穎的選擇首装。
主題河流圖
主題河流圖
主題河流圖好看创夜,但不好解釋,如果不是交互式的仙逻,最好不要用驰吓。它一般是把多個類別隨時間的變化數(shù)據(jù)堆疊起來,表征隨時間變化的趨勢桨醋。
詞云圖
詞云圖即是對詞匯的頻數(shù)進行可視化棚瘟,一個詞越大它出現(xiàn)的次數(shù)就越多,一般與文本挖掘配合使用喜最。
在實際的數(shù)據(jù)可視化中偎蘸,往往不是孤立地用一個基本圖形,把多個圖形組合瞬内、鄰接迷雪,能交叉對比出更多的信息。比如在柱狀圖上疊加折線圖虫蝶,在地圖上疊加散點圖章咧,把多個柱狀圖放在一起對比等等。
記住數(shù)據(jù)可視化展現(xiàn)信息是第一位的能真,好看倒是其次赁严。
圖形語法
看了以上這么多圖形,對可視化圖形也有了一個感性的認(rèn)識》垲恚現(xiàn)在基于ggplot2
粗略地介紹一下圖形語法疼约,個人總結(jié),既不全面也不系統(tǒng)蝙泼;想學(xué)習(xí)全面的圖形語法請去專門學(xué)習(xí)程剥。
數(shù)據(jù)(data):數(shù)據(jù)才是圖形的靈魂,這點無需解釋汤踏。
幾何對象(geom):也就是圖形本身织鲸,這是可視化的外形舔腾。根據(jù)數(shù)據(jù)特征,選擇最合適的圖形搂擦。
映射(mapping):映射即使把數(shù)據(jù)和圖形給連接起來稳诚。映射什么數(shù)據(jù)變量,它是連續(xù)的還是離散的盾饮?
標(biāo)度(scale):這個是從數(shù)據(jù)中剝離采桃,但是控制數(shù)據(jù)如何映射到圖形上的屬性。圖形中用什么通道來映射丘损?常用的有顏色、長度工扎、面積徘钥、形狀、透明度等通道肢娘。
坐標(biāo)系(coord):坐標(biāo)系不一定非得是直角笛卡爾坐標(biāo)系呈础,比如對于地圖并不適合,所以要做專門的投影操作橱健。轉(zhuǎn)換坐標(biāo)系也有造成不同的視覺效果而钞,比如把柱狀圖的坐標(biāo)系轉(zhuǎn)換成極坐標(biāo)系就變成了玫瑰圖。
統(tǒng)計變換(stat):對數(shù)據(jù)進行常規(guī)的統(tǒng)計操作拘荡,不過也可以先把數(shù)據(jù)處理好臼节,可視化的時候就不再做變換。
分面(facet):如果圖形維度較高珊皿,并不是一張圖能說明的网缝,那么就分面處理。分面實際上是多加了一個維度蟋定,就像一頁紙和一頁書的區(qū)別粉臊。
位置(position):一般來說圖形各個元素的位置是由數(shù)據(jù)決定的,不過在不影響分析的前提下為了視覺美觀也可以做一些微調(diào)驶兜。比如有的散點圖只看它在y軸的高度扼仲,這個時候就可以在x軸上加擾動,沒必要很多點都擠在一起抄淑。
掌握了圖形語法屠凶,對理解可視化的本質(zhì),構(gòu)思圖形屬性很有幫助蝇狼;只有掌握了圖形語法阅畴,才能真正自由地去創(chuàng)造數(shù)據(jù)可視化,而不僅僅只是往模板里套數(shù)據(jù)迅耘。
交互方式
去年在浙大接受可視化培訓(xùn)時贱枣,陳為老師(浙大教授监署,國內(nèi)數(shù)據(jù)可視化領(lǐng)域比較權(quán)威的學(xué)者)提到了一句:交互性是數(shù)據(jù)可視化與信息圖的區(qū)別。什么是交互纽哥,就是用戶輸入一個信號钠乏,可視化系統(tǒng)能給出響應(yīng),以幫助他更好地理解可視化春塌。數(shù)據(jù)可視化的本質(zhì)是以簡單晓避、直接的圖形幫助讀者更容易理解數(shù)據(jù)背后的規(guī)律,但許多可視化圖形做得太復(fù)雜了只壳,反而不利于解讀俏拱,這個時候交互就能比較有效地解決這個問題。
交互的好處主要有:
節(jié)省空間吼句。想想看锅必,如果要把一個月每天的數(shù)據(jù)都做一張圖,難道要做30張圖惕艳?以交互的方式搞隐,讓用戶自己選擇哪一天,然后進行數(shù)據(jù)篩選远搪、計算劣纲、重新畫圖,1張圖就夠了谁鳍。
展現(xiàn)源數(shù)據(jù)癞季。圖形一般是對數(shù)據(jù)的具象化,所以它一般不展現(xiàn)具體的數(shù)字棠耕。但是當(dāng)用戶就想了解具體的數(shù)字余佛,不必再貼一張表格,把鼠標(biāo)移到對應(yīng)的位置就會彈出數(shù)據(jù)提示框窍荧。
引導(dǎo)性強辉巡。如果只把一張圖扔給用戶讓他們自己去理解,這樣體驗太差蕊退;配個人在一邊講解成本又太高郊楣。交互式可視化系統(tǒng)可以做引導(dǎo)模塊,引導(dǎo)用戶去探索瓤荔、理解净蚤,也能增加用戶的興趣和成就感。
常用配色
對于一個直男來說输硝,配色方案一直是很苦惱的問題今瀑。有條件的話最好找設(shè)計師參考,沒有的話最簡單的方法就是參考比較成功的可視化作品的配色風(fēng)格。
配色方案沒有具體的規(guī)律總結(jié)橘荠,主要靠感覺屿附。下面貼一些配色方案自行體會即可。
調(diào)色板
bootswatch
可在bootswatch上參考相關(guān)的CSS配色方案哥童。
常用工具
數(shù)據(jù)可視化的工具很多挺份,也有不多人已經(jīng)總結(jié)過,這里就大致提一下贮懈。
ggplot2
R最擅長的除了統(tǒng)計建模就是可視化了匀泊,而ggplot2是最流行、最強大的繪圖包(應(yīng)該沒有之一)朵你。對于靜態(tài)圖各聘,只要你有足夠的創(chuàng)意,ggplot2基本都可以通過其系統(tǒng)完備的畫圖語法實現(xiàn)撬呢。而R中也有相關(guān)的包可以把ggplo2圖形變成交互式伦吠,彌補了ggplot2本身不能交互的弱點。好色之旅
d3.js
d3.js個很強大的庫魂拦,許多先進、前衛(wèi)的圖形在上面都有demo搁嗓,它可以在較底層以較高的自由度畫圖并配置交互效果芯勘。但是它的學(xué)習(xí)曲線很陡,坑也較多腺逛。
echarts
echarts在江湖上被稱為”百度為數(shù)不多的良心產(chǎn)品“荷愕,這個庫跟d3相反,它離應(yīng)用層更近棍矛,提供了許多示例模板安疗,把代碼copy過去改改數(shù)據(jù)就行了。所以echarts的優(yōu)點是上手容易够委、圖表漂亮荐类、交互式效果也很好,缺點是自由度低茁帽,一旦你有個創(chuàng)意echarts沒提供對應(yīng)的模板玉罐,那就沒辦法了。
Excel
隨著Excel的發(fā)展潘拨,它的圖表也越來越豐富美觀吊输,很容易上手,仍然是把數(shù)據(jù)往模板里套的方式铁追。推薦 3 個超贊的 EXCEL 插件季蚂,讓你 5 分鐘從小白變大神
PS & AI
這兩個是設(shè)計師的工具,但是出了一張可視化的圖之后往往需要進一步修繕,這就是設(shè)計師的工作了扭屁∷闾福可以生成一張pdf矢量圖,然后導(dǎo)入PS或AI中疯搅,這樣對每一個元素操作都很方便濒生。生物AI插圖素材獲取和拼裝指導(dǎo) 文章用圖的修改和排版(2)
DataV
最后友情幫助阿里打個廣告。DataV很適合做大屏可視化展示幔欧,效果很炫酷罪治,而且模板越來越成熟,上手難度也越來越低礁蔗,同時價格也不貴觉义。
DataV做的大屏展示
思考一個問題:數(shù)據(jù)可視化到底是否需要編程?對于大數(shù)據(jù)量浴井、自由度要求較高晒骇、創(chuàng)意設(shè)計強的可視化應(yīng)當(dāng)要編程(特別是前端編程),但是對于日常小規(guī)模磺浙、簡化洪囤、通用的可視化,用工具即可撕氧。
而且隨著數(shù)據(jù)可視化技術(shù)的發(fā)展瘤缩,它的門檻一定是越來越低,越來越不需要編程也能做出很好的可視化效果伦泥。
應(yīng)用場景
大屏展示
這種情況一般是企業(yè)級的數(shù)據(jù)可視化應(yīng)用剥啤,一般是領(lǐng)導(dǎo)向客戶展示介紹產(chǎn)品和業(yè)務(wù)時所用,所以它的難度和工作量也最高不脯。大屏展示要求大氣府怯、炫酷、交互性強防楷。
原型分享
比如用R中的shiny快速搭建一個可視化原型牺丙,然后在公司內(nèi)部搭建一個內(nèi)網(wǎng)服務(wù)器部署上去,內(nèi)部同事都可以交互使用域帐,很方便地了解產(chǎn)品原型及數(shù)據(jù)規(guī)律赘被。這種情況下不必太花哨,但是要具體肖揣、清晰民假,還有要一定的交互性。
圖文報告
這個是放在報告中或者PPT (你和PPT高手之間龙优,就只差一個iSlide)中展示給別人看的羊异,所以靜態(tài)圖表就行事秀,這個難度最低。報告中的圖表要求簡潔野舶、清晰易迹、易于解讀。
可視化比賽體會
最后談?wù)勅ツ陞⒓拥?strong>阿里云天池公益云圖數(shù)據(jù)可視化創(chuàng)新大賽的體會平道,有幸能跟很優(yōu)秀的朋友組隊拿了冠軍睹欲,還能結(jié)識阿里官方工作人員以及不少同樣優(yōu)秀的朋友,收獲很大一屋。僅從數(shù)據(jù)可視化本身的角度來說窘疮,那場比賽也給了我深刻的體會:
數(shù)據(jù)可視化本身是表層的東西,可是一款優(yōu)秀的數(shù)據(jù)可視化一定要有深刻的內(nèi)涵冀墨。從技術(shù)的角度來說闸衫,要有大數(shù)據(jù)整理、數(shù)據(jù)分析和數(shù)據(jù)挖掘的智能因子在里面诽嘉;從背景的角度來說蔚出,可視化作品就如同文藝作品一樣要源于實際,高于實際虫腋,假大空骄酗、純粹只為了炫技的可視化并沒有什么意義。
不要只用套路悦冀,要有自己的創(chuàng)意和設(shè)計酥筝。有一些作品只不過純粹套用一下echarts的模板,除了數(shù)據(jù)改了一下雏门,其他都沒改;這種作品即使能過初賽掸掏,也不能過復(fù)賽茁影。
數(shù)據(jù)可視化是為了向別人展示,讓別人理解數(shù)據(jù)背后的背景和內(nèi)容的丧凤,也是整個數(shù)據(jù)分析的最后一環(huán)募闲。所以除了可視化作品本身,演講也是很重要的愿待,不要張口閉口一堆貌似高大上的技術(shù)浩螺,那只會適得其反;要講故事仍侥,講得越通俗要出、越有趣效果越好。