數(shù)據(jù)可視化高階技巧——以哈伯曼癌癥生存數(shù)據(jù)為例

什么是數(shù)據(jù)可視化充包?

“一千個讀者就有一千個哈姆雷特∫4唬”這句話也同樣適用于數(shù)據(jù)分析,不同的人對于數(shù)據(jù)也會有著不同的理解冠场。數(shù)據(jù)可視化可以幫助我們以更簡單的方式去分析數(shù)據(jù)和找到數(shù)據(jù)背后隱藏的信息家浇。數(shù)據(jù)可視化涵蓋的知識點非常多碴裙,我嘗試結(jié)合使用哈伯曼的癌癥生存數(shù)據(jù)点额,來看看數(shù)據(jù)可視化是如何幫助我們在一堆雜亂無章的數(shù)據(jù)中找到隱藏的信息的,讓我們開始吧莺琳!

為什么要做數(shù)據(jù)可視化?

數(shù)據(jù)可視化是一種可以通過數(shù)據(jù)創(chuàng)建故事的方式惭等。當數(shù)據(jù)很復(fù)雜并且需要了解微觀細節(jié)至關(guān)重要時珍手,最好的方法是通過視覺效果來分析數(shù)據(jù)辞做。

?

視覺效果可用于兩個目的:

1琳要、探索性數(shù)據(jù)分析:數(shù)據(jù)分析師秤茅、統(tǒng)計學(xué)家和數(shù)據(jù)科學(xué)家使用它來更好地理解數(shù)據(jù)。正如其名框喳,它用于探索數(shù)據(jù)中隱藏的信息和趨勢孔厉。

2帖努、解釋性數(shù)據(jù)分析:一旦數(shù)據(jù)分析師理解了數(shù)據(jù)并找到了他們的結(jié)果撰豺,傳達他們想法的最佳方式就是通過視覺效果拼余。數(shù)據(jù)可視化就像是創(chuàng)作一個故事,以達到吸引觀眾閱讀的目的匙监。

?

哈伯曼生存數(shù)據(jù)的探索性分析

該數(shù)據(jù)集包含 1958 年至 1970 年在芝加哥大學(xué)比林斯醫(yī)院進行的一項研究案例凡橱,該研究主要針對接受過乳腺癌手術(shù)的患者的生存情況亭姥。

?

屬性包括

手術(shù)時患者年齡(數(shù)字)

患者的手術(shù)年份(年份 – 1900,數(shù)字)

檢測到的陽性腋窩淋巴結(jié)數(shù)量(數(shù)字)

生存狀態(tài)(類別屬性)

1 = 患者存活 5 年或更長時間

2 = 患者在 5 年內(nèi)死亡

?

讓我們首先從使用統(tǒng)計來理解數(shù)據(jù)開始:

?

我們看到有 306 行和 4 列达罗。進一步查看屬性后坝撑,我們了解了數(shù)據(jù)的分布方式。為了進一步了解每個類的示例數(shù)量巡李,讓我們看看不同的圖。

?

直方圖

這里可以看到兩種狀態(tài)下的患者都是在30到 80年在兩個年齡段之間重疊,而40-60歲這個年齡段的比例都是最高的扶认,60-80歲年齡段的人生存和死亡的機會相等,80歲以上的人無法存活的可能性更高辐宾。但是狱从,僅憑年齡無法判斷一個人是否會存活。

?

箱形圖

箱線圖可以告訴我們兩種生存狀態(tài)下季研,患者的淋巴結(jié)數(shù)量的最大值鸽疾、最小值训貌、中位數(shù)、四分位數(shù)分布以及異常值分布情況递沪。

?

散點圖

我們從零散的點看,無論在哪一年综液,有0個淋巴結(jié)的患者都是幸存者。這是否意味著只要是0個淋巴結(jié)的患者都能確保生存谬莹?

?

小提琴圖

小提琴圖用來顯示數(shù)據(jù)分布和概率密度檩奠,中間的黑色粗條表示四分位數(shù)范圍附帽,從其延伸的幼細黑線代表 95% 置信區(qū)間埠戳,而白點則為中位數(shù)蕉扮,從上述圖形中可以看出兩種生存狀態(tài)下的幸存者的淋巴結(jié)數(shù)量分布是不一樣的。

?

根據(jù)上述的案例喳钟,我們從視覺效果中學(xué)到很多東西屁使,為了方便大家更好地學(xué)習(xí)數(shù)據(jù)可視化奔则,我整理了一些必備的數(shù)據(jù)可視化工具來幫助您入門蛮寂。

?

數(shù)據(jù)可視化工具

Tableau:可視化功能非常強大易茬,主要應(yīng)用在商業(yè)圖表上。

Power BI:微軟自家的可視化工具抽莱,功能強悍除嘹,可用于做多維分析、數(shù)據(jù)清洗尉咕、數(shù)據(jù)可視化等工作。

Excel:這個不用多說了璃岳,職場必備的數(shù)據(jù)分析與可視化工具年缎。

Smartbi智分析:這是國產(chǎn)數(shù)據(jù)分析工具里用的非常廣泛的工具,在線上就可以直接使用单芜,無需安裝客戶端蜕该。圖形化界面也非常豐富洲鸠,包含了地圖可視化、詞云圖扒腕、删畹恚基圖等個性化的圖形,可視化功能非常強大皆的。

?

數(shù)據(jù)可視化方法論

配色方案:雖然顏色可以為圖表增添美感,但通常最好使用顏色來突出重要的細節(jié)蹋盆,而不僅僅是為了吸引人,太多的顏色會破壞著色的目的栖雾,而使用單一顏色或一種顏色則會閱讀者楞抡。此外,在設(shè)計視覺效果時還要考慮視障人士拌倍,直觀地使用顏色。例如:對于情感分析噪径,我們可以使用綠色表示積極情緒柱恤,紅色表示消極情緒找爱,黑白灰表示中性情緒。

?

圖形使用:不一樣的圖形可以表達出不同的含義车摄,例如餅狀圖表示占比寺谤,線圖表示趨勢,柱圖可表示對比变屁,使用圖形時要根據(jù)圖形的特性去適當運用。

?

使用注釋:在需要的地方使用標簽進行注釋意狠,可以讓圖表里的信息更加全面粟关,但切記不要造成圖表混亂环戈。

?

使用交互式圖表:如果數(shù)據(jù)量比較大澎灸,變量非常多,可以使用交互式報表進行動態(tài)展示遮晚,例如BI圖表性昭。

?

刪除不重要的信息:從圖表中刪除可能分散觀眾注意力的不必要的信息县遣,不要在單個視覺對象中將多個視圖組合到難以理解的程度。

?

制作一個完整的故事:把數(shù)據(jù)可視化的過程當成是故事的創(chuàng)作過程萧求,讓讀者可以沉浸集中并能領(lǐng)會到作者的意圖其兴。


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末饭聚,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子秒梳,更是在濱河造成了極大的恐慌,老刑警劉巖箕速,帶你破解...
    沈念sama閱讀 216,324評論 6 498
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異盐茎,居然都是意外死亡兴垦,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,356評論 3 392
  • 文/潘曉璐 我一進店門探越,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人窑业,你說我怎么就攤上這事〕1” “怎么了鲤氢?”我有些...
    開封第一講書人閱讀 162,328評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長卷玉。 經(jīng)常有香客問我,道長喷市,這世上最難降的妖魔是什么相种? 我笑而不...
    開封第一講書人閱讀 58,147評論 1 292
  • 正文 為了忘掉前任品姓,我火速辦了婚禮沃测,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘食茎。我一直安慰自己蒂破,他們只是感情好别渔,可當我...
    茶點故事閱讀 67,160評論 6 388
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著哎媚,像睡著了一般喇伯。 火紅的嫁衣襯著肌膚如雪拨与。 梳的紋絲不亂的頭發(fā)上稻据,一...
    開封第一講書人閱讀 51,115評論 1 296
  • 那天买喧,我揣著相機與錄音,去河邊找鬼淤毛。 笑死今缚,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的低淡。 我是一名探鬼主播,決...
    沈念sama閱讀 40,025評論 3 417
  • 文/蒼蘭香墨 我猛地睜開眼蔗蹋,長吁一口氣:“原來是場噩夢啊……” “哼何荚!你這毒婦竟也來了猪杭?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,867評論 0 274
  • 序言:老撾萬榮一對情侶失蹤胁孙,失蹤者是張志新(化名)和其女友劉穎唠倦,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體稠鼻,經(jīng)...
    沈念sama閱讀 45,307評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,528評論 2 332
  • 正文 我和宋清朗相戀三年狂票,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,688評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡慌盯,死狀恐怖周霉,靈堂內(nèi)的尸體忽然破棺而出亚皂,到底是詐尸還是另有隱情俱箱,我是刑警寧澤灭必,帶...
    沈念sama閱讀 35,409評論 5 343
  • 正文 年R本政府宣布,位于F島的核電站禁漓,受9級特大地震影響跟衅,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜播歼,卻給世界環(huán)境...
    茶點故事閱讀 41,001評論 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望秘狞。 院中可真熱鬧叭莫,春花似錦谒撼、人聲如沸食寡。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,657評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽善榛。三九已至辩蛋,卻和暖如春移盆,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背咒循。 一陣腳步聲響...
    開封第一講書人閱讀 32,811評論 1 268
  • 我被黑心中介騙來泰國打工据途, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人叙甸。 一個月前我還...
    沈念sama閱讀 47,685評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像裆蒸,于是被迫代替她去往敵國和親熔萧。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,573評論 2 353

推薦閱讀更多精彩內(nèi)容