數(shù)據(jù)可視化基本原理——可視化模型

image

我剛接觸數(shù)據(jù)可視化是在 4 年前,那時候一位大學老師 S 昂勉,叫我們使用 R 對數(shù)據(jù)進行統(tǒng)計分析(對敲街,哥也學過一陣統(tǒng)計呢),其中有部分知識點是用 R 繪制箱線圖绞旅、散點圖之類的可視化結(jié)果质况。

從此對數(shù)據(jù)可視化產(chǎn)生了濃厚的興趣,現(xiàn)在系統(tǒng)地來學習一下數(shù)據(jù)可視化玻靡。

今天分享一些關(guān)于數(shù)據(jù)可視化的基本流程结榄。前面的文章看這里:

做任何事情都有章可循,數(shù)據(jù)可視化也是一樣囤捻,而且可視化的基本步驟臼朗、流程和體系都是通用的, 不同的數(shù)據(jù)都可以按照下面的模型將數(shù)據(jù)可視化。

這里給出的步驟不是教大家怎么畫出一幅「信、達视哑、雅」的可視化結(jié)果圖绣否,而是傳遞一種思想,也就是可視化方法論挡毅。

可視化基本流程

可視化不是一個算法蒜撮,而是一個流程,有點像流水線跪呈,但這些流水線之間是可以相互作用的段磨、雙向的。

我們可以簡單地將可視化流程分成三個部分:前端耗绿、處理苹支、后端,這和軟件的開發(fā)流程不是一個概念误阻。

文字看起來不太直觀债蜜,直接上圖:

image

圖中涉及到幾個主要的部分:

  1. 數(shù)據(jù)采集。數(shù)據(jù)的采集直接決定了數(shù)據(jù)的格式究反、維度寻定、尺寸、分辨率精耐、精確度等重要性質(zhì)狼速,在很大程度上決定了可視化結(jié)果的質(zhì)量。
  2. 數(shù)據(jù)變換黍氮。這個過程包括去除數(shù)據(jù)噪聲、數(shù)據(jù)清洗浅浮、提取特征沫浆。
  3. 可視化映射」鲋龋可視化映射是整個可視化流程的核心专执,它將數(shù)據(jù)的數(shù)值、空間位置郁油、不同位置數(shù)據(jù)間的聯(lián)系等本股,映射到不同的視覺通道,關(guān)于視覺通道部分可以看這篇文章——數(shù)據(jù)可視化的基本原理——視覺通道桐腌。
  4. 用戶感知拄显。數(shù)據(jù)可視化和其他數(shù)據(jù)分析處理辦法的最大不同是用戶。用戶借助數(shù)據(jù)可視化結(jié)果感受數(shù)據(jù)的不同案站,從中提取信息躬审、知識和靈感。

上面的可視化流程雖然簡單,但也要注意兩點:

  • 上述過程都是基于數(shù)據(jù)背后的自然現(xiàn)象或者社會現(xiàn)象承边,而不是數(shù)據(jù)本身遭殉。
  • 各個模塊的聯(lián)系并不是按照我畫的順序來聯(lián)系的,他們之間的聯(lián)系更多是非線性的博助,任意兩個模塊之間都可能存在聯(lián)系险污。

其他可視化流程

科學可視化流程

image

<figcaption style="margin-top: calc(0.666667em); padding: 0px 1em; font-size: 0.9em; line-height: 1.5; text-align: center; color: rgb(153, 153, 153);">Haber, R. B. and McNabb, D. A. Visualization idioms A conceptual model for scientific visualization systems, 1990</figcaption>

這個模型跟上面的簡化流程類似,按照數(shù)據(jù)收集富岳、處理蛔糯、映射等步驟來組織可視化,步驟更明確一些城瞎。

信息可視化流程

image

<figcaption style="margin-top: calc(0.666667em); padding: 0px 1em; font-size: 0.9em; line-height: 1.5; text-align: center; color: rgb(153, 153, 153);">Card S K, Mackinlay J D, Shneiderman B. Readings in information visualization using vision to think[M] Readings in information visualization Morgan Kaufmann Publishers, 1999 647-650.</figcaption>

這個模型由 Card 等人提出渤闷,把流水線式的可視化流程升級為回路,用戶可以操作任何一個階段〔倍疲現(xiàn)在大多數(shù)可視化流程都是仿照這個來的飒箭,大多數(shù)系統(tǒng)在實現(xiàn)上可能會有些差異。

人機交互可視化模型

image

<figcaption style="margin-top: calc(0.666667em); padding: 0px 1em; font-size: 0.9em; line-height: 1.5; text-align: center; color: rgb(153, 153, 153);">Keim D, Zhang L. Solving problems with visual analyticschallenges and applications[C] European Conference on Machine Learning &amp;amp;amp;amp; Knowledge Discovery in Databases. Elsevier B.V. 20111-4.</figcaption>

可視分析通過人機交互自動處理和可視化分析方法緊密結(jié)合在一起蜒灰。下面這個圖表示最新的可視化分析模型:

從數(shù)據(jù)到知識有兩個途徑:

  • 對數(shù)據(jù)進行交互可視化弦蹂,以幫助用戶感知數(shù)據(jù)中蘊含的規(guī)律
  • 按照給定的先驗,進行數(shù)據(jù)挖掘强窖,從數(shù)據(jù)中直接提煉出數(shù)據(jù)模型凸椿。

在這兩個途經(jīng),用戶可以對模型可視化翅溺,也可以從可視化結(jié)果中構(gòu)建模型脑漫。

在許多應用的場合,可視化分析操作的對象是多源異構(gòu)數(shù)據(jù)咙崎。這些數(shù)據(jù)中优幸,很多噪聲、非結(jié)構(gòu)化數(shù)據(jù)褪猛、異常數(shù)據(jù)网杆,可視化界面幫助分析人員在自動分析時,直觀地看到參數(shù)的修改或者算法的選擇伊滋,增強了模型評估的效率碳却。

此外,允許用戶自主組合自動分析和交互可視分析的方法是可視分析學流程的基本特征笑旺。在這個過程中昼浦,我們可以通過可視化及時發(fā)現(xiàn)中間步驟的錯誤,或者自相矛盾的錯誤筒主,提高了可信度座柱。

綜上迷帜,數(shù)據(jù)可視化發(fā)展到現(xiàn)在,人機結(jié)合是多個時代的疊加產(chǎn)物色洞。一方面戏锹,機器智能在某些方面可以做到人類數(shù)億年都完不成的工作;另一方面火诸,人類的經(jīng)過幾億年的進化锦针,有些“只可意會,不可言傳”的技能置蜀,即推理分析能力奈搜。

參考文獻:

[1] 陳為 沈則潛 陶煜波. 數(shù)據(jù)可視化[M]. 電子工業(yè)出版社, 2013.浙江大學-陳為、巫英才數(shù)據(jù)可視化課程

[2] Haber, R. B. and McNabb, D. A. Visualization idioms: A conceptual model for scientific visualization systems, 1990.

[3] Card S K, Mackinlay J D, Shneiderman B. Readings in information visualization: using vision to think[M]// Readings in information visualization. Morgan Kaufmann Publishers, 1999:647-650.


掃一掃盯荤,關(guān)注我.jpg

歡迎大家關(guān)注微信公眾號:可視化技術(shù)( visteacher )

不僅有前端和可視化馋吗,還有算法、源碼分析秋秤、書籍相送

個人網(wǎng)站:http://blog.kurryluo.com

各個分享平臺的 KurryLuo 都是在下宏粤。

用心學習,認真生活灼卢,努力工作绍哎!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市鞋真,隨后出現(xiàn)的幾起案子崇堰,更是在濱河造成了極大的恐慌,老刑警劉巖涩咖,帶你破解...
    沈念sama閱讀 212,599評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件海诲,死亡現(xiàn)場離奇詭異,居然都是意外死亡檩互,警方通過查閱死者的電腦和手機特幔,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,629評論 3 385
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來盾似,“玉大人敬辣,你說我怎么就攤上這事雪标×阍海” “怎么了?”我有些...
    開封第一講書人閱讀 158,084評論 0 348
  • 文/不壞的土叔 我叫張陵村刨,是天一觀的道長告抄。 經(jīng)常有香客問我,道長嵌牺,這世上最難降的妖魔是什么打洼? 我笑而不...
    開封第一講書人閱讀 56,708評論 1 284
  • 正文 為了忘掉前任龄糊,我火速辦了婚禮,結(jié)果婚禮上募疮,老公的妹妹穿的比我還像新娘炫惩。我一直安慰自己,他們只是感情好阿浓,可當我...
    茶點故事閱讀 65,813評論 6 386
  • 文/花漫 我一把揭開白布他嚷。 她就那樣靜靜地躺著,像睡著了一般芭毙。 火紅的嫁衣襯著肌膚如雪筋蓖。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 50,021評論 1 291
  • 那天退敦,我揣著相機與錄音粘咖,去河邊找鬼。 笑死侈百,一個胖子當著我的面吹牛瓮下,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播设哗,決...
    沈念sama閱讀 39,120評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼唱捣,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了网梢?” 一聲冷哼從身側(cè)響起震缭,我...
    開封第一講書人閱讀 37,866評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎战虏,沒想到半個月后拣宰,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,308評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡烦感,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,633評論 2 327
  • 正文 我和宋清朗相戀三年巡社,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片手趣。...
    茶點故事閱讀 38,768評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡晌该,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出绿渣,到底是詐尸還是另有隱情朝群,我是刑警寧澤,帶...
    沈念sama閱讀 34,461評論 4 333
  • 正文 年R本政府宣布中符,位于F島的核電站姜胖,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏淀散。R本人自食惡果不足惜右莱,卻給世界環(huán)境...
    茶點故事閱讀 40,094評論 3 317
  • 文/蒙蒙 一蚜锨、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧慢蜓,春花似錦亚再、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,850評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至凄诞,卻和暖如春圆雁,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背帆谍。 一陣腳步聲響...
    開封第一講書人閱讀 32,082評論 1 267
  • 我被黑心中介騙來泰國打工伪朽, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人汛蝙。 一個月前我還...
    沈念sama閱讀 46,571評論 2 362
  • 正文 我出身青樓烈涮,卻偏偏與公主長得像,于是被迫代替她去往敵國和親窖剑。 傳聞我的和親對象是個殘疾皇子坚洽,可洞房花燭夜當晚...
    茶點故事閱讀 43,666評論 2 350

推薦閱讀更多精彩內(nèi)容