數(shù)據(jù)可視化技術?可借助人腦的視覺思維能力,幫助人們理解大量的數(shù)據(jù)信息细卧,發(fā)現(xiàn)數(shù)據(jù)中隱含的規(guī)律谈火,從而提高數(shù)據(jù)的使用效率茶没。面對大數(shù)據(jù)深奧的面貌肌幽,如何才能讓大型數(shù)據(jù)集變得親切和易于理解,可視化無疑是最有效的途徑抓半。對大數(shù)據(jù)背景下的數(shù)據(jù)可視化應用展開研究喂急,將有助于我們發(fā)展和創(chuàng)新數(shù)據(jù)可視化技術。
大數(shù)據(jù)時代的機遇與挑戰(zhàn)
物聯(lián)網笛求、云計算廊移、移動互聯(lián)網、手機探入、平板電腦狡孔、PC以及遍布地球各個角落的各種各樣的傳感器,無一不是數(shù)據(jù)來源或者承載的方式蜂嗽。隨著社交網絡的普及苗膝,使得人們的行為和情緒的細節(jié)化測量成為可能。挖掘用戶的行為習慣和喜好植旧,凌亂紛繁的數(shù)據(jù)背后找到更符合用戶興趣和習慣的產品和服務荚醒,并對產品和服務進行針對性地調整和優(yōu)化芋类,這就是大數(shù)據(jù)的價值。大數(shù)據(jù)也日益顯現(xiàn)出對各個行業(yè)的推進力界阁。大數(shù)據(jù)技術的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理胖喳。換言之泡躯,如果把大數(shù)據(jù)比作一種產業(yè),那么這種產業(yè)實現(xiàn)盈利的關鍵丽焊,在于提高對數(shù)據(jù)的“加工能力”较剃,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”。
數(shù)據(jù)可視化技術及主要特點
數(shù)據(jù)可視化(Data Visual)技術是指運用計算機圖形學和圖像處理技術技健,將數(shù)據(jù)轉換為圖形或圖像在屏幕上顯示出來写穴,并進行交互處理的理論、方法和技術雌贱。它能夠提供多種同時進行數(shù)據(jù)分析的圖形方法啊送,反映信息模式、數(shù)據(jù)關聯(lián)或趨勢欣孤,幫助決策者直觀地觀察和分析數(shù)據(jù)馋没,實現(xiàn)人與數(shù)據(jù)之間直接的信息傳遞,從而發(fā)現(xiàn)隱含在數(shù)據(jù)中的規(guī)律降传。數(shù)據(jù)可視化技術的基本思想是將數(shù)據(jù)庫中每一個數(shù)據(jù)項作為單個圖元元素來表示篷朵,大量的數(shù)據(jù)集構成數(shù)據(jù)圖像,同時將數(shù)據(jù)的各個屬性值以多維數(shù)據(jù)的形式表示婆排,可以從不同的維度觀察數(shù)據(jù)声旺,從而對數(shù)據(jù)進行更深入的觀察和分析。
數(shù)據(jù)可視化技術的主要特點是:
(1)交互性段只,用戶可以方便地以交互的方式管理和開發(fā)數(shù)據(jù)腮猖;
(2)多維性,可以看到表示對象或事件的數(shù)據(jù)的多個屬性或變量翼悴,而數(shù)據(jù)可以按其每一堆的值缚够,將其分類、排序鹦赎、組合和顯示谍椅;
(3)可視性,數(shù)據(jù)可以用圖像古话、曲線雏吭、二維圖形、三維體和動畫來顯示陪踩,并可對其模式和相互關系進行可視化分析杖们。
基于Web的數(shù)據(jù)可視化的參考模型
基于Web的數(shù)據(jù)可視化主要有以下四種參考模型
(1)在服務器端生成描述數(shù)據(jù)的圖形悉抵,然后在客戶端實現(xiàn)圖形的顯示,客戶端用瀏覽器來顯示摘完;
(2)服務器端經過可視化映射后姥饰,輸出VRML(Virtual Reality Modeling Language,簡稱VRML)成Java3D格式的3D模型孝治,返回給客戶列粪,客戶端利用支持VRML或Java3D的瀏覽器來繪制和操縱3D模型,這種方式的交互局限于繪制階段谈飒;
(3)客戶下載數(shù)據(jù)岂座,在客戶端執(zhí)行可視化流水線,利用JavaApplet實現(xiàn)可視化計算杭措,客戶還可以下載可視化軟件费什。雖然客戶端可以完全控制可視化過程,但對客戶端的硬件手素、軟件資源要求高鸳址,并且對大規(guī)模過程的控制;
(4)服務器端以HTMLForms或JavaApplet方式提供可視化控制頁面刑桑,瀏覽器客戶下載控制頁面氯质,實現(xiàn)對可視化過程的控制。
模型2和模型3需要針對具體的應用編制Java繪圖程序祠斧,模型4采用了復雜的可視化計算在服務器端處理闻察,避免了客戶端較高的資源要求,同時客戶端又能完成可視化結果的交互繪制琢锋,具有較好的交互性以及計算負荷分攤的優(yōu)點辕漂,但同樣編制程序復雜。而模型1使用Tee Chart Pro AetiveX控件吴超,可以直接安裝在服務器端钉嘹,在服務器端動態(tài)生成圖形文件(JPEG格式),然后將圖形傳回客戶端鲸阻,在瀏覽器中顯示出來跋涣,方法可以適用于任何流行的客戶端瀏覽器。
大數(shù)據(jù)的Web數(shù)據(jù)可視化方法流程
① 發(fā)現(xiàn)問題
數(shù)據(jù)可視化都是為了解決某個問題的鸟悴。所以陈辱,面對海量的數(shù)據(jù),首先要思考如何針對領域問題合理抽取對應的數(shù)據(jù)细诸。為創(chuàng)建信息可視化而提出問題時沛贪,我們應該盡可能地關注以數(shù)據(jù)為中心的問題。那些以“在哪里”、“什么時間”“有多少”或者“有多頻繁”開頭的問題通常是不錯的開始利赋,這些問題使我們專注于在特定的參數(shù)集合內查找數(shù)據(jù)水评,因此更有可能找到適用于可視化的數(shù)據(jù)。而對于以“為什么”開頭的問題則要格外小心媚送,它意味著你對數(shù)據(jù)的較為正式的描述開始轉入改寫數(shù)據(jù)分析中燥。
②收集數(shù)據(jù)
數(shù)據(jù)的收集和整理則是數(shù)據(jù)可視化的重中之重。然而準確地找到所需要的數(shù)據(jù)是一個非常困難的任務季希。通常褪那,最好從已經可用的數(shù)據(jù)著手并盡量找到一種方式來描繪它,而不是嘗試自己去收集數(shù)據(jù)式塌。得到原始數(shù)據(jù)之后.則要著手于數(shù)據(jù)的解析、組織友浸、分組或者修改峰尝,對數(shù)據(jù)進行再加工。
③ 選擇一種可視化方式展現(xiàn)數(shù)據(jù)
在明確想要展現(xiàn)的內容后收恢,就要綜合運用視覺元素的造型武学,色彩的選取,動態(tài)等賦予圖表更好的視覺體驗伦意。數(shù)據(jù)可視化的過程要始終圍繞著數(shù)據(jù)可視化的核心目標:幫助讀者更好更準確的理解數(shù)據(jù)火窒。web常見的的可視化有:地圖、時間軸驮肉、網絡圖熏矿、樹狀圖、矩陣圖离钝、散點圖票编、氣泡圖、流程圖卵渴、折線圖慧域、標簽云、數(shù)據(jù)表浪读、雷達圖昔榴、熱力圖、平行坐標軸等等碘橘。
大數(shù)據(jù)的Web數(shù)據(jù)可視化展現(xiàn)方式
①尺寸:這是最常用的可視化展現(xiàn)方式互订。當辨別兩個對象時,我們可以通過尺寸對比快速地區(qū)分它們蛹屿。此外屁奏,使用尺寸可以加快理解兩組不熟悉的數(shù)字之間的區(qū)別。如百度統(tǒng)計错负,這個應用指在通過對網站流量的專業(yè)分析坟瓢,幫助用戶不斷從網站流量數(shù)據(jù)中挖掘有價值的信息勇边,指導網站運營。如這個網頁目錄的訪客數(shù)統(tǒng)計圖折联,采用了氣泡面積的可視化展現(xiàn)方式粒褒,通過氣泡尺寸面積對比,直觀的展現(xiàn)出各網頁目錄的訪客數(shù)多少诚镰。
②色彩:色彩是展現(xiàn)大數(shù)據(jù)集的一種優(yōu)秀方式奕坟,我們可以通過色彩識別出很多層次和色調。這一點使得色彩成為展現(xiàn)宏觀趨勢的必然選擇清笨。運用色彩進行可視化創(chuàng)作時要特別注意的是要確保讀者能夠區(qū)分出在45%和55%的數(shù)據(jù)點月杉。
③位置:基于位置的展現(xiàn)方式就是把數(shù)據(jù)和某些類型的地圖關聯(lián)起來,或者把它和一個真實或虛擬地方相關的可視化元素進行關聯(lián)抠艾。
④網絡:網絡展現(xiàn)方式顯示了數(shù)據(jù)點之間的二元連接苛萎,在查看這些數(shù)據(jù)點之間的關系時很有幫助,在線網絡可視化在視交網站中已十分廣泛的應用了检号,如QQ上有個應用腌歉,你可以通過人脈關系圖查看自己的人際網絡。
⑤時間:隨時間變化的數(shù)據(jù)通常是根據(jù)時間軸進行描繪齐苛。眾多的表現(xiàn)形式需要通過各種各樣的手段來呈現(xiàn)翘盖,在計算機上主要通過程序算法來實現(xiàn)。設計師在選擇表現(xiàn)形式的同時一定要考慮到受眾是否能夠很好的去接受和吸收信息凹蜂,設計師需要了解視覺心理對用戶瀏覽時的影響馍驯。隨著互聯(lián)網的發(fā)展,今后數(shù)據(jù)可視化還會發(fā)展出許多新的形式和特點來幫助人們理解數(shù)據(jù)炊甲、駕馭數(shù)據(jù)泥彤。
總結
數(shù)據(jù)可視化通過圖像、圖形技術對數(shù)據(jù)進行形象化處理卿啡,通過信息技術對數(shù)據(jù)進行準確吟吝、實時、自動化的高度透明的處理颈娜。在實際項目中剑逃,將大量的數(shù)據(jù)以圖形人的方式在Web頁面上展現(xiàn)出來,有助于分析數(shù)據(jù)官辽,揭示數(shù)據(jù)內部規(guī)律蛹磺。隨著計算機圖形學、多媒體技術同仆、人機交互技術及各應用領域的需要萤捆,數(shù)據(jù)可視化將會有更加廣闊的發(fā)展空間。
來源:論文網原文地址:http://www.xzbu.com/8/view-4852538.htm