以前,處理“大數(shù)據(jù)”僅限于那些本身具備昂貴的高性能計(jì)算集群的用戶胆胰,現(xiàn)在狞贱,硬件發(fā)展日新月異,可以勝任大量實(shí)時(shí)分析計(jì)算的消費(fèi)級(jí)硬件比比皆是蜀涨,并且有大量的開(kāi)放數(shù)據(jù)庫(kù)供公眾使用瞎嬉,因此“數(shù)據(jù)分析”以前所未有的速度進(jìn)步著。但大數(shù)據(jù)的快速發(fā)展也帶來(lái)一個(gè)全民思考的問(wèn)題:如何理解大數(shù)據(jù)?如何將大數(shù)據(jù)用于解決現(xiàn)實(shí)世界的問(wèn)題?科多大數(shù)據(jù)帶你來(lái)看看大數(shù)據(jù)最重要的一個(gè)“V”是什么厚柳?
IBM提出的大數(shù)據(jù)的“4V”特征得到了業(yè)界的廣泛認(rèn)可氧枣。
第一,數(shù)量(Volume)草娜,即數(shù)據(jù)巨大挑胸,從TB級(jí)別躍升到PB級(jí)別;
第二,多樣性(Variety)宰闰,即數(shù)據(jù)類(lèi)型繁多茬贵,不僅包括傳統(tǒng)的格式化數(shù)據(jù)解藻,還包括來(lái)自互聯(lián)網(wǎng)的網(wǎng)絡(luò)日志葡盗、視頻螟左、圖片觅够、地理位置信息等;
第三钳吟,速度(Velocity)坝茎,即處理速度快;
第四,真實(shí)性(Veracity)次酌,即追求高質(zhì)量的數(shù)據(jù)。
除了上述4個(gè)“V”派阱,還有另外一個(gè)“V”更重要:
可視化(Visualization)
即使我們能獲取的數(shù)據(jù)量以爆炸式的速度增長(zhǎng),即使我們?cè)谟?jì)算能力方面有著令人難以置信的指數(shù)級(jí)增長(zhǎng),但我們想從大數(shù)據(jù)中獲取的東西遠(yuǎn)遠(yuǎn)超過(guò)如今我們從數(shù)據(jù)中挖掘的東西橘原。對(duì)技術(shù)的追求永無(wú)止境,但將當(dāng)前的技術(shù)轉(zhuǎn)化成最大的價(jià)值才是最重要的。此外脐帝,數(shù)據(jù)科學(xué)并不只是一門(mén)技術(shù),它更多地是一種實(shí)踐的藝術(shù)秸滴。
可視化在數(shù)據(jù)科學(xué)中發(fā)揮著至關(guān)重要的作用届垫,它能幫助數(shù)據(jù)工作者更好地理解數(shù)據(jù)中可能存在的結(jié)構(gòu)和規(guī)律误债。以下是為什么說(shuō)可視化是大數(shù)據(jù)最重要的一個(gè)“V”的3個(gè)原因:
可視化讓大數(shù)據(jù)成為決策利器
誠(chéng)然登淘,大數(shù)據(jù)背后的真正功勞可能是那些需要花費(fèi)大量時(shí)間和精力的挖掘耍鬓、建模、算法、分析等工作創(chuàng)造的度苔,但實(shí)際情況是:當(dāng)管理者需要基于數(shù)據(jù)做出決策時(shí),讓數(shù)據(jù)以對(duì)的形式,在對(duì)的時(shí)間出現(xiàn)在對(duì)的地方才是重點(diǎn),這樣數(shù)據(jù)分析的結(jié)果才能最終起到作用缎浇。在大多數(shù)情況下二蓝,決策者根本沒(méi)有時(shí)間去組織會(huì)議踩验,看著表格分析數(shù)據(jù)然后做決定牡借,可視化是讓管理者對(duì)海量數(shù)據(jù)有感覺(jué)的唯一方法扁远。隨著企業(yè)的數(shù)據(jù)量和業(yè)務(wù)需求不斷增加并闲,可視化將變得越來(lái)越重要湃缎。
可視化是讓大數(shù)據(jù)接地氣的唯一方法
數(shù)據(jù)能夠“觸動(dòng)”的人越多,其所產(chǎn)生的真正的價(jià)值越大冕广。因此涕滋,通過(guò)講述“數(shù)字故事”來(lái)表達(dá)數(shù)據(jù)反映的內(nèi)容成為一種新興的流行趨勢(shì)侵俗。這一現(xiàn)象表明數(shù)據(jù)科學(xué)不僅僅在于“數(shù)值”和“變量”的分析,它本質(zhì)上是一門(mén)將違反直覺(jué)的內(nèi)容轉(zhuǎn)化為直觀內(nèi)容的科學(xué)棵帽。
可視化能最大化大數(shù)據(jù)的價(jià)值
即使在傳統(tǒng)的數(shù)據(jù)分析中忘衍,人們也在不斷嘗試和探索數(shù)據(jù)的視覺(jué)表現(xiàn)形式铅搓,以便能更好地了解數(shù)據(jù)中的真理:這是什么數(shù)據(jù)?這些數(shù)據(jù)能說(shuō)明什么?如今數(shù)據(jù)的量越來(lái)越大氢烘,數(shù)據(jù)的復(fù)雜性也越來(lái)越強(qiáng),但追求視覺(jué)表達(dá)形式的趨勢(shì)不會(huì)變,即使數(shù)據(jù)科學(xué)和大數(shù)據(jù)分析技術(shù)不斷發(fā)展,新的分析方法和分析應(yīng)用不斷涌現(xiàn)随静,也都始終無(wú)法撼動(dòng)可視化的重要地位。
可視化作品是耗時(shí)費(fèi)力的數(shù)據(jù)工作的結(jié)晶,因此燎猛,它在數(shù)據(jù)科學(xué)中的重要性不言而喻恋捆。