在工程師眼里离咐,大數(shù)據(jù)計算與可視化究竟是怎樣的?

數(shù)據(jù)計算

當(dāng)對數(shù)據(jù)進行處理時奉件,處理簡單宵蛀、結(jié)構(gòu)化的數(shù)據(jù)集較為簡單,算法復(fù)雜度也易于預(yù)測和評估县貌,但是對于處理半結(jié)構(gòu)化糖埋,非結(jié)構(gòu)化數(shù)據(jù)時呈現(xiàn)多樣化的問題,分析數(shù)據(jù)困難更大窃这,算法復(fù)雜度超越了經(jīng)典摩爾定量瞳别,整個算法性能也不易控制。在數(shù)據(jù)中心數(shù)據(jù)價值鏈中杭攻,為了挖掘數(shù)據(jù)的價值祟敛。需要根據(jù)不同的數(shù)據(jù)類型分類,采取不同的算法分析兆解。

數(shù)據(jù)分類

1

?時序數(shù)據(jù)

基本描述:隨著時間推移反復(fù)測量而得到的數(shù)值和事件序列馆铁。

數(shù)據(jù)舉例:股票數(shù)據(jù),交通數(shù)據(jù)锅睛。

主要數(shù)據(jù)結(jié)構(gòu):半結(jié)構(gòu)化埠巨,非結(jié)構(gòu)化數(shù)據(jù)。

算法舉例:條件隨機場现拒,隱馬爾可夫模型辣垒。

2

序列數(shù)據(jù)

基本描述:由帶有或不帶有時間概念的已經(jīng)排序的要素或事件序列構(gòu)成。?

數(shù)據(jù)舉例:零售數(shù)據(jù)印蔬,基于數(shù)據(jù)

主要數(shù)據(jù)結(jié)構(gòu):半結(jié)構(gòu)化勋桶,結(jié)構(gòu)化數(shù)據(jù)。

算法舉例:序列對比算法侥猬,隱馬爾可夫模型例驹。

3

圖數(shù)據(jù)

基本描述:以圖結(jié)構(gòu)構(gòu)成的數(shù)據(jù)集合,通常使用G=(V,E)表示一個圖退唠,其中V表示圖中節(jié)點集合鹃锈,E表示圖中的邊集合。

數(shù)據(jù)舉例:社交網(wǎng)絡(luò)數(shù)據(jù)瞧预,WWW數(shù)據(jù)屎债,生物網(wǎng)絡(luò)數(shù)據(jù)

主要數(shù)據(jù)結(jié)構(gòu):半結(jié)構(gòu)化寨蹋,非結(jié)構(gòu)化數(shù)據(jù)。

算法舉例:圖挖掘算法扔茅,協(xié)同過濾算法已旧,奇異值分解,網(wǎng)頁排名召娜。

4

流數(shù)據(jù)

基本描述:數(shù)據(jù)連續(xù)运褪,持續(xù)流通,具有數(shù)據(jù)到達速度快玖瘸,規(guī)模大和不確定性秸讹。

數(shù)據(jù)舉例:電商交易數(shù)據(jù),監(jiān)控系統(tǒng)數(shù)據(jù)雅倒,互聯(lián)網(wǎng)流量數(shù)據(jù)璃诀,傳感網(wǎng)絡(luò)數(shù)據(jù),電信流量數(shù)據(jù)蔑匣。

主要數(shù)據(jù)結(jié)構(gòu):非結(jié)構(gòu)化數(shù)據(jù)劣欢。

算法舉例:K-均值,高階奇異值分解裁良,支持向量機凿将,平等樹學(xué)習(xí)。

如果你對大數(shù)據(jù)開發(fā)感興趣价脾,想系統(tǒng)學(xué)習(xí)大數(shù)據(jù)的話牧抵,可以加入大數(shù)據(jù)技術(shù)學(xué)習(xí)交流扣扣群:數(shù)字5221數(shù)字89307,私信管理員即可免費領(lǐng)取開發(fā)工具以及入門學(xué)習(xí)資料

5

空間數(shù)據(jù)

基本描述:指在地理系中代表物理對象的數(shù)值信息侨把∠洌空間數(shù)據(jù)能夠標(biāo)識地球上任何物理對象位置,大小秋柄,形狀获枝。包含的屬性,以及實體更多的信息华匾。

數(shù)據(jù)舉例:地圖數(shù)據(jù)映琳,醫(yī)療影響數(shù)據(jù),遠程傳感數(shù)據(jù)蜘拉,對地觀測數(shù)據(jù),軌跡數(shù)據(jù)有鹿。

主要數(shù)據(jù)結(jié)構(gòu):結(jié)構(gòu)化數(shù)據(jù)旭旭,半結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)葱跋。

算法舉例:學(xué)習(xí)選擇與空間數(shù)據(jù)特征關(guān)聯(lián)持寄。

6

多媒體數(shù)據(jù)

基本描述:由不同類型媒體綜合組成的源梭,通常包括文本,圖形稍味,圖像废麻,聲音,視頻圖像模庐,動畫等不同類型的媒體烛愧,其特點是數(shù)據(jù)量大,對連續(xù)媒體數(shù)據(jù)要求傳輸速度快掂碱,并保持不同數(shù)據(jù)流之間的同步怜姿。

數(shù)據(jù)舉例:文本數(shù)據(jù),圖形數(shù)據(jù)疼燥,圖像數(shù)據(jù)沧卢,聲音數(shù)據(jù),視頻數(shù)據(jù)醉者。

主要數(shù)據(jù)結(jié)構(gòu):結(jié)構(gòu)化數(shù)據(jù)但狭,半結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)撬即。

算法舉例:圖像分割方法熟空,運動矢量分析方法,模型構(gòu)建的數(shù)字信息處理技術(shù)搞莺。

機器學(xué)習(xí)算法

1

監(jiān)督學(xué)習(xí)

1.?線性回歸模型

基本型線性算法

對數(shù)概率回歸算法

線性判別分析算法

2. 分類學(xué)習(xí)

多分類學(xué)習(xí)算法

決策樹算法

樸素貝葉斯算法

支持向量機算法

2

無監(jiān)督學(xué)習(xí)

1.??聚類學(xué)習(xí)

聚類算法

高斯混合學(xué)習(xí)算法

2. 降維學(xué)習(xí)

主成分分析算法

K臨近學(xué)習(xí)算法

核化線性降維算法息罗。

3

半監(jiān)督學(xué)習(xí)

1. 半監(jiān)督學(xué)習(xí)

主動學(xué)習(xí)

協(xié)同訓(xùn)練

4

強化學(xué)習(xí)

1.??強化學(xué)習(xí)

馬爾可夫決策處理

Q學(xué)習(xí)

有模型學(xué)習(xí)

免模學(xué)習(xí)

數(shù)據(jù)可視化能力

數(shù)據(jù)價值鏈最終需要將數(shù)據(jù)的隱含價值顯性展現(xiàn),以直觀的體現(xiàn)數(shù)據(jù)的特征和價值才沧。便于人們理解數(shù)據(jù)的表達迈喉。視覺定義為一種以某種概要形式抽取的信息。包括響應(yīng)信息單位的各種屬性和變量温圆。數(shù)據(jù)可視化是把數(shù)據(jù)轉(zhuǎn)換為圖形圖像的方式挨摸,幫助人們理解大量、復(fù)雜的數(shù)據(jù)岁歉。

數(shù)據(jù)可視化主要分為三類:

科學(xué)可視化

科學(xué)可視化主要研究如何可視化科學(xué)研究中產(chǎn)生的大量數(shù)據(jù)得运,如流體動力學(xué)模擬產(chǎn)生的數(shù)據(jù),向量場和張量場等锅移。這些數(shù)據(jù)本身往往包含在真實世界中存在的幾何結(jié)構(gòu)熔掺。

信息可視化

信息可視化主要研究抽象數(shù)據(jù),如文本非剃,圖像置逻,網(wǎng)絡(luò),股票备绽,社交媒體等券坞;

可視化分析

可視化分析和數(shù)據(jù)挖掘的最終目標(biāo)是一致的鬓催。而可視化技術(shù)大體可以分為:

1.空間布局可視化

2.抽象/匯總可視化

3.交互式/實時式可視化

同時,數(shù)據(jù)可視化使數(shù)據(jù)變得更加容易理解恨锚,幫助越來越多的企業(yè)和組織從大數(shù)據(jù)中發(fā)現(xiàn)價值宇驾,化繁為簡,實現(xiàn)更有效的決策過程猴伶。通常采用有效的可視化工具來實現(xiàn)课舍。

大數(shù)據(jù)數(shù)據(jù)價值的發(fā)現(xiàn)主要通過可視化分析來完成。

1

空間布局可視化

   基本概述:將數(shù)據(jù)對象映射到坐標(biāo)空間中的一個特定點的計算方法蜗顽。

   特征:

1. 將認知能力通過空間信息可視化在終端上布卡。

2. 無法展現(xiàn)數(shù)據(jù)中的復(fù)雜關(guān)系。

3. 一般采用樹雇盖,圖或網(wǎng)絡(luò)來實現(xiàn)可視化呈現(xiàn)忿等。

可視化圖例:折線圖,條形圖崔挖,散點圖贸街,樹映射圖,弧形圖等狸相。

2

抽象和匯總可視化

基本概述:可視化渲染前對海量數(shù)據(jù)進行處理和匯總

?特征:

?1. 處理海量數(shù)據(jù)薛匪。

?2.?通過層次聚類算法對海量數(shù)據(jù)擴展。

?3. 以更緊湊將維方式展現(xiàn)數(shù)據(jù)脓鹃。

可視化圖例:直方圖分級逸尖,數(shù)據(jù)立方圖,層次聚類瘸右。

3

交互式/實時可視化

?基本概述:支持用戶實時交互式可視化探索娇跟。

特征:

1:滿足用戶實時交互需求。

2:允許用戶快速體現(xiàn)見解和反饋實時交互結(jié)果太颤。

3:以數(shù)據(jù)驅(qū)動洞察數(shù)據(jù)價值苞俘。

可視化圖例:微軟PivotTable,Tableau龄章,阿里DataV和百度Echarts等實時交互軟件吃谣。

可視化層需要有豐富的可視化圖形,以便完成數(shù)據(jù)價值的圖形展示做裙。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末岗憋,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子菇用,更是在濱河造成了極大的恐慌澜驮,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,214評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件惋鸥,死亡現(xiàn)場離奇詭異杂穷,居然都是意外死亡,警方通過查閱死者的電腦和手機卦绣,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評論 2 382
  • 文/潘曉璐 我一進店門耐量,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人滤港,你說我怎么就攤上這事廊蜒。” “怎么了溅漾?”我有些...
    開封第一講書人閱讀 152,543評論 0 341
  • 文/不壞的土叔 我叫張陵山叮,是天一觀的道長。 經(jīng)常有香客問我添履,道長屁倔,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,221評論 1 279
  • 正文 為了忘掉前任暮胧,我火速辦了婚禮锐借,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘往衷。我一直安慰自己钞翔,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 64,224評論 5 371
  • 文/花漫 我一把揭開白布席舍。 她就那樣靜靜地躺著布轿,像睡著了一般。 火紅的嫁衣襯著肌膚如雪来颤。 梳的紋絲不亂的頭發(fā)上汰扭,一...
    開封第一講書人閱讀 49,007評論 1 284
  • 那天,我揣著相機與錄音脚曾,去河邊找鬼东且。 笑死,一個胖子當(dāng)著我的面吹牛本讥,可吹牛的內(nèi)容都是我干的珊泳。 我是一名探鬼主播,決...
    沈念sama閱讀 38,313評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼拷沸,長吁一口氣:“原來是場噩夢啊……” “哼色查!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起撞芍,我...
    開封第一講書人閱讀 36,956評論 0 259
  • 序言:老撾萬榮一對情侶失蹤秧了,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后序无,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體验毡,經(jīng)...
    沈念sama閱讀 43,441評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡衡创,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,925評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了晶通。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片璃氢。...
    茶點故事閱讀 38,018評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖狮辽,靈堂內(nèi)的尸體忽然破棺而出一也,到底是詐尸還是另有隱情,我是刑警寧澤喉脖,帶...
    沈念sama閱讀 33,685評論 4 322
  • 正文 年R本政府宣布椰苟,位于F島的核電站,受9級特大地震影響树叽,放射性物質(zhì)發(fā)生泄漏舆蝴。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,234評論 3 307
  • 文/蒙蒙 一菱皆、第九天 我趴在偏房一處隱蔽的房頂上張望须误。 院中可真熱鬧,春花似錦仇轻、人聲如沸京痢。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽祭椰。三九已至,卻和暖如春疲陕,著一層夾襖步出監(jiān)牢的瞬間方淤,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評論 1 261
  • 我被黑心中介騙來泰國打工蹄殃, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留携茂,地道東北人。 一個月前我還...
    沈念sama閱讀 45,467評論 2 352
  • 正文 我出身青樓诅岩,卻偏偏與公主長得像讳苦,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子吩谦,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,762評論 2 345

推薦閱讀更多精彩內(nèi)容