大數(shù)據(jù)與Hadoop之間有什么關(guān)系?

近年大數(shù)據(jù)日益受到人們的關(guān)注损晤,人們在提到大數(shù)據(jù)遇到了很多相關(guān)概念上的問題软棺,比如云計算、 hadoop等等尤勋。那么喘落,大數(shù)據(jù)是什么、Hadoop是什么最冰,大數(shù)據(jù)和Hadoop有什么關(guān)系呢?

大數(shù)據(jù)概念早在1980年瘦棋,著名未來學家阿爾文?托夫勒提出的概念。2009年美國互聯(lián)網(wǎng)數(shù)據(jù)中心證實大數(shù)據(jù)時代的來臨暖哨。隨著谷歌 MapReduce和 GoogleFile System (GFS)的發(fā)布赌朋,大數(shù)據(jù)不再僅用來描述大量的數(shù)據(jù),還涵蓋了處理數(shù)據(jù)的速度篇裁。目前定義:大數(shù)據(jù)(big data)沛慢,或稱巨量資料,指的是所涉及的資料量規(guī)模巨大到無法透過目前主流軟件工具在合理時間內(nèi)獲取达布、管理团甲、處理、并整理為幫助企業(yè)經(jīng)營決策黍聂。

大數(shù)據(jù)目前分為四大塊:大數(shù)據(jù)技術(shù)躺苦、大數(shù)據(jù)工程身腻、大數(shù)據(jù)科學和大數(shù)據(jù)應用。其中云計算是屬于大數(shù)據(jù)技術(shù)的范疇圾另,是一種通過Internet以服務 的方式提供動態(tài)可伸縮的虛擬化的資源的計算模式霸株。那么這種計算模式如何實現(xiàn)呢,Hadoop的來臨解決了這個問題集乔,Hadoop是Apache(阿帕切) 的一個開源項目去件,它是一個對大量數(shù)據(jù)進行分布式處理的軟件架構(gòu),在這個架構(gòu)下組織的成員HDFS(Hadoop分布式文件系統(tǒng))扰路,MapReduce尤溜、 Hbase 、Zookeeper(一個針對大型分布式系統(tǒng)的可靠協(xié)調(diào)系統(tǒng))汗唱,hive(基于Hadoop的一個數(shù)據(jù)倉庫工具)等宫莱。

1.云計算屬于大數(shù)據(jù)中的大數(shù)據(jù)技術(shù)范疇。

2.云計算包含大數(shù)據(jù)哩罪。

3.云和大數(shù)據(jù)是兩個領(lǐng)域授霸。

云計算是指利用由大量計算節(jié)點構(gòu)成的可動態(tài)調(diào)整的虛擬化計算資源,通過并行化和分布式計算技術(shù)际插,實現(xiàn)業(yè)務質(zhì)量的可控的大數(shù)據(jù)處理的計算技術(shù)碘耳。而作為云計算技術(shù)中的佼佼者,Hadoop以其低成本和高效率的特性贏得了市場的認可框弛。Hadoop項目名稱來源于創(chuàng)立者Doung Cutting兒子的一個玩具辛辨,一頭黃色的大象。

Hadoop項目的目標是建立一個可擴展開源軟件框架瑟枫,能夠?qū)Υ髷?shù)據(jù)進行可靠的分布式處理斗搞。

Hadoop的框架最核心的設(shè)計就是:HDFS和MapReduce。HDFS為海量的數(shù)據(jù)提供了存儲慷妙,則MapReduce為海量的數(shù)據(jù)提供了計算僻焚。尚學堂陳老師指出HDFS是一個分布式文件系統(tǒng),具有低成本膝擂、高可靠性性虑啤、高吞吐量的特點。MapReduce是一個變成模型和軟件框架猿挚。

簡單理解咐旧,Hadoop是一個開源的大數(shù)據(jù)分析軟件驶鹉,或者說編程模式绩蜻。它是通過分布式的方式處理大數(shù)據(jù)的,因為開元的原因現(xiàn)在很多的企業(yè)或多或少的在運用hadoop的技術(shù)來解決一些大數(shù)據(jù)的問題室埋,在數(shù)據(jù)倉庫方面hadoop是非常強大的办绝。但在數(shù)據(jù)集市以及實時的分析展現(xiàn)層面伊约,hadoop也有著明顯的不足,現(xiàn)在一個比較好的解決方案是架設(shè)hadoop的數(shù)據(jù)倉庫而數(shù)據(jù)集市以及實時分析展現(xiàn)層面使用永洪科技的大數(shù)據(jù)產(chǎn)品孕蝉,能夠很好地解決hadoop 的分時間長以及其他的問題屡律。

Hadoop大數(shù)據(jù)技術(shù)案例

讓Hadoop和其他大數(shù)據(jù)技術(shù)如此引人注目的部分原因是,他們讓企業(yè)找到問題的答案降淮,而在此之前他們甚至不知道問題是什么超埋。這可能會產(chǎn)生引出新產(chǎn)品的想法,或者幫助確定改善運營效率的方法佳鳖。不過霍殴,也有一些已經(jīng)明確的大數(shù)據(jù)用例,無論是互聯(lián)網(wǎng)巨頭如谷歌系吩,F(xiàn)acebook和LinkedIn還是更多的傳統(tǒng)企業(yè)来庭。它們包括:

情感分析: Hadoop與先進的文本分析工具結(jié)合,分析社會化媒體和社交網(wǎng)絡發(fā)布的非結(jié)構(gòu)化的文本穿挨,包括Tweets和Facebook月弛,以確定用戶對特定公司,品牌或產(chǎn)品的情緒科盛。分析既可以專注于宏觀層面的情緒帽衙,也可以細分到個人用戶的情緒。

風險建模: 財務公司土涝、銀行等公司使用Hadoop和下一代數(shù)據(jù)倉庫分析大量交易數(shù)據(jù)佛寿,以確定金融資產(chǎn)的風險,模擬市場行為為潛在的“假設(shè)”方案做準備但壮,并根據(jù)風險為潛在客戶打分冀泻。

欺詐檢測: 金融公司、零售商等使用大數(shù)據(jù)技術(shù)將客戶行為與歷史交易數(shù)據(jù)結(jié)合來檢測欺詐行為蜡饵。例如弹渔,信用卡公司使用大數(shù)據(jù)技術(shù)識別可能的被盜卡的交易行為。

客戶流失分析: 企業(yè)使用Hadoop和大數(shù)據(jù)技術(shù)分析客戶行為數(shù)據(jù)并確定分析模型溯祸,該模型指出哪些客戶最有可能流向存在競爭關(guān)系的供應商或服務商肢专。企業(yè)就能采取最有效的措施挽留欲流失客戶。

用戶體驗分析: 面向消費者的企業(yè)使用Hadoop和其他大數(shù)據(jù)技術(shù)將之前單一 客戶互動渠道(如呼叫中心焦辅,網(wǎng)上聊天博杖,微博等)數(shù)據(jù)整合在一起, 以獲得對客戶體驗的完整視圖筷登。這使企業(yè)能夠了解客戶交互渠道之間的相互影響剃根,從而優(yōu)化整個客戶生命周期的用戶體驗。

當然前方,上述這些都只是大數(shù)據(jù)用例的舉例狈醉。事實上廉油,在所有企業(yè)中大數(shù)據(jù)最引人注目的用例可能尚未被發(fā)現(xiàn)。這就是大數(shù)據(jù)的希望苗傅。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末抒线,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子渣慕,更是在濱河造成了極大的恐慌嘶炭,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,627評論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件逊桦,死亡現(xiàn)場離奇詭異旱物,居然都是意外死亡,警方通過查閱死者的電腦和手機卫袒,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,180評論 3 399
  • 文/潘曉璐 我一進店門宵呛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人夕凝,你說我怎么就攤上這事宝穗。” “怎么了码秉?”我有些...
    開封第一講書人閱讀 169,346評論 0 362
  • 文/不壞的土叔 我叫張陵逮矛,是天一觀的道長。 經(jīng)常有香客問我转砖,道長须鼎,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 60,097評論 1 300
  • 正文 為了忘掉前任府蔗,我火速辦了婚禮晋控,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘姓赤。我一直安慰自己赡译,他們只是感情好,可當我...
    茶點故事閱讀 69,100評論 6 398
  • 文/花漫 我一把揭開白布不铆。 她就那樣靜靜地躺著蝌焚,像睡著了一般。 火紅的嫁衣襯著肌膚如雪誓斥。 梳的紋絲不亂的頭發(fā)上只洒,一...
    開封第一講書人閱讀 52,696評論 1 312
  • 那天,我揣著相機與錄音劳坑,去河邊找鬼毕谴。 笑死,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的析珊。 我是一名探鬼主播,決...
    沈念sama閱讀 41,165評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼蔑穴,長吁一口氣:“原來是場噩夢啊……” “哼忠寻!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起存和,我...
    開封第一講書人閱讀 40,108評論 0 277
  • 序言:老撾萬榮一對情侶失蹤奕剃,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后捐腿,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體纵朋,經(jīng)...
    沈念sama閱讀 46,646評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,709評論 3 342
  • 正文 我和宋清朗相戀三年茄袖,在試婚紗的時候發(fā)現(xiàn)自己被綠了操软。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,861評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡宪祥,死狀恐怖聂薪,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情蝗羊,我是刑警寧澤藏澳,帶...
    沈念sama閱讀 36,527評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站耀找,受9級特大地震影響翔悠,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜野芒,卻給世界環(huán)境...
    茶點故事閱讀 42,196評論 3 336
  • 文/蒙蒙 一蓄愁、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧狞悲,春花似錦涝登、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,698評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至乱投,卻和暖如春咽笼,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背戚炫。 一陣腳步聲響...
    開封第一講書人閱讀 33,804評論 1 274
  • 我被黑心中介騙來泰國打工剑刑, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 49,287評論 3 379
  • 正文 我出身青樓施掏,卻偏偏與公主長得像钮惠,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子七芭,可洞房花燭夜當晚...
    茶點故事閱讀 45,860評論 2 361

推薦閱讀更多精彩內(nèi)容