Hadoop學(xué)習(xí)筆記

Hadoop——大數(shù)據(jù)框架卖子,有多種語言版本夏伊,包括python,JAVA等

為什么需要Hadoop刻肄?

數(shù)據(jù)量大瓤球,計(jì)算量大,單個(gè)機(jī)器無法完成

可將數(shù)據(jù)分布在多個(gè)機(jī)器上由多個(gè)機(jī)器共同完成計(jì)算

大數(shù)據(jù)計(jì)算需要各個(gè)機(jī)器相互協(xié)調(diào)工作敏弃,大數(shù)據(jù)算法有共同點(diǎn)卦羡,可將其做成框架,Hadoop就是這樣的框架

MapReduce,Google提出的框架

以下面的例子來解釋MapReduce的概念
樣例:Google搜索引擎绿饵,想知道大家對(duì)哪些關(guān)鍵字感興趣欠肾,以天為單位,收集所有人搜過的關(guān)鍵字拟赊,統(tǒng)計(jì)其出現(xiàn)的次數(shù)刺桃,用戶搜索的關(guān)鍵字?jǐn)?shù)據(jù)文件存在多臺(tái)機(jī)器上。

  1. Map階段:每臺(tái)機(jī)器處理本機(jī)的數(shù)據(jù)吸祟,計(jì)算本機(jī)文件中的關(guān)鍵字個(gè)數(shù)
  2. Shuffing階段:機(jī)器A, B, C, D......從1-n所有機(jī)器上取出Map的結(jié)果瑟慈,并按關(guān)鍵字組合
  3. Reduce階段:對(duì)每一個(gè)搜索關(guān)鍵字統(tǒng)計(jì)出現(xiàn)總次數(shù)
MapReduce Model

使用Hadoop時(shí)只需要編寫Map函數(shù)和Reduce函數(shù),其他的框架已經(jīng)幫我們實(shí)現(xiàn)了

參考文章

  1. https://zhuanlan.zhihu.com/p/20176725
  2. Hadoop權(quán)威指南
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末屋匕,一起剝皮案震驚了整個(gè)濱河市葛碧,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌过吻,老刑警劉巖进泼,帶你破解...
    沈念sama閱讀 219,539評(píng)論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異纤虽,居然都是意外死亡缘琅,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,594評(píng)論 3 396
  • 文/潘曉璐 我一進(jìn)店門廓推,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人翩隧,你說我怎么就攤上這事樊展。” “怎么了堆生?”我有些...
    開封第一講書人閱讀 165,871評(píng)論 0 356
  • 文/不壞的土叔 我叫張陵专缠,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我淑仆,道長(zhǎng)涝婉,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,963評(píng)論 1 295
  • 正文 為了忘掉前任蔗怠,我火速辦了婚禮墩弯,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘寞射。我一直安慰自己渔工,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,984評(píng)論 6 393
  • 文/花漫 我一把揭開白布桥温。 她就那樣靜靜地躺著引矩,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上旺韭,一...
    開封第一講書人閱讀 51,763評(píng)論 1 307
  • 那天氛谜,我揣著相機(jī)與錄音,去河邊找鬼区端。 笑死值漫,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的珊燎。 我是一名探鬼主播惭嚣,決...
    沈念sama閱讀 40,468評(píng)論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼悔政!你這毒婦竟也來了晚吞?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,357評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤谋国,失蹤者是張志新(化名)和其女友劉穎槽地,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體芦瘾,經(jīng)...
    沈念sama閱讀 45,850評(píng)論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡捌蚊,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,002評(píng)論 3 338
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了近弟。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片缅糟。...
    茶點(diǎn)故事閱讀 40,144評(píng)論 1 351
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖祷愉,靈堂內(nèi)的尸體忽然破棺而出窗宦,到底是詐尸還是另有隱情,我是刑警寧澤二鳄,帶...
    沈念sama閱讀 35,823評(píng)論 5 346
  • 正文 年R本政府宣布赴涵,位于F島的核電站,受9級(jí)特大地震影響订讼,放射性物質(zhì)發(fā)生泄漏髓窜。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,483評(píng)論 3 331
  • 文/蒙蒙 一欺殿、第九天 我趴在偏房一處隱蔽的房頂上張望寄纵。 院中可真熱鬧,春花似錦脖苏、人聲如沸擂啥。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,026評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)哺壶。三九已至屋吨,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間山宾,已是汗流浹背至扰。 一陣腳步聲響...
    開封第一講書人閱讀 33,150評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留资锰,地道東北人敢课。 一個(gè)月前我還...
    沈念sama閱讀 48,415評(píng)論 3 373
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像绷杜,于是被迫代替她去往敵國(guó)和親直秆。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,092評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容

  • 概述 4V特征 Volume:數(shù)據(jù)量Variety:多樣性鞭盟、復(fù)雜性Velocity:速度Value:基于高度分析的...
    異同閱讀 649評(píng)論 0 0
  • Hadoop部署方式 本地模式 偽分布模式(在一臺(tái)機(jī)器中模擬圾结,讓所有進(jìn)程在一臺(tái)機(jī)器上運(yùn)行) 集群模式 服務(wù)器只是一...
    陳半仙兒閱讀 1,613評(píng)論 0 9
  • 參考:http://www.cnblogs.com/heavenwang/p/3988033.html 1. 基本...
    yz_wang閱讀 739評(píng)論 0 1
  • HDFS的設(shè)計(jì)目標(biāo) 通過上一篇文章的介紹我們已經(jīng)了解到HDFS到底是怎樣的東西,以及它是怎樣通過多副本機(jī)制來提供高...
    陌上疏影涼閱讀 1,448評(píng)論 0 3
  • 簡(jiǎn)介: 每一項(xiàng)新技術(shù)都是為了解決某個(gè)痛點(diǎn)齿诉,隨著數(shù)據(jù)量指數(shù)型得增長(zhǎng)筝野,面對(duì)海量的數(shù)據(jù)技術(shù),雖然存儲(chǔ)用 Hadoop 的...
    ProudLin閱讀 136評(píng)論 0 0