Hadoop教程:特性斯嚎,組件堡僻,集群和拓?fù)?/h1>

翻譯自:http://www.guru99.com/learn-hadoop-in-10-minutes.html

Apache HADOOP是用于開發(fā)在分布式計(jì)算環(huán)境中執(zhí)行的數(shù)據(jù)處理應(yīng)用程序的框架钉疫。

類似于存儲(chǔ)在個(gè)人計(jì)算機(jī)系統(tǒng)的本地文件系統(tǒng)中的數(shù)據(jù),在Hadoop中牲阁,數(shù)據(jù)存儲(chǔ)在被稱為 Hadoop分布式文件系統(tǒng)的分布式文件系統(tǒng)中城菊。

處理模型基于“數(shù)據(jù)局部性”概念凌唬,其中計(jì)算邏輯被發(fā)送到包含數(shù)據(jù)的集群節(jié)點(diǎn)(服務(wù)器)客税。

這種計(jì)算邏輯只不過是用高級(jí)語言(如Java)編寫的程序的編譯版本况褪。這樣的程序测垛,處理存儲(chǔ)在Hadoop HDFS中的數(shù)據(jù)赐纱。

HADOOP是一個(gè)開源軟件框架熬北。使用HADOOP構(gòu)建的應(yīng)用程序在分布在普通計(jì)算機(jī)集群上的大型數(shù)據(jù)集上運(yùn)行。

普通電腦價(jià)格便宜起胰,廣泛應(yīng)用巫延。這些主要用于以低成本實(shí)現(xiàn)更大的計(jì)算能力。

你知道嗎畏妖?計(jì)算機(jī)集群由一組多個(gè)處理單元(存儲(chǔ)磁盤+處理器)組成戒劫,它們彼此連接并作為單個(gè)系統(tǒng)。

Hadoop的組件

下圖顯示了Hadoop生態(tài)系統(tǒng)中的各種組件 -

061114_0803_LearnHadoop4.png

Apache Hadoop包含兩個(gè)子項(xiàng)目

  1. Hadoop MapReduce MapReduce是一個(gè)用于編寫在Hadoop上運(yùn)行的應(yīng)用程序的計(jì)算模型和軟件框架。這些MapReduce程序能夠在大型計(jì)算節(jié)點(diǎn)集群上并行處理大量數(shù)據(jù)茵典。
  2. HDFS(Hadoop分布式文件系統(tǒng)) HDFS負(fù)責(zé)Hadoop應(yīng)用程序的存儲(chǔ)部分统阿。MapReduce應(yīng)用程序使用HDFS中的數(shù)據(jù)。HDFS創(chuàng)建多個(gè)數(shù)據(jù)塊副本扶平,并將它們分布在集群中的計(jì)算節(jié)點(diǎn)上蜻直。這種分布使得可靠和極快速的計(jì)算成為可能袁串。

盡管Hadoop最為人所知的是MapReduce及其分布式文件系統(tǒng)-HDFS,但該術(shù)語也用于一系列屬于分布式計(jì)算和大規(guī)模數(shù)據(jù)處理的相關(guān)項(xiàng)目赎瑰。在其他的Hadoop相關(guān)項(xiàng)目的Apache包括有Hive餐曼,HBase源譬,Mahout孕似,Sqoop,F(xiàn)lume和Zookeeper养渴。

'Hadoop'

  • 適用于大數(shù)據(jù)分析

由于大數(shù)據(jù)在本質(zhì)上往往是分布式和非結(jié)構(gòu)化的理卑,HADOOP集群最適合分析大數(shù)據(jù)藐唠。由于流向計(jì)算節(jié)點(diǎn)的是處理邏輯(不是實(shí)際數(shù)據(jù))鹉究,所以消耗更少的網(wǎng)絡(luò)帶寬坊饶。這個(gè)概念被稱為數(shù)據(jù)局部性,有助于提高基于Hadoop的應(yīng)用程序的效率蟋滴。

  • 可擴(kuò)展性

HADOOP集群可以通過添加額外的集群節(jié)點(diǎn)輕松擴(kuò)展到任何程度津函,從而允許大數(shù)據(jù)的增長(zhǎng)孤页。此外,規(guī)模不需要修改應(yīng)用程序邏輯魂那。

  • 容錯(cuò)

HADOOP生態(tài)系統(tǒng)具有將輸入數(shù)據(jù)復(fù)制到其他集群節(jié)點(diǎn)的功能。這樣涯雅,在群集節(jié)點(diǎn)故障的情況下展运,數(shù)據(jù)處理仍然可以通過使用存儲(chǔ)在另一群集節(jié)點(diǎn)上的數(shù)據(jù)來進(jìn)行。

Hadoop中的網(wǎng)絡(luò)拓?fù)?/h3>

當(dāng)hadoop集群的大小增長(zhǎng)時(shí)蔗候,網(wǎng)絡(luò)的拓?fù)洌ú贾茫?huì)影響Hadoop集群的性能琴庵。除了性能之外,還需要關(guān)注高可用性和故障處理仰美。為了實(shí)現(xiàn)這種Hadoop集群的形成迷殿,利用網(wǎng)絡(luò)拓?fù)洹?/p>

通常,網(wǎng)絡(luò)帶寬是在構(gòu)成任何網(wǎng)絡(luò)時(shí)要考慮的重要因素咖杂。然而庆寺,由于測(cè)量帶寬可能很困難,在Hadoop中诉字,網(wǎng)絡(luò)被表示為樹懦尝,并且該樹的節(jié)點(diǎn)之間的距離(跳數(shù))被認(rèn)為是形成Hadoop集群的重要因素。這里壤圃,兩個(gè)節(jié)點(diǎn)之間的距離等于它們到它們最接近的共同祖先的距離的總和陵霉。

Hadoop集群由數(shù)據(jù)中心,機(jī)架和實(shí)際執(zhí)行作業(yè)的節(jié)點(diǎn)組成伍绳。這里踊挠,數(shù)據(jù)中心由機(jī)架和機(jī)架組成的節(jié)點(diǎn)組成冲杀。可用于進(jìn)程的網(wǎng)絡(luò)帶寬取決于進(jìn)程的位置沪猴。也就是說壶辜,下面情況可用帶寬依次變得更小:

  • 進(jìn)程在同一個(gè)節(jié)點(diǎn)上
  • 同一機(jī)架上的不同節(jié)點(diǎn)
  • 同一數(shù)據(jù)中心不同機(jī)架上的節(jié)點(diǎn)
  • 不同數(shù)據(jù)中心的節(jié)點(diǎn)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

  • 序言:七十年代末便贵,一起剝皮案震驚了整個(gè)濱河市利耍,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 221,695評(píng)論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)桂躏,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,569評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門失仁,熙熙樓的掌柜王于貴愁眉苦臉地迎上來冤竹,“玉大人,你說我怎么就攤上這事萧恕。” “怎么了?”我有些...
    開封第一講書人閱讀 168,130評(píng)論 0 360
  • 文/不壞的土叔 我叫張陵酥宴,是天一觀的道長(zhǎng)肆糕。 經(jīng)常有香客問我,道長(zhǎng)和橙,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,648評(píng)論 1 297
  • 正文 為了忘掉前任鳞疲,我火速辦了婚禮波势,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己店溢,他們只是感情好遭贸,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,655評(píng)論 6 397
  • 文/花漫 我一把揭開白布踏堡。 她就那樣靜靜地躺著顷蟆,像睡著了一般阎肝。 火紅的嫁衣襯著肌膚如雪肮街。 梳的紋絲不亂的頭發(fā)上嫉父,一...
    開封第一講書人閱讀 52,268評(píng)論 1 309
  • 那天围小,我揣著相機(jī)與錄音成榜,去河邊找鬼歧焦。 笑死瓷耙,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的长搀。 我是一名探鬼主播宇弛,決...
    沈念sama閱讀 40,835評(píng)論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼源请!你這毒婦竟也來了枪芒?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,740評(píng)論 0 276
  • 序言:老撾萬榮一對(duì)情侶失蹤谁尸,失蹤者是張志新(化名)和其女友劉穎舅踪,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體良蛮,經(jīng)...
    沈念sama閱讀 46,286評(píng)論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡抽碌,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,375評(píng)論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了决瞳。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片货徙。...
    茶點(diǎn)故事閱讀 40,505評(píng)論 1 352
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖瞒斩,靈堂內(nèi)的尸體忽然破棺而出破婆,到底是詐尸還是另有隱情涮总,我是刑警寧澤胸囱,帶...
    沈念sama閱讀 36,185評(píng)論 5 350
  • 正文 年R本政府宣布,位于F島的核電站瀑梗,受9級(jí)特大地震影響烹笔,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜抛丽,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,873評(píng)論 3 333
  • 文/蒙蒙 一谤职、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧亿鲜,春花似錦允蜈、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,357評(píng)論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至垒探,卻和暖如春妓蛮,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背圾叼。 一陣腳步聲響...
    開封第一講書人閱讀 33,466評(píng)論 1 272
  • 我被黑心中介騙來泰國(guó)打工蛤克, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留捺癞,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,921評(píng)論 3 376
  • 正文 我出身青樓构挤,卻偏偏與公主長(zhǎng)得像髓介,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子筋现,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,515評(píng)論 2 359

推薦閱讀更多精彩內(nèi)容

  • http://geek.csdn.net/news/detail/210469http://www.36dsj.c...
    Albert陳凱閱讀 5,171評(píng)論 1 21
  • 當(dāng)數(shù)據(jù)量增大到超出了單個(gè)物理計(jì)算機(jī)存儲(chǔ)容量時(shí)夫否,有必要把它分開存儲(chǔ)在多個(gè)不同的計(jì)算機(jī)中彻犁。那些管理存儲(chǔ)在多個(gè)網(wǎng)絡(luò)互連的...
    單行線的旋律閱讀 1,924評(píng)論 0 7
  • 原文鏈接 1. 背景介紹 談到分布式系統(tǒng),就不得不提到Google的三駕馬車:GFS[1],MapReduce[2...
    亞斯咪妮閱讀 1,107評(píng)論 0 2
  • 先思考問題 我們處在一個(gè)大數(shù)據(jù)的時(shí)代已經(jīng)是不爭(zhēng)的事實(shí)凰慈,這主要表現(xiàn)在數(shù)據(jù)源多且大汞幢,如互聯(lián)網(wǎng)數(shù)據(jù),人們也認(rèn)識(shí)到數(shù)據(jù)里往...
    墻角兒的花閱讀 7,373評(píng)論 0 9
  • 有人說 年輕人一定要去一次接近天堂最近的地方才算青春無憾微谓,也有人說 去西藏的人不是因?yàn)槭倬褪且驗(yàn)槭б?再不然就是...
    沈阿笨閱讀 466評(píng)論 0 0