Hadoop的準備工作:Hadoop的介紹與概述

1什么是Hadoop:

Hadoop最早起源于Nutch项阴。Nutch的設計目標是構建一個大型的全網搜索引擎言蛇,包括網頁抓取僻他、索引、查詢等功能腊尚,但隨著抓取網頁數(shù)量的增加吨拗,遇到了嚴重的可擴展性問題——如何解決數(shù)十億網頁的存儲和索引問題。

2003年婿斥、2004年谷歌發(fā)表的兩篇論文為該問題提供了可行的解決方案劝篷。

——分布式文件系統(tǒng)(GFS),可用于處理海量網頁的存儲

——分布式計算框架MAPREDUCE民宿,可用于處理海量網頁的索引計算問題娇妓。

Nutch的開發(fā)人員完成了相應的開源實現(xiàn)HDFS和MAPREDUCE,并從Nutch中剝離成為獨立項目HADOOP活鹰,到2008年1月哈恰,HADOOP成為Apache頂級項目.

狹義上來說,hadoop就是單獨指代hadoop這個軟件,

HDFS :分布式文件系統(tǒng)

MapReduce : 分布式計算系統(tǒng)

Yarn:分布式樣集群資源管理

廣義上來說盯漂,hadoop指代大數(shù)據(jù)的一個生態(tài)圈储矩,包括很多其他的軟件

2、hadoop的歷史版本和發(fā)行版公司

2.1 Hadoop歷史版本

1.x版本系列:hadoop版本當中的第二代開源版本荠医,主要修復0.x版本的一些bug等

2.x版本系列:架構產生重大變化夸楣,引入了yarn平臺等許多新特性

3.x版本系列: 加入多namenoode新特性

2.2 Hadoop三大發(fā)行版公司

免費開源版本apache:

Apache Hadoop

優(yōu)點:擁有全世界的開源貢獻者,代碼更新迭代版本比較快子漩,

缺點:版本的升級豫喧,版本的維護,版本的兼容性幢泼,版本的補丁都可能考慮不太周到紧显,

apache所有軟件的下載地址(包括各種歷史版本):

Index of /dist

免費開源版本hortonWorks:

hortonworks主要是雅虎主導Hadoop開發(fā)的副總裁,帶領二十幾個核心成員成立Hortonworks缕棵,核心產品軟件HDP(ambari)孵班,HDF免費開源,并且提供一整套的web管理界面招驴,供我們可以通過web界面管理我們的集群狀態(tài)篙程,web管理界面軟件HDF網址

3、hadoop的架構模型

1.x的版本架構模型介紹

文件系統(tǒng)核心模塊:

NameNode:集群當中的主節(jié)點别厘,管理元數(shù)據(jù)(文件的大小虱饿,文件的位置,文件的權限)触趴,主要用于管理集群當中的各種數(shù)據(jù)

secondaryNameNode:主要能用于hadoop當中元數(shù)據(jù)信息的輔助管理

DataNode:集群當中的從節(jié)點氮发,主要用于存儲集群當中的各種數(shù)據(jù)

數(shù)據(jù)計算核心模塊:

JobTracker:接收用戶的計算請求任務,并分配任務給從節(jié)點

TaskTracker:負責執(zhí)行主節(jié)點JobTracker分配的任務

2.x的版本架構模型介紹

第一種:NameNode與ResourceManager單節(jié)點架構模型

文件系統(tǒng)核心模塊:

NameNode:集群當中的主節(jié)點冗懦,主要用于管理集群當中的各種數(shù)據(jù)

secondaryNameNode:主要能用于hadoop當中元數(shù)據(jù)信息的輔助管理

DataNode:集群當中的從節(jié)點爽冕,主要用于存儲集群當中的各種數(shù)據(jù)

數(shù)據(jù)計算核心模塊:

ResourceManager:接收用戶的計算請求任務,并負責集群的資源分配

NodeManager:負責執(zhí)行主節(jié)點APPmaster分配的任務

第二種:NameNode單節(jié)點與ResourceManager高可用架構模型

文件系統(tǒng)核心模塊:

NameNode:集群當中的主節(jié)點披蕉,主要用于管理集群當中的各種數(shù)據(jù)

secondaryNameNode:主要能用于hadoop當中元數(shù)據(jù)信息的輔助管理

DataNode:集群當中的從節(jié)點颈畸,主要用于存儲集群當中的各種數(shù)據(jù)

數(shù)據(jù)計算核心模塊:

ResourceManager:接收用戶的計算請求任務,并負責集群的資源分配没讲,以及計算任務的劃分眯娱,通過zookeeper實現(xiàn)ResourceManager的高可用

NodeManager:負責執(zhí)行主節(jié)點ResourceManager分配的任務

第三種:NameNode高可用與ResourceManager單節(jié)點架構模型

文件系統(tǒng)核心模塊:

NameNode:集群當中的主節(jié)點,主要用于管理集群當中的各種數(shù)據(jù)食零,其中nameNode可以有兩個困乒,形成高可用狀態(tài)

DataNode:集群當中的從節(jié)點,主要用于存儲集群當中的各種數(shù)據(jù)

JournalNode:文件系統(tǒng)元數(shù)據(jù)信息管理

數(shù)

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末贰谣,一起剝皮案震驚了整個濱河市娜搂,隨后出現(xiàn)的幾起案子迁霎,更是在濱河造成了極大的恐慌,老刑警劉巖百宇,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件考廉,死亡現(xiàn)場離奇詭異,居然都是意外死亡携御,警方通過查閱死者的電腦和手機昌粤,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來啄刹,“玉大人涮坐,你說我怎么就攤上這事∈木” “怎么了袱讹?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵,是天一觀的道長昵时。 經常有香客問我捷雕,道長,這世上最難降的妖魔是什么壹甥? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任救巷,我火速辦了婚禮,結果婚禮上句柠,老公的妹妹穿的比我還像新娘浦译。我一直安慰自己,他們只是感情好俄占,可當我...
    茶點故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布管怠。 她就那樣靜靜地躺著淆衷,像睡著了一般缸榄。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上祝拯,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天甚带,我揣著相機與錄音,去河邊找鬼佳头。 笑死鹰贵,一個胖子當著我的面吹牛,可吹牛的內容都是我干的康嘉。 我是一名探鬼主播碉输,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼亭珍!你這毒婦竟也來了敷钾?” 一聲冷哼從身側響起枝哄,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎阻荒,沒想到半個月后挠锥,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡侨赡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年蓖租,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片羊壹。...
    茶點故事閱讀 38,577評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡蓖宦,死狀恐怖,靈堂內的尸體忽然破棺而出油猫,到底是詐尸還是另有隱情球昨,我是刑警寧澤,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布眨攘,位于F島的核電站主慰,受9級特大地震影響,放射性物質發(fā)生泄漏鲫售。R本人自食惡果不足惜共螺,卻給世界環(huán)境...
    茶點故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望情竹。 院中可真熱鬧藐不,春花似錦、人聲如沸秦效。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽阱州。三九已至挑秉,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間苔货,已是汗流浹背犀概。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留夜惭,地道東北人姻灶。 一個月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像诈茧,于是被迫代替她去往敵國和親产喉。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,452評論 2 348

推薦閱讀更多精彩內容