從 hadoop 1.0 到 hadoop 2.0 的演化

1. 概述

在 Google 三篇大數(shù)據(jù)論文發(fā)表之后罐氨，Cloudera 公司在這幾篇論文的基礎(chǔ)上臀规，開發(fā)出了現(xiàn)在的 Hadoop 。但 Hadoop 開發(fā)出來也并非一帆風(fēng)順的栅隐，Hadoop 1.0 版本有諸多局限塔嬉。在后續(xù)的不斷實踐之中， Hadoop 2.0 橫空出世租悄，而后 Hadoop 2.0 逐漸成為主流谨究。這次我們就來看看 Hadoop 從 1.0 遇到了哪些問題，又為什么需要做架構(gòu)的升級呢泣棋？

2. Hadoop 1.0

首先我們來看 hadoop1.0 的整體結(jié)構(gòu)胶哲。在 hadoop1.0 中有兩個模塊，一個是分布式文件系統(tǒng) HDFS(Hadoop Distrbuted File System) 外傅。另一個則是分布式計算框架 MapReduce 纪吮。我們分別來看看這兩個模塊的架構(gòu)吧俩檬。

2.1 HDFS

對HDFS來說萎胰，其主要的運行架構(gòu)則是 master-slave 架構(gòu)，即主從架構(gòu)棚辽。其中呢技竟，master 主節(jié)點稱之為 Namenode 節(jié)點，而slave從節(jié)點稱為 DataNode 節(jié)點屈藐。

image

這個NameNode的職責(zé)是什么呢榔组？

NameNode管理著整個文件系統(tǒng)，負(fù)責(zé)接收用戶的操作請求
NameNode管理著整個文件系統(tǒng)的目錄結(jié)構(gòu)联逻，所謂目錄結(jié)構(gòu)類似于我們Windows操作系統(tǒng)的體系結(jié)構(gòu)
NameNode管理著整個文件系統(tǒng)的元數(shù)據(jù)信息搓扯，所謂元數(shù)據(jù)信息指定是除了數(shù)據(jù)本身之外涉及到文件自身的相關(guān)信息
NameNode保管著文件與block塊序列之間的對應(yīng)關(guān)系以及block塊與DataNode節(jié)點之間的對應(yīng)關(guān)系

在hadoop1.0中，namenode有且只有一個包归，雖然可以通過SecondaryNameNode與NameNode進(jìn)行數(shù)據(jù)同步備份锨推，但是總會存在一定的延時，如果NameNode掛掉，但是如果有部份數(shù)據(jù)還沒有同步到SecondaryNameNode上换可，還是可能會存在著數(shù)據(jù)丟失的問題椎椰。

值得一提的是，在HDFS中,我們真實的數(shù)據(jù)是由DataNode來負(fù)責(zé)來存儲的沾鳄，但是數(shù)據(jù)具體被存儲到了哪個DataNode節(jié)點等元數(shù)據(jù)信息則是由我們的NameNode來存儲的慨飘。

這種架構(gòu)實現(xiàn)的好處的簡單，但其局限同樣明顯：

單點故障問題：因為NameNode含有我們用戶存儲文件的全部的元數(shù)據(jù)信息译荞，當(dāng)我們的NameNode無法在內(nèi)存中加載全部元數(shù)據(jù)信息的時候瓤的，集群的壽命就到頭了。
拓展性問題：NameNode在內(nèi)存中存儲了整個分布式文件系統(tǒng)中的元數(shù)據(jù)信息吞歼，并且NameNode只能有一臺機器堤瘤，無法拓展。單臺機器的NameNode必然有到達(dá)極限的地方浆熔。
性能問題：當(dāng)HDFS中存儲大量的小文件時本辐，會使NameNode的內(nèi)存壓力增加。
隔離性問題：單個namenode難以提供隔離性医增，即：某個用戶提交的負(fù)載很大的job會減慢其他用戶的job慎皱。

2.2 MapReduce

對MapReduce來說，同樣時一個主從結(jié)構(gòu)叶骨，是由一個JobTracker（主）和多個TaskTracker（從）組成茫多。

而JobTracker在hadoop1.0的MapReduce中做了很多事情，可以說當(dāng)?shù)之?dāng)媽忽刽。

負(fù)責(zé)接收client提交給的計算任務(wù)天揖。
負(fù)責(zé)將接收的計算任務(wù)分配給各個的TaskTracker進(jìn)行執(zhí)行。
通過heartbeat(心跳)來管理TaskTracker機器的情況跪帝，同時監(jiān)控任務(wù)task的執(zhí)行狀況今膊。

這個架構(gòu)的缺陷：

單點故障：依舊是單點故障問題，如果JobTracker掛掉了會導(dǎo)致MapReduce作業(yè)無法執(zhí)行伞剑。
資源浪費：JobTracker 完成了太多的任務(wù)斑唬，造成了過多的資源消耗，當(dāng) map-reduce job 非常多的時候黎泣，會造成很大的內(nèi)存開銷恕刘，潛在來說，也增加了 JobTracker 失效的風(fēng)險抒倚，這也是業(yè)界普遍總結(jié)出老 Hadoop 的 Map-Reduce 只能支持 4000 節(jié)點主機的上限褐着；
只支持簡單的MapReduce編程模型：要使用Hadoop進(jìn)行編程的話只能使用基礎(chǔ)的MapReduce，而無法使用諸如Spark這些計算模型托呕。并且它也不支持流式計算和實時計算含蓉。

3. Hadoop 2.0

image

Hadoop 2.0 比起 Hadoop 1.0 來說洋访，最大的改進(jìn)是加入了資源調(diào)度框架 Yarn ，我們依舊分為HDFS和 Yarn/MapReduce2.0 兩部分來講述Hadoop的改進(jìn)谴餐。

3.1 HDFS

針對 Hadoop 1.0 中 NameNode 制約HDFS的擴展性問題姻政，提出HDFS Federation 以及高可用 HA 。此時 NameNode 間相互獨立岂嗓，也就是說它們之間不需要相互協(xié)調(diào)汁展。且多個NameNode分管不同的目錄進(jìn)而實現(xiàn)訪問隔離和橫向擴展。

這樣 NameNode 的可拓展性自然而然可用增加厌殉，據(jù)統(tǒng)計 Hadoop 2.0 中最多可以達(dá)到 10000 個節(jié)點同時運行食绿，并且這樣的架構(gòu)改進(jìn)也解決了NameNode單點故障問題。

再來說說高可用 (HA) , HA 主要指的是可以同時啟動2個 NameNode 公罕。其中一個處于工作 (Active) 狀態(tài)器紧，另一個處于隨時待命（Standby）狀態(tài)。這樣楼眷，當(dāng)一個NameNode所在的服務(wù)器宕機時铲汪，可以在數(shù)據(jù)不丟失的情況下，手工或者自動切換到另一個 NameNode 提供服務(wù)罐柳。

3.2 Yarn/MapReduce2

針對 Hadoop 1.0 中 MR 的不足掌腰，引入了Yarn 框架。Yarn 框架中將 JobTracker 資源分配和作業(yè)控制分開张吉，分為 Resource Manager (RM) 以及 Application Master (AM) 齿梁。

image

而Yarn框架作為一個通用的資源調(diào)度和管理模塊，同時支持多種其他的編程模型肮蛹，比如最出名的 Spark 勺择。

Yarn的主要三個組件如下：

Resource Manager：ResourceManager包含兩個主要的組件：定時調(diào)用器(Scheduler)以及應(yīng)用管理器(ApplicationManager)。
1. 定時調(diào)度器(Scheduler)：定時調(diào)度器負(fù)責(zé)向應(yīng)用程序分配資源伦忠，它不做監(jiān)控以及應(yīng)用程序的狀態(tài)跟蹤省核，并且它不保證會重啟由于應(yīng)用程序本身或硬件出錯而執(zhí)行失敗的應(yīng)用程序。
2. 應(yīng)用管理器(ApplicationManager)：應(yīng)用程序管理器負(fù)責(zé)接收新任務(wù)缓苛，協(xié)調(diào)并提供在ApplicationMaster容器失敗時的重啟功能芳撒。
Application Master：每個應(yīng)用程序的ApplicationMaster負(fù)責(zé)從Scheduler申請資源邓深，以及跟蹤這些資源的使用情況以及任務(wù)進(jìn)度的監(jiān)控未桥。
Node Manager：NodeManager是ResourceManager在每臺機器的上代理，負(fù)責(zé)容器的管理芥备，并監(jiān)控他們的資源使用情況（cpu冬耿，內(nèi)存，磁盤及網(wǎng)絡(luò)等）萌壳，以及向 ResourceManager/Scheduler提供這些資源使用報告亦镶。

一點點感悟

沒有什么是一開始就完美的日月，當(dāng)下最流行的 Hadoop 也一樣。從上面說的缤骨，我們可以知道 Hadoop 1.0 是比較簡陋的爱咬，這樣做的目的就是為了易于實現(xiàn)。Hadoop 這樣做也契合了敏捷開發(fā)的原則绊起，也可以說契合產(chǎn)品經(jīng)理口中的最小可行性產(chǎn)品（MVP）精拟，就是先實現(xiàn)一個簡單些，但核心功能齊全的版本出來虱歪，讓市場對其進(jìn)行檢驗蜂绎，而有了結(jié)果之后再進(jìn)行拓展升級。

在當(dāng)時那種許多公司都苦惱于沒有自己的大數(shù)據(jù)環(huán)境的情況下笋鄙，Hadoop 一炮而紅师枣。這時候再根據(jù)市場，也就是開源社區(qū)給出的反饋萧落，不斷迭代践美，更新升級。最終成為大數(shù)群山中最為堅固的一座山峰找岖。

我們在平時的產(chǎn)品開發(fā)中應(yīng)該也要像 Hadoop 學(xué)習(xí)拨脉，先做出最小可行性產(chǎn)品出來，再在后面進(jìn)行更新升級宣增，不斷完善玫膀。當(dāng)然這對一些完美主義者來說，可能會讓他感到比較痛苦爹脾。

你看帖旨，世間的事多是相通，技術(shù)的發(fā)展過程其實也暗合產(chǎn)品之道灵妨。有時候我們或許可以跳出技術(shù)之外解阅，思考它背后產(chǎn)品的邏輯，這其中又有哪些是我們可以學(xué)習(xí)的泌霍，這些同樣是珍貴的寶藏货抄，所謂他山之石，可以攻玉朱转，莫過于此~~

以上~

歡迎關(guān)注公眾號蟹地，有數(shù)據(jù)，代碼和深度的思考藤为。
PS：關(guān)注后回復(fù)“數(shù)據(jù)挖掘一”可獲得數(shù)據(jù)挖掘思維導(dǎo)圖

哈爾的數(shù)據(jù)城堡

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末怪与，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子缅疟，更是在濱河造成了極大的恐慌分别，老刑警劉巖遍愿，帶你破解...
沈念sama閱讀 221,695評論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異耘斩，居然都是意外死亡沼填，警方通過查閱死者的電腦和手機，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,569評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門括授，熙熙樓的掌柜王于貴愁眉苦臉地迎上來倾哺，“玉大人，你說我怎么就攤上這事刽脖⌒吆＃” “怎么了？”我有些...
開封第一講書人閱讀 168,130評論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵曲管，是天一觀的道長却邓。經(jīng)常有香客問我，道長院水，這世上最難降的妖魔是什么腊徙？我笑而不...
開封第一講書人閱讀 59,648評論 1贊 297
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮檬某，結(jié)果婚禮上撬腾，老公的妹妹穿的比我還像新娘。我一直安慰自己恢恼，他們只是感情好民傻，可當(dāng)我...
茶點故事閱讀 68,655評論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著场斑，像睡著了一般漓踢。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上漏隐，一...
開封第一講書人閱讀 52,268評論 1贊 309
城市分裂傳說
那天喧半，我揣著相機與錄音，去河邊找鬼青责。笑死挺据，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的脖隶。我是一名探鬼主播扁耐，決...
沈念sama閱讀 40,835評論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼捐下，長吁一口氣：“原來是場噩夢啊……” “哼枣接！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,740評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤心墅，失蹤者是張志新（化名）和其女友劉穎酿矢，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體怎燥，經(jīng)...
沈念sama閱讀 46,286評論 1贊 318
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡瘫筐，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 38,375評論 3贊 340
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了铐姚。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片策肝。...
茶點故事閱讀 40,505評論 1贊 352
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖隐绵，靈堂內(nèi)的尸體忽然破棺而出之众，到底是詐尸還是另有隱情，我是刑警寧澤依许，帶...
沈念sama閱讀 36,185評論 5贊 350
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布棺禾，位于F島的核電站，受9級特大地震影響峭跳，放射性物質(zhì)發(fā)生泄漏膘婶。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,873評論 3贊 333
男人毒藥：我在死后第九天來索命
文/蒙蒙一蛀醉、第九天我趴在偏房一處隱蔽的房頂上張望悬襟。院中可真熱鬧，春花似錦拯刁、人聲如沸脊岳。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,357評論 0贊 24
一樁弒父案垛玻，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽逸绎。三九已至，卻和暖如春夭谤，著一層夾襖步出監(jiān)牢的瞬間棺牧，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 33,466評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工朗儒，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留颊乘，地道東北人。一個月前我還...
沈念sama閱讀 48,921評論 3贊 376
代替公主和親
正文我出身青樓醉锄，卻偏偏與公主長得像乏悄，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子恳不，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 45,515評論 2贊 359

從 hadoop 1.0 到 hadoop 2.0 的演化

1. 概述

2. Hadoop 1.0

2.1 HDFS

2.2 MapReduce

3. Hadoop 2.0

3.1 HDFS

3.2 Yarn/MapReduce2

一點點感悟

推薦閱讀更多精彩內(nèi)容