HDFS Federation

HDFS Federation

HDFS Federation是Hadoop最新發(fā)布版本Hadoop-0.23.0中為解決HDFS單點故障而提出的namenode水平擴展方案帆卓。該方案允許HDFS創(chuàng)建多個namespace以提高集群的擴展性和隔離性。本篇文章主要介紹了HDFS Federation的設(shè)計動機和基本原理剑令。

背景

圖一
  • Namespace 管理目錄吁津,文件和數(shù)據(jù)塊。它支持常見的文件系統(tǒng)操作梭依,如創(chuàng)建文件典尾,修改文件,刪除文件等河闰。
  • Block Storage 由兩部分組成:Block Management維護集群中datanode的基本關(guān)系,它支持數(shù)據(jù)塊相關(guān)的操作姜性,如:創(chuàng)建數(shù)據(jù)塊,刪除數(shù)據(jù)塊等弃酌,同時儡炼,它也會管理副本的復(fù)制和存放。Physical Storage存儲實際的數(shù)據(jù)塊并提供針對數(shù)據(jù)塊的讀寫服務(wù)多柑。

以前的HDFS架構(gòu)只允許一個集群擁有一個命名空間楣责,一個Namenode管理著整個命名空間。HDFS Federation通過向HDFS增加多Namenode和namespace來解決這種限制初嘹。

HDFS Federation

圖二

為了水平擴展name service沮趣,F(xiàn)ederation使用了獨立的多Namenode/Namespaces的架構(gòu)房铭。這些namenode之間是聯(lián)合的,也就是說缸匪,他們之間相互獨立且不需要互相協(xié)調(diào),各自分工露懒,管理自己的區(qū)域砂心。(The Namenodes are federated; the Namenodes are independent and do not require coordination with each other.)Datanode被用作是存儲設(shè)備,在集群中坎弯,每一個Datanode都在Namenodes上注冊。Datanodes周期性的發(fā)送心跳包和關(guān)于塊的報告洒琢。Datanodes也要處理來自Namenodes的命令褐桌。

幾個關(guān)鍵的概念

  • Block Pool 塊池,一個Block Pool是屬于同一個namespace下的一組塊集合呛踊。每個datanode可能會存儲集群中所有Block Pool的數(shù)據(jù)塊啦撮。(Datanodes store blocks for all the block pools in the cluster.)每個Block Pool的管理是獨立的。這樣的好處是愉择,允許一個namespace為一個新的塊生成一個Block IDs织中,而不需要和其他的namespace進行協(xié)調(diào)。一個namenode掛掉了狭吼,不會影響其他namenode。
  • Namespace Volume 一個namespace和它的Block Pool一起被統(tǒng)稱為Namespace Volume破花。它是管理的最小單元疲吸。當(dāng)一個Namenode/namespace被刪除之后,每個Datanode上相應(yīng)的Block Pool也會被刪除尺栖。每個Namespace Volume是升級的最小的一個單元烦租。
  • ClusterID 一個新的標識ClusterID添加到集群除盏,用來標記所有的Nodes,當(dāng)Namenode格式化時(formated)窃祝,將會自動創(chuàng)建ClusterID踱侣,這個ID用來區(qū)分集群中的Namenodes大磺。

Namespace的管理

圖三

Federation中存在多個命名空間杠愧,如何劃分和管理這些命名空間非常關(guān)鍵逞壁。在Federation中并采用“文件名hash”的方法,因為該方法的locality非常差绳瘟,比如:查看某個目錄下面的文件姿骏,如果采用文件名hash的方法存放文件,則這些文件可能被放到不同namespace中姨丈,HDFS需要訪問所有namespace擅腰,代價過大。為了方便管理多個命名空間歼争,HDFS Federation采用了經(jīng)典的Client Side Mount Table渗勘。

如圖三所示,下面四個深色三角形代表一個獨立的命名空間乔遮,上方淺色的三角形代表從客戶角度去訪問的子命名空間取刃。各個深色的命名空間Mount到淺色的表中,客戶可以訪問不同的掛載點來訪問不同的命名空間坯辩,這就如同在Linux系統(tǒng)中訪問不同掛載點一樣崩侠。這就是HDFS Federation中命名空間管理的基本原理:將各個命名空間掛載到全局mount-table中,就可以做將數(shù)據(jù)到全局共享改抡;同樣的命名空間掛載到個人的mount-table中,這就成為應(yīng)用程序可見的命名空間視圖阿纤。

HDFS Federation的優(yōu)勢

  • 命名空間的擴展.因為隨著集群使用時間的加長,HDFS上存放的數(shù)據(jù)也將會越來越多.這個時候如果還是將所有的數(shù)據(jù)都往一個NameNode上存放,這個文件系統(tǒng)會顯得非常的龐大.這時候我們可以進行橫向擴展,把一些大的目錄分離出去.使得每個NameNode下的數(shù)據(jù)看起來更加的精簡阵赠。
  • 性能的提升.這個也很好理解.當(dāng)NameNode所持有的數(shù)據(jù)量達到了一個非常大規(guī)模的量級的時候(比如超過1億個文件),這個時候NameNode的處理效率可能就會有影響,它可能比較容易的會陷入一個繁忙的狀態(tài).而整個集群將會受限于一個單點NameNode的處理效率,從而影響集群整體的吞吐量.這個時候多NameNode機制顯然可以減輕很多這部分的壓力。
  • 資源的隔離.這一點考慮的就比較深了.通過多個命名空間,我們可以將關(guān)鍵數(shù)據(jù)文件目錄移到不同的NameNode上,以此不讓這些關(guān)鍵數(shù)據(jù)的讀寫操作受到其他普通文件讀寫操作的影響.也就是說這些NameNode將會只處理特定的關(guān)鍵的任務(wù)所發(fā)來的請求,而屏蔽了其他普通任務(wù)的文件讀寫請求,以此做到了資源的隔離.千萬不要小看這一點,當(dāng)你發(fā)現(xiàn)NameNode正在處理某個不良任務(wù)的大規(guī)模的請求操作導(dǎo)致響應(yīng)速度極慢時,你一定會非常的懊惱匕荸。

參考資料

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末榛搔,一起剝皮案震驚了整個濱河市东揣,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌尔觉,老刑警劉巖芥吟,帶你破解...
    沈念sama閱讀 211,561評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異钉稍,居然都是意外死亡棺耍,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,218評論 3 385
  • 文/潘曉璐 我一進店門俊卤,熙熙樓的掌柜王于貴愁眉苦臉地迎上來瘾蛋,“玉大人矫限,你說我怎么就攤上這事〉鸱纾” “怎么了无宿?”我有些...
    開封第一講書人閱讀 157,162評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長蹂午。 經(jīng)常有香客問我彬碱,道長,這世上最難降的妖魔是什么巷疼? 我笑而不...
    開封第一講書人閱讀 56,470評論 1 283
  • 正文 為了忘掉前任嚼沿,我火速辦了婚禮,結(jié)果婚禮上遣妥,老公的妹妹穿的比我還像新娘攀细。我一直安慰自己,他們只是感情好班套,可當(dāng)我...
    茶點故事閱讀 65,550評論 6 385
  • 文/花漫 我一把揭開白布故河。 她就那樣靜靜地躺著,像睡著了一般理盆。 火紅的嫁衣襯著肌膚如雪凑阶。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,806評論 1 290
  • 那天姨俩,我揣著相機與錄音环葵,去河邊找鬼。 笑死张遭,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的缔恳。 我是一名探鬼主播洁闰,決...
    沈念sama閱讀 38,951評論 3 407
  • 文/蒼蘭香墨 我猛地睜開眼渴庆,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了襟雷?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,712評論 0 266
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎计呈,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體茁彭,經(jīng)...
    沈念sama閱讀 44,166評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡扶歪,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,510評論 2 327
  • 正文 我和宋清朗相戀三年善镰,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片乎完。...
    茶點故事閱讀 38,643評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡品洛,死狀恐怖摩桶,靈堂內(nèi)的尸體忽然破棺而出娃弓,到底是詐尸還是另有隱情岛宦,我是刑警寧澤,帶...
    沈念sama閱讀 34,306評論 4 330
  • 正文 年R本政府宣布,位于F島的核電站变汪,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏实胸。R本人自食惡果不足惜番官,卻給世界環(huán)境...
    茶點故事閱讀 39,930評論 3 313
  • 文/蒙蒙 一庐完、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧徘熔,春花似錦门躯、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,745評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至山孔,卻和暖如春懂讯,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背台颠。 一陣腳步聲響...
    開封第一講書人閱讀 31,983評論 1 266
  • 我被黑心中介騙來泰國打工褐望, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人蓉媳。 一個月前我還...
    沈念sama閱讀 46,351評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像酪呻,于是被迫代替她去往敵國和親减宣。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,509評論 2 348

推薦閱讀更多精彩內(nèi)容

  • Hadoop筆記1-HDFS-Federation 轉(zhuǎn)載:http://dongxicheng.org/mapre...
    raincoffee閱讀 470評論 0 0
  • 首先玩荠,我們在使用前先看看HDFS是什麼漆腌?這將有助于我們是以后的運維使用和故障排除思路的獲得贼邓。 HDFS采用mast...
    W_Bousquet閱讀 4,181評論 0 2
  • HDFS的設(shè)計目標 通過上一篇文章的介紹我們已經(jīng)了解到HDFS到底是怎樣的東西,以及它是怎樣通過多副本機制來提供高...
    陌上疏影涼閱讀 1,440評論 0 3
  • 文/古月言 不是誰都會在你謝幕離開過后闷尿,還一直默默站在原地塑径。--------題記 目錄 伊楚楚踩著她十厘米的紅色高...
    古月言閱讀 653評論 4 3
  • 傍晚時分,張司令和王金花一行浩浩蕩蕩來到楊府填具。此時楊府華燈初上统舀,人聲鼎沸,好不熱鬧劳景。紅玫瑰特意喬扮一番誉简,可謂光采照...
    六月孺子牛閱讀 328評論 3 6