HDFS啟動與架構(gòu)詳解

預(yù)知

HDFS是被Hadoop應(yīng)用使用的一個主要的分布式存儲文件系統(tǒng)。一個HDFS集群主要由一個NameNode(管理文件系統(tǒng)元數(shù)據(jù))和多個DataNode(存儲實際的數(shù)據(jù))集成肛捍。HDFS的架構(gòu)請參考我的另一篇文章

HDFS啟動過程

NameNode會保存它的命名空間狀態(tài)信息到本地文件系統(tǒng)愧怜。

  • fsimage:保存最后一次執(zhí)行checkpoint時的命名空間狀態(tài)信息;
  • etids:日志文件看蚜。保存最后一次checkpoint之后的命名空間信息修改變化的日志記錄叫搁。
  1. 當(dāng)啟動HDFS的時候,會先啟動NameNode節(jié)點供炎;NameNode從鏡像文件(fsimage文件)讀取HDFS狀態(tài)信息;
  2. 接著從日志記錄文件(editswenjian )加載狀態(tài)更新信息;
  3. 然后NameNode節(jié)點將HDFS的最新狀態(tài)寫入到fsimage文件(也就是將faimage文件和edits文件合并);
  4. 再重新創(chuàng)建一個新的空的日志文件來記錄文件修改等日志記錄疾党。
    其中音诫,fsimage文件和edit日志記錄文件的位置可以在配置文件hdfs-core.xml中通過dfs.namenode.name.dir參數(shù)來指定。

由于NameNode只在啟動的時候合并fsimage和edits文件雪位,所以當(dāng)一個大的集群運行很久之后竭钝,edits日志文件就會變得很大,這就會影響在NameNode啟動時日志文件的讀取速度雹洗,從而延長了HDFS的啟動時間香罐。這就引出了Secondary NameNode。

特性

Secondary NameNode(在1.0.4版本之后时肿,可由Checkpoint Node替代)

Secondary NameNode會定期的合并fsimage和edits文件庇茫,并限制edits日志文件的大小在一定的范圍之內(nèi)。Secondary NameNode通常運行在和NameNode不同的機(jī)器上螃成。
Secondary NameNode執(zhí)行這些操作主要由這兩個參數(shù)來控制:

  • dfs.namenode.checkpoint.period: 兩次連續(xù)操作之間的時間間隔旦签,默認(rèn)1個小時;
  • dfs.namenode.checkpoint.txns: 定義發(fā)生在NameNode上的最新事物數(shù)寸宏,默認(rèn)一百萬個宁炫,優(yōu)先級大于第一個。

Checkpoint Node

Checkpoint Node定期創(chuàng)建命名空間的checkpoint氮凝。從NameNode下載fsimage和edits文件到本地進(jìn)行合并羔巢,并上傳行的鏡像文件給NameNode。Checkpoint Node一般也是運行于一臺不同的機(jī)器上面,可由命令bin/hdfs namenode -checkpoint啟動竿秆。Checkpoint node跟Secondary node一樣由相同的參數(shù)配置控制炭臭。

Backup Node

Backup Node除了提供跟Checkpoint Node一樣的功能外,它會在內(nèi)存中運行一個最新的跟NameNode狀態(tài)同步的內(nèi)存副本袍辞。Backup Node不需要從NameNode下載fsimage和edits日志文件來創(chuàng)建checkpoint(在CheckpointNode和SecondaryNode中可能需要)鞋仍;因為BackupNode總是有一個同NameNode一樣的內(nèi)存副本。NameNode在同一時間只支持一個BackupNode節(jié)點搅吁;如果有一個BackupNode被使用威创,那么CheckpointNode是不能夠存在的。BackupNode的配置同CheckpointNode一樣谎懦,他又bin/hdfs namenode -backup命令啟動肚豺。

機(jī)架感知

典型的,一個大的Hadoop集群會被放在一個機(jī)群中界拦,在這樣的機(jī)群中吸申,比起跨機(jī)架來說,在相同的機(jī)架上網(wǎng)絡(luò)流量會更好享甸。同時截碴,NameNode也會放置不同的塊副本到不同的機(jī)架上來增強(qiáng)集群的容錯性能。集群管理員可以通過配置變量net.topology.script.file.name來決定節(jié)點所屬機(jī)架的策略蛉威。當(dāng)這個腳本被配置后日丹,每個節(jié)點都會運行這個腳本來決定自己所處的機(jī)架id。默認(rèn)所有的節(jié)點都屬于同一個機(jī)架蚯嫌。

安全模式

NameNode啟動過程中哲虾,加載fsimage和edits文件,然后等待DataNode啟動并且向NameNode報告他們的狀態(tài)择示;這個時間段之間束凑,NameNode就是出于安全模式。NameNode的安全模式實際就是HDFS處于只讀模式栅盲,在這個模式下所有的對文件系統(tǒng)的修改操作都不允許汪诉。在DataNode已經(jīng)報告他們的文件塊可用之后,NameNode會自動從安全模式下解除剪菱。如果有需要摩瞎,HDFS可以通過bin/hdfs dfsadmin -safemode命令來設(shè)置為安全模式狀態(tài)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末孝常,一起剝皮案震驚了整個濱河市旗们,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌构灸,老刑警劉巖上渴,帶你破解...
    沈念sama閱讀 216,744評論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件岸梨,死亡現(xiàn)場離奇詭異,居然都是意外死亡稠氮,警方通過查閱死者的電腦和手機(jī)曹阔,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,505評論 3 392
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來隔披,“玉大人赃份,你說我怎么就攤上這事∩菝祝” “怎么了抓韩?”我有些...
    開封第一講書人閱讀 163,105評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長鬓长。 經(jīng)常有香客問我谒拴,道長,這世上最難降的妖魔是什么涉波? 我笑而不...
    開封第一講書人閱讀 58,242評論 1 292
  • 正文 為了忘掉前任英上,我火速辦了婚禮,結(jié)果婚禮上啤覆,老公的妹妹穿的比我還像新娘苍日。我一直安慰自己,他們只是感情好城侧,可當(dāng)我...
    茶點故事閱讀 67,269評論 6 389
  • 文/花漫 我一把揭開白布易遣。 她就那樣靜靜地躺著,像睡著了一般嫌佑。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上侨歉,一...
    開封第一講書人閱讀 51,215評論 1 299
  • 那天屋摇,我揣著相機(jī)與錄音,去河邊找鬼幽邓。 笑死炮温,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的牵舵。 我是一名探鬼主播柒啤,決...
    沈念sama閱讀 40,096評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼畸颅!你這毒婦竟也來了担巩?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,939評論 0 274
  • 序言:老撾萬榮一對情侶失蹤没炒,失蹤者是張志新(化名)和其女友劉穎涛癌,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,354評論 1 311
  • 正文 獨居荒郊野嶺守林人離奇死亡拳话,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,573評論 2 333
  • 正文 我和宋清朗相戀三年先匪,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片弃衍。...
    茶點故事閱讀 39,745評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡呀非,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出镜盯,到底是詐尸還是另有隱情岸裙,我是刑警寧澤,帶...
    沈念sama閱讀 35,448評論 5 344
  • 正文 年R本政府宣布形耗,位于F島的核電站哥桥,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏激涤。R本人自食惡果不足惜拟糕,卻給世界環(huán)境...
    茶點故事閱讀 41,048評論 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望倦踢。 院中可真熱鬧送滞,春花似錦、人聲如沸辱挥。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,683評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽晤碘。三九已至褂微,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間园爷,已是汗流浹背宠蚂。 一陣腳步聲響...
    開封第一講書人閱讀 32,838評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留童社,地道東北人求厕。 一個月前我還...
    沈念sama閱讀 47,776評論 2 369
  • 正文 我出身青樓,卻偏偏與公主長得像扰楼,于是被迫代替她去往敵國和親呀癣。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,652評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 認(rèn)識HDFS HDFS的特點: 高容錯性高吞吐量故障的檢測和自動快速恢復(fù)流式的數(shù)據(jù)訪問大數(shù)據(jù)集一次寫入,多次讀寫 ...
    Bloo_m閱讀 3,262評論 6 8
  • Hadoop2.X后可以劃分為三部分:HDFS弦赖、MapReduce和Yarn项栏,本篇主要看一下HDFS。 架構(gòu)圖 進(jìn)...
    忘凈空閱讀 1,047評論 1 0
  • (一)分布式文件系統(tǒng)概述 數(shù)據(jù)量越來越多腾节,在一個操作系統(tǒng)管轄的范圍存不下了忘嫉,那么就分配到更多的操作系統(tǒng)管理的磁盤中...
    時待吾閱讀 1,492評論 0 0
  • 1.felicity精聽3.5h 2.單詞1h 3.讀書2h 4.跑步10km 自律意味著想法決定行為荤牍,而非情緒....
    cleddie閱讀 131評論 0 0
  • 下周三就是冬至了,就要進(jìn)入數(shù)九天庆冕,可最近幾天的天氣還是很暖和康吵,雙休日陽光燦爛,有春天的感覺访递。早上第一次醒來大約四點...
    如心1976閱讀 167評論 0 0