HDFS詳解

可以在http://master:50070上訪問hdfs的web頁面诅挑。
本文章主題如下:

  • HFDS結(jié)構(gòu)

  • NameNode

  • DataNode

  • Secondary NameNode

  • Block

  • Block副本管理

  • 機架感知策略

  • HDFS結(jié)構(gòu)

HDFS結(jié)構(gòu).png

Hadoop分布式系統(tǒng) —— HDFS,它是一個塊結(jié)構(gòu)文件系統(tǒng)肉渴,它的每個文件都被分割成許多預定大小的塊。這些塊被存儲在集群中的一臺或多臺機器上眶诈。HDFS遵循主/從結(jié)構(gòu)缩功,集群中擁有一臺單獨的NameNode(主節(jié)點)果善,其它節(jié)點都是DataNode(從節(jié)點)虚倒。

  • NameNode

NameNode.png

NameNode維護并管理著DataNode上的block美侦。
以下是NameNode的功能:

  1. 維護并管理著DataNode節(jié)點;
  • 記錄著集群中所有文件的元數(shù)據(jù)(metadata)信息魂奥,比如:block的存儲位置菠剩,文件的大小,權(quán)限耻煤,層級關系等具壮。有兩個文件關聯(lián)著元數(shù)據(jù)(metadata):

  • FsImage: 記錄著文件系統(tǒng)命名空間(namespace)自從上一次啟動之后的完整狀態(tài)。

  • EditsLog:記錄著相對于最近的FsImage哈蝇,客戶端對文件系統(tǒng)所有修改的信息棺妓。

    • 記錄著文件系統(tǒng)中元數(shù)據(jù)所發(fā)生的所有變化,比如:HDFS中的某個文件被刪除炮赦,NameNode立即在EditLog中進行記錄怜跑。
    • 定期從集群中的所有DataNode接收心跳和塊報告,用來確認DataNode是否宕機吠勘。
    • 保存著HDFS中所有塊的記錄性芬,以及這些塊位于哪個節(jié)點。
    • 負責處理所有塊的副本剧防。
    • 在DataNode宕機的情況下植锉,NameNode會為副本選擇新的DataNode,平衡磁盤的使用量诵姜,管理DataNode間的通信流量汽煮。
  • DataNode

DataNode是HDFS中的從節(jié)點搏熄,它是將數(shù)據(jù)以ext3或者ext4這種文件格式棚唆,存儲在本地的塊服務器。
以下是DataNode的功能:

  1. 處理文件客戶端的低級讀寫請求心例。
  • 向NameNode定期發(fā)送心跳匯報HDFS總體的健康狀況宵凌,默認情況下,每3秒發(fā)送一次止后。

  • Secondary NameNode

它的職責是輔助NameNode工作瞎惫,而不是備用節(jié)點。

Secondary-NameNode.png

它的功能如下:

  1. 合并來自NameNode的FsImage和EditLog译株,并將合并之后的FsImage文件拷貝給NameNode瓜喇。
  • Block

存儲在DataNode磁盤上的文件塊,默認大小是128M(1.x默認大小是64M),可通過hdfs-site.xml 文件配置dfs.blocksize 屬性來制定block大小歉糜。block文件可以在DataNone的
{dfs.datanode.data.dir}/data/current/XXX/current/finalized/xx/目錄下找到乘寒。如果block塊太小,將會導致一個文件將會被分割成非常多的塊匪补,以至于會有非常多mateData數(shù)據(jù)伞辛,浪費內(nèi)存以及硬盤空間烂翰。

HDFS-File-Block.png
  • Block副本管理

Block默認是3個,


Replication-Management.png

以在配置文件中設置蚤氏。

  • 機架感知策略

HDFS的存放策略(機架感知策略)是將一個副本存放在本地機架的節(jié)點上甘耿,一個副本放在同一機架的另一個節(jié)點上,最后一個副本放在不同機架的節(jié)點上

Rack-Awareness.png

機架感知策略的有點:

  1. 提高網(wǎng)絡性能:這種策略減少了機架間的數(shù)據(jù)傳輸竿滨,這就提高了寫操作的效率佳恬,數(shù)據(jù)塊只放在兩個(不是三個)不同的機架上,因此減少了讀取數(shù)據(jù)時需要的網(wǎng)絡傳輸總帶寬于游。
  • 避免數(shù)據(jù)丟失:副本分布在不同機架上不同節(jié)點上殿怜,不會因為某個機架或者節(jié)點宕機而導致數(shù)據(jù)丟失。

文獻:https://www.edureka.co/blog/apache-hadoop-hdfs-architecture/?utm_source=quora&utm_medium=crosspost&utm_campaign=social-media-edureka-ab
http://zheming.wang/blog/2015/07/24/17505A21-0204-48AB-8EBE-EAC911B22821/

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末曙砂,一起剝皮案震驚了整個濱河市头谜,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌鸠澈,老刑警劉巖柱告,帶你破解...
    沈念sama閱讀 218,607評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異笑陈,居然都是意外死亡际度,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,239評論 3 395
  • 文/潘曉璐 我一進店門涵妥,熙熙樓的掌柜王于貴愁眉苦臉地迎上來乖菱,“玉大人,你說我怎么就攤上這事蓬网≈纤” “怎么了?”我有些...
    開封第一講書人閱讀 164,960評論 0 355
  • 文/不壞的土叔 我叫張陵帆锋,是天一觀的道長吵取。 經(jīng)常有香客問我,道長锯厢,這世上最難降的妖魔是什么皮官? 我笑而不...
    開封第一講書人閱讀 58,750評論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮实辑,結(jié)果婚禮上捺氢,老公的妹妹穿的比我還像新娘。我一直安慰自己剪撬,他們只是感情好摄乒,可當我...
    茶點故事閱讀 67,764評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般缺狠。 火紅的嫁衣襯著肌膚如雪问慎。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,604評論 1 305
  • 那天挤茄,我揣著相機與錄音如叼,去河邊找鬼。 笑死穷劈,一個胖子當著我的面吹牛笼恰,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播歇终,決...
    沈念sama閱讀 40,347評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼社证,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了评凝?” 一聲冷哼從身側(cè)響起追葡,我...
    開封第一講書人閱讀 39,253評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎奕短,沒想到半個月后宜肉,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,702評論 1 315
  • 正文 獨居荒郊野嶺守林人離奇死亡翎碑,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,893評論 3 336
  • 正文 我和宋清朗相戀三年谬返,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片日杈。...
    茶點故事閱讀 40,015評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡遣铝,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出莉擒,到底是詐尸還是另有隱情酿炸,我是刑警寧澤,帶...
    沈念sama閱讀 35,734評論 5 346
  • 正文 年R本政府宣布啰劲,位于F島的核電站梁沧,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏蝇裤。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,352評論 3 330
  • 文/蒙蒙 一频鉴、第九天 我趴在偏房一處隱蔽的房頂上張望栓辜。 院中可真熱鬧,春花似錦垛孔、人聲如沸藕甩。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,934評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽狭莱。三九已至僵娃,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間腋妙,已是汗流浹背默怨。 一陣腳步聲響...
    開封第一講書人閱讀 33,052評論 1 270
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留骤素,地道東北人匙睹。 一個月前我還...
    沈念sama閱讀 48,216評論 3 371
  • 正文 我出身青樓,卻偏偏與公主長得像济竹,于是被迫代替她去往敵國和親痕檬。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 44,969評論 2 355

推薦閱讀更多精彩內(nèi)容

  • 認識HDFS HDFS的特點: 高容錯性高吞吐量故障的檢測和自動快速恢復流式的數(shù)據(jù)訪問大數(shù)據(jù)集一次寫入,多次讀寫 ...
    Bloo_m閱讀 3,262評論 6 8
  • Hadoop2.X后可以劃分為三部分:HDFS送浊、MapReduce和Yarn梦谜,本篇主要看一下HDFS。 架構(gòu)圖 進...
    忘凈空閱讀 1,047評論 1 0
  • 目錄 HDFS的工作機制 概述 HDFS 寫數(shù)據(jù)流程 HDFS 讀數(shù)據(jù)流程 NameNode的工作機制 NameN...
    Singer_Au閱讀 9,869評論 0 5
  • 人的一生雖然短暫袭景,但是攏聚點滴改淑,都是一本厚重的傳奇。 情節(jié)不同浴讯、經(jīng)歷各異朵夏,而主人公是你自己。 ...
    安福楊玉生閱讀 256評論 0 1
  • 從前的日色變得慢 車榆纽,馬仰猖,郵件都慢 一生只夠愛一個人
    FayFan閱讀 257評論 0 1