HDFS

? ? ? ? ? ? HDFS是HADOOP的分布式文件系統(tǒng)修械,它的設計目標是存儲海量數(shù)據(jù)蛇受,為網(wǎng)絡中的大量客戶端提供數(shù)據(jù)訪問突梦。

? ? ? ? ? ? 在hdfs中單個文件被拆分多個固定大小的block,保存在各個datanode中,訪問一個文件通常需要訪問多個datanode才能獲取完整的數(shù)據(jù)已艰。

? ? ? ? ? ? datanode中的一個block是以單獨的文件形式保存的榛做,并提供對metadata的快速訪問結構唁盏。每個metadata較小,為了保證隨機快速訪問是存放在namenode節(jié)點的內存中瘤睹,metadata在設計上也是非常緊湊的升敲,所以即使一個內存很小的namenode也能支持超大數(shù)據(jù)的訪問。

? ? ? ? ? ? 元數(shù)據(jù)存儲在內存中存儲同時也是持久化的轰传,當metadata修改后會存儲在本地文件FsImage中驴党,同時使用事務日志EditLog記錄每次變動列表。

? ? ? ? ? ? HDFS的namenode基于主從架構获茬,避免單點故障港庄,失效轉移。從namenode維護2個數(shù)據(jù)結構恕曲,metadata鏡像文件及EditLog鹏氧。

? ? ? ? ? ? block默認是64M或128M,并不意味著小文件(小于64M)會任然占用64M的存儲空間佩谣。實際上小文件只占用它實際需要占用的磁盤空間把还。這不是說大量的小文件對整個hdfs文件系統(tǒng)沒有影響:實際上當大量的小文件會占用大量的metadata,而metadata的大小是固定的茸俭,從而給整個hdfs的查詢吊履、擴展上上來帶了負面影響。

? ? ? ? ? ? datanode的復制:如果沒有datanode復制功能调鬓,可以想的到的缺陷艇炎,文件被拆分成多個block存放在不同的datanode上,如果其中的某臺datanode出現(xiàn)了故障腾窝,整個文件將不能還原缀踪。為了避免此問題居砖,hdfs提供在多臺機器上進行復制過程,默認是3臺驴娃,在配置datanode復制因子的時候奏候,填寫2即可。

? ? ? ? ? ? 在hdfs中block的復制是寫操作中的一部分托慨,文件通過客戶端寫入到某個datanode中鼻由,當寫入的數(shù)據(jù)滿足一個block大小時,就向namenode申請復制厚棵,namenode會分配一個datanode進行復制蕉世,并記錄該block的datanode列表,知道該block的列表長度達到設定的數(shù)量時不再分配datanode婆硬。

Paste_Image.png

? ? ? ? ? ? 在復制過程中狠轻,如果分配的datanode發(fā)生了故障,namenode會再分配一個datanode進行重新復制彬犯,并將無效的datanode從列表中移除向楼。當block復制完成后,通知namenode復制完成谐区,列表長度+1湖蜕;

? ? ? ? ? ? namenode會每3s接收datanode的心跳報告,通過報告驗證datanode上的信息和metadata存儲的信息一致宋列。namenode利用這些心跳來標識datanode是否失效昭抒,失效的記為死機狀態(tài),不再向其發(fā)送任何io操作炼杖,除非datanode再次向namenode發(fā)送心跳灭返。

? ? ? ? ? ? HDFS重要特性:機架感知,如果一個block存放的datanode在不同機架上(或不同的地理位置),獲取文件的最快速度就是從同一機架或機房上獲取block坤邪。最簡單的策略就是每個機架(地區(qū))上都有一份block副本熙含,在整個機架丟失數(shù)據(jù)也不會丟失同時也做到了數(shù)據(jù)均勻分布,但這樣對于寫操作消耗較大艇纺,每次寫都要復制到不同的機架(地區(qū))上怎静。

? ? ? ? ? ? 機架感知策略可以理解為,metadata記錄了每個block副本的ip地址黔衡,通過ip段匹配策略來區(qū)分哪個block離該namenode最近消约,視為最近的block。以減少跨機架(地區(qū))IO员帮。

? ? ? ? ? ? HDFS文件的操作:hdfs shell或客戶端 。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末导饲,一起剝皮案震驚了整個濱河市捞高,隨后出現(xiàn)的幾起案子氯材,更是在濱河造成了極大的恐慌,老刑警劉巖硝岗,帶你破解...
    沈念sama閱讀 206,126評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件氢哮,死亡現(xiàn)場離奇詭異,居然都是意外死亡型檀,警方通過查閱死者的電腦和手機冗尤,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,254評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來胀溺,“玉大人裂七,你說我怎么就攤上這事〔治耄” “怎么了背零?”我有些...
    開封第一講書人閱讀 152,445評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長无埃。 經常有香客問我徙瓶,道長,這世上最難降的妖魔是什么嫉称? 我笑而不...
    開封第一講書人閱讀 55,185評論 1 278
  • 正文 為了忘掉前任侦镇,我火速辦了婚禮,結果婚禮上织阅,老公的妹妹穿的比我還像新娘壳繁。我一直安慰自己,他們只是感情好蒲稳,可當我...
    茶點故事閱讀 64,178評論 5 371
  • 文/花漫 我一把揭開白布氮趋。 她就那樣靜靜地躺著,像睡著了一般江耀。 火紅的嫁衣襯著肌膚如雪剩胁。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 48,970評論 1 284
  • 那天祥国,我揣著相機與錄音昵观,去河邊找鬼。 笑死舌稀,一個胖子當著我的面吹牛啊犬,可吹牛的內容都是我干的。 我是一名探鬼主播壁查,決...
    沈念sama閱讀 38,276評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼觉至,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了睡腿?” 一聲冷哼從身側響起语御,我...
    開封第一講書人閱讀 36,927評論 0 259
  • 序言:老撾萬榮一對情侶失蹤峻贮,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后应闯,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體纤控,經...
    沈念sama閱讀 43,400評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 35,883評論 2 323
  • 正文 我和宋清朗相戀三年碉纺,在試婚紗的時候發(fā)現(xiàn)自己被綠了船万。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 37,997評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡骨田,死狀恐怖耿导,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情盛撑,我是刑警寧澤碎节,帶...
    沈念sama閱讀 33,646評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站抵卫,受9級特大地震影響狮荔,放射性物質發(fā)生泄漏。R本人自食惡果不足惜介粘,卻給世界環(huán)境...
    茶點故事閱讀 39,213評論 3 307
  • 文/蒙蒙 一殖氏、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧姻采,春花似錦雅采、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,204評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至刑棵,卻和暖如春巴刻,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背蛉签。 一陣腳步聲響...
    開封第一講書人閱讀 31,423評論 1 260
  • 我被黑心中介騙來泰國打工胡陪, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人碍舍。 一個月前我還...
    沈念sama閱讀 45,423評論 2 352
  • 正文 我出身青樓柠座,卻偏偏與公主長得像,于是被迫代替她去往敵國和親片橡。 傳聞我的和親對象是個殘疾皇子妈经,可洞房花燭夜當晚...
    茶點故事閱讀 42,722評論 2 345

推薦閱讀更多精彩內容

  • 認識HDFS HDFS的特點: 高容錯性高吞吐量故障的檢測和自動快速恢復流式的數(shù)據(jù)訪問大數(shù)據(jù)集一次寫入,多次讀寫 ...
    Bloo_m閱讀 3,242評論 6 8
  • 首先,我們在使用前先看看HDFS是什麼?這將有助于我們是以后的運維使用和故障排除思路的獲得狂塘。 HDFS采用mast...
    W_Bousquet閱讀 4,174評論 0 2
  • hdfs是什么? 問題: 1. hdfs是基于什么樣的原理將文件分塊存儲到分布式環(huán)境中的各個設備上的录煤? 2. h...
    4762d2980c91閱讀 4,716評論 0 6
  • [cp]一首新的原創(chuàng)出鍋了希望你們能夠喜歡。 《現(xiàn)實》 三年了荞胡,我一直在等你,等你能夠來到我身邊的那天了嚎±崞可你為了他...
    蘇a晨啊閱讀 170評論 0 2
  • 辭職到現(xiàn)在還有4天就滿一個月了,家里人分成兩派歪泳,一派是希望我能盡快找到工作萝勤,不虛晃時光,一派是希望我能找到我喜歡的...
    平凡我的一生閱讀 185評論 0 0