HDFS(分布式文件系統(tǒng))

Block(數(shù)據(jù)塊):

  1. HDFS上面基本默認的基本存儲單位耕魄,大小一般為128M
  2. 一個大的文件會被拆分成一個個的數(shù)據(jù)塊零酪,然后存儲在不同的機器奋刽。若小于block的大小,則實際占用的空間為其文件的大小
  3. 基本的讀寫單位茫藏,每次讀的都是一個塊碴裙,每個塊都會被復制到多臺機器

HDFS采用的是master/slave 架構稠炬。一個HDFS集群是由一個NameNode和多個DataNode構成沮趣。

NameNode(元數(shù)據(jù)節(jié)點)和DataNode(數(shù)據(jù)節(jié)點):
NameNode是集群的中心服務器屯烦,負責管理集群,以及存儲元數(shù)據(jù),DataNode就是真正存儲數(shù)據(jù)的節(jié)點驻龟。
NameNode作為集群的中心服務器温眉,主要存儲兩個東西:

  1. 所有數(shù)據(jù)的命名空間(Namespace Image),包括文件名翁狐,副本數(shù)类溢,文件路徑等
  2. 用戶對數(shù)據(jù)的操作日志(edit log)
    DataNode會以數(shù)據(jù)塊的形式存儲數(shù)據(jù)。負責處理Client的讀寫數(shù)據(jù)的請求露懒,并周期性發(fā)送心跳信號和塊狀態(tài)報告到NameNode闯冷。DataNode之間也會進行通信,復制數(shù)據(jù)塊懈词,保證數(shù)據(jù)的冗余性
4190914-482bdf7b058b8c1c.png

NameNode的單點問題:
Namenode是整個分布式文件系統(tǒng)的一個單點故障窃躲,一旦故障,整個分布式文件系統(tǒng)就無法使用了钦睡,因為無法從blocks中重構出相應的文件了。所以確保Namenode能從失敗中及時恢復是很重要的一件事躁倒。

一般應對的方法有兩種:

  1. 備份NameNode中保存的永久信息
    保存多份數(shù)據(jù)荞怒,最常用的做法是把永久信息保存到本地文件系統(tǒng)和某個遠程NFS上去。這些多寫操作是同步和原子性的秧秉,因為NameNode上都是源數(shù)據(jù)褐桌,寫少讀多,每次保存的量比較小象迎,消耗一些寫的性能荧嵌,來保證集群的健壯,還是值得的砾淌。
  2. 運行一個Secondary NameNode
    它最主要的工作就是把namespace image檢查點文件與edit log相融合(以防止edit log過大)并把融合后的namespace image保存在自己的本地文件系統(tǒng)上啦撮,同時發(fā)送這個新的備份給namenode。
    由于secondary namenode上保存的狀態(tài)信息總是要滯后于namenode上的狀態(tài)信息的緣故(未融合的edit log記錄了這一部分改變)汪厨,如果namenode完全失敗赃春,數(shù)據(jù)肯定要丟失一部分。
    最保險最常用的方式劫乱,是把上述兩種方法結合起來织中,也即當namenode故障時,把遠端NFS上的namespace image拷貝到secondary namenode上衷戈,然后把secondary namenode當做namenode來運行狭吼。

DataNode的數(shù)據(jù)存儲和讀取:

  1. 寫入數(shù)據(jù):


    4190914-3c29b45ea3f3c31a.png
  2. 讀取數(shù)據(jù):


    4190914-5e7e9202d5819b72.png
最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末殖妇,一起剝皮案震驚了整個濱河市刁笙,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖采盒,帶你破解...
    沈念sama閱讀 219,039評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件旧乞,死亡現(xiàn)場離奇詭異,居然都是意外死亡磅氨,警方通過查閱死者的電腦和手機尺栖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,426評論 3 395
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來烦租,“玉大人延赌,你說我怎么就攤上這事〔娉鳎” “怎么了挫以?”我有些...
    開封第一講書人閱讀 165,417評論 0 356
  • 文/不壞的土叔 我叫張陵,是天一觀的道長窃祝。 經(jīng)常有香客問我掐松,道長,這世上最難降的妖魔是什么粪小? 我笑而不...
    開封第一講書人閱讀 58,868評論 1 295
  • 正文 為了忘掉前任大磺,我火速辦了婚禮,結果婚禮上探膊,老公的妹妹穿的比我還像新娘杠愧。我一直安慰自己,他們只是感情好逞壁,可當我...
    茶點故事閱讀 67,892評論 6 392
  • 文/花漫 我一把揭開白布流济。 她就那樣靜靜地躺著,像睡著了一般腌闯。 火紅的嫁衣襯著肌膚如雪绳瘟。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,692評論 1 305
  • 那天姿骏,我揣著相機與錄音稽荧,去河邊找鬼。 笑死工腋,一個胖子當著我的面吹牛姨丈,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播擅腰,決...
    沈念sama閱讀 40,416評論 3 419
  • 文/蒼蘭香墨 我猛地睜開眼蟋恬,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了趁冈?” 一聲冷哼從身側(cè)響起歼争,我...
    開封第一講書人閱讀 39,326評論 0 276
  • 序言:老撾萬榮一對情侶失蹤拜马,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后沐绒,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體俩莽,經(jīng)...
    沈念sama閱讀 45,782評論 1 316
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,957評論 3 337
  • 正文 我和宋清朗相戀三年乔遮,在試婚紗的時候發(fā)現(xiàn)自己被綠了扮超。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,102評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡蹋肮,死狀恐怖出刷,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情坯辩,我是刑警寧澤馁龟,帶...
    沈念sama閱讀 35,790評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站漆魔,受9級特大地震影響坷檩,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜改抡,卻給世界環(huán)境...
    茶點故事閱讀 41,442評論 3 331
  • 文/蒙蒙 一矢炼、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧雀摘,春花似錦、人聲如沸八拱。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,996評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽肌稻。三九已至清蚀,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間爹谭,已是汗流浹背枷邪。 一陣腳步聲響...
    開封第一講書人閱讀 33,113評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留诺凡,地道東北人东揣。 一個月前我還...
    沈念sama閱讀 48,332評論 3 373
  • 正文 我出身青樓,卻偏偏與公主長得像腹泌,于是被迫代替她去往敵國和親嘶卧。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,044評論 2 355

推薦閱讀更多精彩內(nèi)容