Hadoop學(xué)習(xí)筆記(1)-HDFS

自行整理, 學(xué)習(xí)用途, 侵知刪歉

1.HDFS

  • 新加入的文件被分成block, 64M默認(rèn);
  • 默認(rèn)每一個block復(fù)制3份,分布在多臺node上
Paste_Image.png
  • HDFS can be deployed with or without high availability

2. HDFS without high availability, 3 deamons, [Mode A]:

  • NameNode(Master)
  • Secondary NameNode(Master)
  • DataNode (slave)
3 daemons

NameNode

  • NameNode 包含所有metadata

hdfs中文件位置信息
所屬關(guān)系(ownership)和權(quán)限(permission)
獨(dú)立block的名字
block的位置信息


Metadata

  • 存儲在硬盤上, 當(dāng)Namenode守護(hù)進(jìn)程啟動時讀取
  • 文件名: fsimage (block的位置信息沒有存在里面)

edits

  • 硬盤上,對metadata的更改被寫進(jìn)一份log文件,叫做edits

SlaveNode

  • 實際的文件內(nèi)容以block的形式存儲在slva node上
  • block文件名: blk_xxxxxxx
  • 每個slaveNode運(yùn)行一個NataNode daemon, 控制對block的訪問, 與NameNode通信

the Secondary NameNode(SN)

  • SN并不是NameNode的失效備援
  • SN將metadata的變化內(nèi)容寫到 edit log
  • SN周期性的將系統(tǒng)的metadata快照edit log合并成一份新的metadata快照, 并將新的metadata快照傳送回NameNode
  • SN的運(yùn)行環(huán)境經(jīng)需要和NameNode一樣的RAM

文件系統(tǒng)的metadata快照 和 Edit

  • fsimage包含了一個系統(tǒng)metadata的快照, 并不會在每次寫入操作時更新
  • 當(dāng)hdfs客戶端進(jìn)行一個寫操作, 它首先記錄在Primary Namenode的edits
  • 對所有edits進(jìn)行更新(Namenode重啟時)將會耗時很長, 所以這個事由the secondary namenode做

Checkingpointing the file system Metadata

  • SN周期性的檢查NameNode里的in-memory file去獲取fsimage和新產(chǎn)生edits
  • SN把fsimage放到內(nèi)存, 然后應(yīng)用edits中的更新內(nèi)容, 然后構(gòu)造新的fsimage文件,并將其送回primary NameNode
  • primary NameNode收到后, 更新 fsimage 和 新產(chǎn)生的edits
  • 默認(rèn)情況下checkpoint = min{ 每小時或者每1,000,000傳輸進(jìn)行一次 }

在這種模式下, 一個NameNode就是一個single point of failure, SN不是 ; 如果故障, HDFS會在故障的NameNode更換后恢復(fù)正常; risk比較低,恢復(fù)也比較簡單


3.HDFS with high Availability [Mode B]:

為了排除Single Point of Failure
2個NameNode:
standbyNameNode和ActiveNameNode, standbyActive掛掉后代替它.
activeNameNode把metadata寫到JournalNodes[Quorum機(jī)制]
standbyNameNode讀取JournalNode[Quorum機(jī)制]來和Active NameNode保持同步

2個NameNode

  • 一個HDFS目錄可以快照(snapshot),例如:


    Paste_Image.png
  • HDFS Cache

    • it is possible to cache HDFS files in off-heap memory on DataNodes
    • cache is in off-heap memory for DataNode user
  • HDFS HA 部署步驟

1.配置Hadoop的 configuration
2.安裝和啟動JournalNodes
3.如果沒有安裝, 則配置并啟動一個ZooKeeper ensemble
4.如果從一個con-HA的配置轉(zhuǎn)成HA, 初始化shared edits directory
5.安裝, 引導(dǎo), 啟動Standby NameNode
6.安裝, 規(guī)定(format),啟動ZooKeeper failover controllers
7.重啟DataNodes, Yarn, MapReduce守護(hù)進(jìn)程

  • Journal Node配置

在每一個要運(yùn)行JournalNode的host上
1.安裝
-?sudo yum install hadoop-hdfs-journalnode
2.在Journal Node 創(chuàng)建shared edits directory
-路徑 dfs.journalnode.edits.dir
3.啟動JournalNode
-sudo service hadoop-hdfs-journalnode start


4.HDFS寫文件(client寫到DataNode)

  1. client連接到NameNode
  2. NameNode設(shè)置好metadata的入口(entry), 并將block的名字和DataNode的列表發(fā)送給client
  3. client連接到第一個DataNode然后開始發(fā)送數(shù)據(jù); 第一個發(fā)送完了給第二DataNode發(fā)送, 然后去第三個
  4. 流水線的請求數(shù)據(jù)包返回發(fā)送給client
  5. block寫入完成,clientNameNode報告完成
關(guān)系圖
  • 如果這個流水線的DataNode失敗了:

    • 這個流水線就關(guān)閉了
    • 一個新的流水線啟動, 開啟2個好的節(jié)點(diǎn), 數(shù)據(jù)就繼續(xù)寫到這2個好的節(jié)點(diǎn)
    • NameNode會知曉這個block是有備份的, 然后這個數(shù)據(jù)會在另一個DataNode重新備份
  • 當(dāng)數(shù)據(jù)的block寫完后, client會計算每一個block的checkSum

    • checkSum和data一起發(fā)送到DataNode
    • checkSum和每一個數(shù)據(jù)block一起寫入
    • 保證了數(shù)據(jù)的一致性

Rack-aware

Hadoop了解rack awareness的概念:

  • 知曉node在哪里, 如何和另一個node關(guān)聯(lián)
  • 幫助ResourceManager給靠近datanode分配處理資源
  • 幫助NameNode找到最近的block給client去讀取
  • HDFS將data blocks復(fù)制在不同的節(jié)點(diǎn), 不同的機(jī)架, 更好的安全性

第一份拷貝: 在client的同一個節(jié)點(diǎn)
第二份拷貝: 靠近的另一個機(jī)架上的一個節(jié)點(diǎn)
第三份拷貝: 同一機(jī)架上的不同節(jié)點(diǎn)上


5. HDFS讀文件(client讀DataNode)

  1. client連接NameNode
  2. NameNode返回文件的第一部分block的名字路徑(距離最近的先返回)
  3. client連接到第一個DataNode開始讀取block
  4. 如果連接失敗, client會連接到list里的下一個節(jié)點(diǎn)去讀block
Paste_Image.png

數(shù)據(jù)污染

  • 當(dāng)client讀取一個block時, 它會校對checkSum, 實時的checkSum會和block創(chuàng)建時的checkSum對比
  • 如果不同, client會讀取下一個DataNode中的數(shù)據(jù), 然后告知NameNode這里出現(xiàn)一個數(shù)據(jù)污染版本, NameNode會在別處重新備份這個block
  • DataNode默認(rèn)每3周會檢查block的checkSums

數(shù)據(jù)可靠性和恢復(fù)

  • DataNode每3秒發(fā)送心跳給NameNode
  • 一段時間沒有收到心跳就可以認(rèn)為DataNode掛了
  • NameNode會知道哪些block受影響, 然后讓其他的節(jié)點(diǎn)復(fù)制這些block到一個新的節(jié)點(diǎn)
    *掛了的節(jié)點(diǎn)恢復(fù)后, NameNode會告知新備份的DataNode刪除多余的備份

數(shù)據(jù)從不會經(jīng)過NameNode, 不管是讀寫還是拷貝過程

`

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末抖剿,一起剝皮案震驚了整個濱河市宦棺,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌脐嫂,老刑警劉巖,帶你破解...
    沈念sama閱讀 212,454評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件艳吠,死亡現(xiàn)場離奇詭異队丝,居然都是意外死亡港准,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,553評論 3 385
  • 文/潘曉璐 我一進(jìn)店門抄瑟,熙熙樓的掌柜王于貴愁眉苦臉地迎上來凡泣,“玉大人,你說我怎么就攤上這事∥属铮” “怎么了往衷?”我有些...
    開封第一講書人閱讀 157,921評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長严卖。 經(jīng)常有香客問我席舍,道長,這世上最難降的妖魔是什么哮笆? 我笑而不...
    開封第一講書人閱讀 56,648評論 1 284
  • 正文 為了忘掉前任来颤,我火速辦了婚禮,結(jié)果婚禮上稠肘,老公的妹妹穿的比我還像新娘福铅。我一直安慰自己,他們只是感情好项阴,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,770評論 6 386
  • 文/花漫 我一把揭開白布滑黔。 她就那樣靜靜地躺著,像睡著了一般环揽。 火紅的嫁衣襯著肌膚如雪略荡。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,950評論 1 291
  • 那天歉胶,我揣著相機(jī)與錄音汛兜,去河邊找鬼。 笑死通今,一個胖子當(dāng)著我的面吹牛粥谬,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播辫塌,決...
    沈念sama閱讀 39,090評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼漏策,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了臼氨?” 一聲冷哼從身側(cè)響起掺喻,我...
    開封第一講書人閱讀 37,817評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎一也,沒想到半個月后巢寡,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,275評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡椰苟,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,592評論 2 327
  • 正文 我和宋清朗相戀三年抑月,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片舆蝴。...
    茶點(diǎn)故事閱讀 38,724評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡谦絮,死狀恐怖题诵,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情层皱,我是刑警寧澤性锭,帶...
    沈念sama閱讀 34,409評論 4 333
  • 正文 年R本政府宣布,位于F島的核電站叫胖,受9級特大地震影響草冈,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜瓮增,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,052評論 3 316
  • 文/蒙蒙 一怎棱、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧绷跑,春花似錦拳恋、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,815評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至垦藏,卻和暖如春梆暖,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背膝藕。 一陣腳步聲響...
    開封第一講書人閱讀 32,043評論 1 266
  • 我被黑心中介騙來泰國打工式廷, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留咐扭,地道東北人芭挽。 一個月前我還...
    沈念sama閱讀 46,503評論 2 361
  • 正文 我出身青樓,卻偏偏與公主長得像蝗肪,于是被迫代替她去往敵國和親袜爪。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,627評論 2 350

推薦閱讀更多精彩內(nèi)容