Hadoop--DataNode工作機(jī)制

DataNode工作機(jī)制

Hadoop--datanode工作機(jī)制.png

1)一個數(shù)據(jù)塊在datanode上以文件形式存儲在磁盤上,包括兩個文件,一個是數(shù)據(jù)本身框弛,一個是元數(shù)據(jù)包括數(shù)據(jù)塊的長度,塊數(shù)據(jù)的校驗和敷硅,以及時間戳功咒。
2)DataNode啟動后向namenode注冊,通過后绞蹦,周期性(1小時)的向namenode上報所有的塊信息力奋。
3)心跳是每3秒一次,心跳返回結(jié)果帶有namenode給該datanode的命令如復(fù)制塊數(shù)據(jù)到另一臺機(jī)器幽七,或刪除某個數(shù)據(jù)塊景殷。如果超過10分鐘沒有收到某個datanode的心跳,則認(rèn)為該節(jié)點不可用澡屡。
4)集群運(yùn)行中可以安全加入和退出一些機(jī)器

數(shù)據(jù)完整性

1)當(dāng)DataNode讀取block的時候猿挚,它會計算checksum
2)如果計算后的checksum,與block創(chuàng)建時值不一樣驶鹉,說明block已經(jīng)損壞绩蜻。
3)client讀取其他DataNode上的block。
4)datanode在其文件創(chuàng)建后周期驗證checksum

掉線時限參數(shù)設(shè)置

datanode進(jìn)程死亡或者網(wǎng)絡(luò)故障造成datanode無法與namenode通信室埋,namenode不會立即把該節(jié)點判定為死亡办绝,要經(jīng)過一段時間,這段時間暫稱作超時時長姚淆。HDFS默認(rèn)的超時時長為10分鐘+30秒孕蝉。如果定義超時時間為timeout,則超時時長的計算公式為:
timeout = 2 * dfs.namenode.heartbeat.recheck-interval + 10 * dfs.heartbeat.interval腌逢。
而默認(rèn)的dfs.namenode.heartbeat.recheck-interval 大小為5分鐘,dfs.heartbeat.interval默認(rèn)為3秒降淮。
需要注意的是hdfs-site.xml 配置文件中的heartbeat.recheck.interval的單位為毫秒,dfs.heartbeat.interval的單位為秒搏讶。

<property>
    <name>dfs.namenode.heartbeat.recheck-interval</name>
    <value>300000</value>
</property>
<property>
    <name> dfs.heartbeat.interval </name>
    <value>3</value>
</property>

haoop新節(jié)點服役

0)需求:

隨著公司業(yè)務(wù)的增長佳鳖,數(shù)據(jù)量越來越大,原有的數(shù)據(jù)節(jié)點的容量已經(jīng)不能滿足存儲數(shù)據(jù)的需求媒惕,需要在原有集群基礎(chǔ)上動態(tài)添加新的數(shù)據(jù)節(jié)點系吩。

1)環(huán)境準(zhǔn)備

? (1)克隆一臺虛擬機(jī)

? (2)修改ip地址和主機(jī)名稱

? (3)修改xcall和xsync文件,增加新`增節(jié)點的同步ssh

? (4)刪除原來HDFS文件系統(tǒng)留存的文件(因為新添加的節(jié)點是克隆的服務(wù)器吓笙,所以需要預(yù)先刪除對應(yīng)文件夾的數(shù)據(jù))
? /opt/module/hadoop-2.7.2/data

2)服役新節(jié)點具體步驟

? (1)在namenode的/opt/module/hadoop-2.7.2/etc/hadoop目錄下創(chuàng)建dfs.hosts文件

[liyahui@hadoop105 hadoop]$ pwd
/opt/module/hadoop-2.7.2/etc/hadoop
[liyahui@hadoop105 hadoop]$ touch dfs.hosts
[liyahui@hadoop105 hadoop]$ vi dfs.hosts

添加如下主機(jī)名稱(包含新服役的節(jié)點)

hadoop102
hadoop103
hadoop104
hadoop105 #新服役的節(jié)點

? (2)在namenode的hdfs-site.xml配置文件中增加dfs.hosts屬性

   <property>  
   <name>dfs.hosts</name>       
   <value>/opt/module/hadoop-2.7.2/etc/hadoop/dfs.hosts</value>   </property>   

? (3)刷新namenode

[liyahui@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -refreshNodes
Refresh nodes successful

? (4)更新resourcemanager節(jié)點

[liyahui@hadoop102 hadoop-2.7.2]$ yarn rmadmin -refreshNodes

17/06/24 14:17:11 INFO client.RMProxy: Connecting to ResourceManager at hadoop103/192.168.1.103:8033

? (5)在namenode的slaves文件中增加新主機(jī)名稱
(一定是在namenode對應(yīng)的節(jié)點修改slaves文件)
? 增加105 不需要分發(fā)

hadoop102
hadoop103
hadoop104
hadoop105

? (6)單獨(dú)命令啟動新的數(shù)據(jù)節(jié)點和節(jié)點管理器

[liyahui@hadoop105 hadoop-2.7.2]$ sbin/hadoop-daemon.sh start datanode
starting datanode, logging to /opt/module/hadoop-2.7.2/logs/hadoop-liyahui-datanode-hadoop105.out
[liyahui@hadoop105 hadoop-2.7.2]$ sbin/yarn-daemon.sh start nodemanager
starting nodemanager, logging to /opt/module/hadoop-2.7.2/logs/yarn-liyahui-nodemanager-hadoop105.out

? (7)在web瀏覽器上檢查是否ok

3)如果數(shù)據(jù)不均衡,可以用命令實現(xiàn)集群的再平衡

       [liyahui@hadoop102 sbin]$ ./start-balancer.sh
starting balancer, logging to /opt/module/hadoop-2.7.2/logs/hadoop-liyahui-balancer-hadoop102.out
Time Stamp               Iteration#  Bytes Already Moved  Bytes Left To Move  Bytes Being Moved

hadoop節(jié)點退役

1)在namenode的/opt/module/hadoop-2.7.2/etc/hadoop目錄下創(chuàng)建dfs.hosts.exclude文件

[liyahui@hadoop102 hadoop]$ pwd
/opt/module/hadoop-2.7.2/etc/hadoop
[liyahui@hadoop102 hadoop]$ touch dfs.hosts.exclude
[liyahui@hadoop102 hadoop]$ vi dfs.hosts.exclude

添加如下主機(jī)名稱(要退役的節(jié)點)

hadoop105

2)在namenode的hdfs-site.xml配置文件中增加dfs.hosts.exclude屬性

   <property>  
   <name>dfs.hosts.exclude</name>        
   <value>/opt/module/hadoop-2.7.2/etc/hadoop/dfs.hosts.exclude</value>   </property>   

3)刷新namenode巾腕、刷新resourcemanager

[liyahui@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -refreshNodes
Refresh nodes successful
[liyahui@hadoop102 hadoop-2.7.2]$ yarn rmadmin -refreshNodes
17/06/24 14:55:56 INFO client.RMProxy: Connecting to ResourceManager at hadoop103/192.168.1.103:8033

4)檢查web瀏覽器面睛,退役節(jié)點的狀態(tài)為decommission in progress(退役中)絮蒿,說明數(shù)據(jù)節(jié)點正在復(fù)制塊到其他節(jié)點。


1111.png

5)等待退役節(jié)點狀態(tài)為decommissioned(所有塊已經(jīng)復(fù)制完成)叁鉴,停止該節(jié)點及節(jié)點資源管理器土涝。注意:如果副本數(shù)是3,服役的節(jié)點小于等于3幌墓,是不能退役成功的但壮,需要修改副本數(shù)后才能退役。


22222.png
[liyahui@hadoop105 hadoop-2.7.2]$ sbin/hadoop-daemon.sh stop datanode
stopping datanode
[liyahui@hadoop105 hadoop-2.7.2]$ sbin/yarn-daemon.sh stop nodemanager
stopping nodemanager

6)從include文件中刪除退役節(jié)點常侣,再運(yùn)行刷新節(jié)點的命令
? (1)從namenode的dfs.hosts文件中刪除退役節(jié)點hadoop105

hadoop102
hadoop103
hadoop104

? (2)刷新namenode蜡饵,刷新resourcemanager

[liyahui@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -refreshNodes
Refresh nodes successful
[liyahui@hadoop102 hadoop-2.7.2]$ yarn rmadmin -refreshNodes
17/06/24 14:55:56 INFO client.RMProxy: Connecting to ResourceManager at hadoop103/192.168.1.103:8033

7)從namenode的slave文件中刪除退役節(jié)點hadoop105

hadoop102
hadoop103
hadoop104

8)如果數(shù)據(jù)不均衡,可以用命令實現(xiàn)集群的再平衡

[liyahui@hadoop102 hadoop-2.7.2]$ sbin/start-balancer.sh 
starting balancer, logging to /opt/module/hadoop-2.7.2/logs/hadoop-liyahui-balancer-hadoop102.out
Time Stamp               Iteration#  Bytes Already Moved  Bytes Left To Move  Bytes Being Moved

Attention Please--文章來自互聯(lián)網(wǎng)資料整理胳施,如有雷同溯祸,純屬李小李抄襲,如有侵權(quán)請聯(lián)系刪除 From 李小李

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末舞肆,一起剝皮案震驚了整個濱河市焦辅,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌椿胯,老刑警劉巖筷登,帶你破解...
    沈念sama閱讀 222,104評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異哩盲,居然都是意外死亡前方,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,816評論 3 399
  • 文/潘曉璐 我一進(jìn)店門种冬,熙熙樓的掌柜王于貴愁眉苦臉地迎上來镣丑,“玉大人,你說我怎么就攤上這事娱两≥航常” “怎么了?”我有些...
    開封第一講書人閱讀 168,697評論 0 360
  • 文/不壞的土叔 我叫張陵十兢,是天一觀的道長趣竣。 經(jīng)常有香客問我,道長旱物,這世上最難降的妖魔是什么遥缕? 我笑而不...
    開封第一講書人閱讀 59,836評論 1 298
  • 正文 為了忘掉前任,我火速辦了婚禮宵呛,結(jié)果婚禮上单匣,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好户秤,可當(dāng)我...
    茶點故事閱讀 68,851評論 6 397
  • 文/花漫 我一把揭開白布码秉。 她就那樣靜靜地躺著,像睡著了一般鸡号。 火紅的嫁衣襯著肌膚如雪转砖。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,441評論 1 310
  • 那天鲸伴,我揣著相機(jī)與錄音府蔗,去河邊找鬼。 笑死汞窗,一個胖子當(dāng)著我的面吹牛姓赤,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播杉辙,決...
    沈念sama閱讀 40,992評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼模捂,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了蜘矢?” 一聲冷哼從身側(cè)響起狂男,我...
    開封第一講書人閱讀 39,899評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎品腹,沒想到半個月后岖食,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,457評論 1 318
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡舞吭,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,529評論 3 341
  • 正文 我和宋清朗相戀三年泡垃,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片羡鸥。...
    茶點故事閱讀 40,664評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡蔑穴,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出惧浴,到底是詐尸還是另有隱情存和,我是刑警寧澤,帶...
    沈念sama閱讀 36,346評論 5 350
  • 正文 年R本政府宣布衷旅,位于F島的核電站捐腿,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏柿顶。R本人自食惡果不足惜茄袖,卻給世界環(huán)境...
    茶點故事閱讀 42,025評論 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望嘁锯。 院中可真熱鬧宪祥,春花似錦聂薪、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,511評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至肘交,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間扑馁,已是汗流浹背涯呻。 一陣腳步聲響...
    開封第一講書人閱讀 33,611評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留腻要,地道東北人复罐。 一個月前我還...
    沈念sama閱讀 49,081評論 3 377
  • 正文 我出身青樓,卻偏偏與公主長得像雄家,于是被迫代替她去往敵國和親效诅。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,675評論 2 359

推薦閱讀更多精彩內(nèi)容

  • 首先趟济,我們在使用前先看看HDFS是什麼乱投?這將有助于我們是以后的運(yùn)維使用和故障排除思路的獲得。 HDFS采用mast...
    W_Bousquet閱讀 4,204評論 0 2
  • 二 顷编、 HDFS體系結(jié)構(gòu) HDFS 采用的是master/slave架構(gòu)設(shè)計 , 一個HDFS集群包含一個單獨(dú)的 ...
    什么都不會的碼農(nóng)丶閱讀 1,548評論 0 1
  • HDFS入門 hadoop架構(gòu) Hadoop 1.0中的資源管理方案 Hadoop 1.0指的是版本為Apache...
    依天立業(yè)閱讀 1,061評論 0 1
  • HDFS文件系統(tǒng) HDFS是一個分布式文件系統(tǒng)戚炫,采用分而治之的設(shè)計思想,將大文件媳纬、大批量文件双肤,分布式存放在大量服務(wù)...
    spilledyear閱讀 1,390評論 0 0
  • 品牌關(guān)注型、價格敏感型钮惠、特性精明型茅糜、建議領(lǐng)導(dǎo)型。以上四種是我們最常見的客戶模型素挽。相信大家多多少少都會有一些這樣的感...
    章逸寒閱讀 638評論 0 1