Hadoop--DataNode工作機(jī)制

DataNode工作機(jī)制

Hadoop--datanode工作機(jī)制.png

1）一個數(shù)據(jù)塊在datanode上以文件形式存儲在磁盤上，包括兩個文件，一個是數(shù)據(jù)本身框弛，一個是元數(shù)據(jù)包括數(shù)據(jù)塊的長度，塊數(shù)據(jù)的校驗和敷硅，以及時間戳功咒。
2）DataNode啟動后向namenode注冊，通過后绞蹦，周期性（1小時）的向namenode上報所有的塊信息力奋。
3）心跳是每3秒一次，心跳返回結(jié)果帶有namenode給該datanode的命令如復(fù)制塊數(shù)據(jù)到另一臺機(jī)器幽七，或刪除某個數(shù)據(jù)塊景殷。如果超過10分鐘沒有收到某個datanode的心跳，則認(rèn)為該節(jié)點不可用澡屡。
4）集群運(yùn)行中可以安全加入和退出一些機(jī)器

數(shù)據(jù)完整性

1）當(dāng)DataNode讀取block的時候猿挚，它會計算checksum
2）如果計算后的checksum，與block創(chuàng)建時值不一樣驶鹉，說明block已經(jīng)損壞绩蜻。
3）client讀取其他DataNode上的block。
4）datanode在其文件創(chuàng)建后周期驗證checksum

掉線時限參數(shù)設(shè)置

datanode進(jìn)程死亡或者網(wǎng)絡(luò)故障造成datanode無法與namenode通信室埋，namenode不會立即把該節(jié)點判定為死亡办绝，要經(jīng)過一段時間，這段時間暫稱作超時時長姚淆。HDFS默認(rèn)的超時時長為10分鐘+30秒孕蝉。如果定義超時時間為timeout，則超時時長的計算公式為：
timeout = 2 * dfs.namenode.heartbeat.recheck-interval + 10 * dfs.heartbeat.interval腌逢。
而默認(rèn)的dfs.namenode.heartbeat.recheck-interval 大小為5分鐘,dfs.heartbeat.interval默認(rèn)為3秒降淮。
需要注意的是hdfs-site.xml 配置文件中的heartbeat.recheck.interval的單位為毫秒，dfs.heartbeat.interval的單位為秒搏讶。

<property>
    <name>dfs.namenode.heartbeat.recheck-interval</name>
    <value>300000</value>
</property>
<property>
    <name> dfs.heartbeat.interval </name>
    <value>3</value>
</property>

haoop新節(jié)點服役

0）需求：

隨著公司業(yè)務(wù)的增長佳鳖，數(shù)據(jù)量越來越大，原有的數(shù)據(jù)節(jié)點的容量已經(jīng)不能滿足存儲數(shù)據(jù)的需求媒惕，需要在原有集群基礎(chǔ)上動態(tài)添加新的數(shù)據(jù)節(jié)點系吩。

1）環(huán)境準(zhǔn)備

? （1）克隆一臺虛擬機(jī)

? （2）修改ip地址和主機(jī)名稱

? （3）修改xcall和xsync文件，增加新`增節(jié)點的同步ssh

? （4）刪除原來HDFS文件系統(tǒng)留存的文件（因為新添加的節(jié)點是克隆的服務(wù)器吓笙，所以需要預(yù)先刪除對應(yīng)文件夾的數(shù)據(jù)）
? /opt/module/hadoop-2.7.2/data

2）服役新節(jié)點具體步驟

? （1）在namenode的/opt/module/hadoop-2.7.2/etc/hadoop目錄下創(chuàng)建dfs.hosts文件

[liyahui@hadoop105 hadoop]$ pwd
/opt/module/hadoop-2.7.2/etc/hadoop
[liyahui@hadoop105 hadoop]$ touch dfs.hosts
[liyahui@hadoop105 hadoop]$ vi dfs.hosts

添加如下主機(jī)名稱（包含新服役的節(jié)點）

hadoop102
hadoop103
hadoop104
hadoop105 #新服役的節(jié)點

? （2）在namenode的hdfs-site.xml配置文件中增加dfs.hosts屬性

   <property>  
   <name>dfs.hosts</name>       
   <value>/opt/module/hadoop-2.7.2/etc/hadoop/dfs.hosts</value>   </property>

? （3）刷新namenode

[liyahui@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -refreshNodes
Refresh nodes successful

? （4）更新resourcemanager節(jié)點

[liyahui@hadoop102 hadoop-2.7.2]$ yarn rmadmin -refreshNodes

17/06/24 14:17:11 INFO client.RMProxy: Connecting to ResourceManager at hadoop103/192.168.1.103:8033

? （5）在namenode的slaves文件中增加新主機(jī)名稱
(一定是在namenode對應(yīng)的節(jié)點修改slaves文件)
? 增加105 不需要分發(fā)

hadoop102
hadoop103
hadoop104
hadoop105

? （6）單獨(dú)命令啟動新的數(shù)據(jù)節(jié)點和節(jié)點管理器

[liyahui@hadoop105 hadoop-2.7.2]$ sbin/hadoop-daemon.sh start datanode
starting datanode, logging to /opt/module/hadoop-2.7.2/logs/hadoop-liyahui-datanode-hadoop105.out
[liyahui@hadoop105 hadoop-2.7.2]$ sbin/yarn-daemon.sh start nodemanager
starting nodemanager, logging to /opt/module/hadoop-2.7.2/logs/yarn-liyahui-nodemanager-hadoop105.out

? （7）在web瀏覽器上檢查是否ok

3）如果數(shù)據(jù)不均衡，可以用命令實現(xiàn)集群的再平衡

       [liyahui@hadoop102 sbin]$ ./start-balancer.sh
starting balancer, logging to /opt/module/hadoop-2.7.2/logs/hadoop-liyahui-balancer-hadoop102.out
Time Stamp               Iteration#  Bytes Already Moved  Bytes Left To Move  Bytes Being Moved

hadoop節(jié)點退役

1）在namenode的/opt/module/hadoop-2.7.2/etc/hadoop目錄下創(chuàng)建dfs.hosts.exclude文件

[liyahui@hadoop102 hadoop]$ pwd
/opt/module/hadoop-2.7.2/etc/hadoop
[liyahui@hadoop102 hadoop]$ touch dfs.hosts.exclude
[liyahui@hadoop102 hadoop]$ vi dfs.hosts.exclude

添加如下主機(jī)名稱（要退役的節(jié)點）

hadoop105

2）在namenode的hdfs-site.xml配置文件中增加dfs.hosts.exclude屬性

   <property>  
   <name>dfs.hosts.exclude</name>        
   <value>/opt/module/hadoop-2.7.2/etc/hadoop/dfs.hosts.exclude</value>   </property>

3）刷新namenode巾腕、刷新resourcemanager

[liyahui@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -refreshNodes
Refresh nodes successful
[liyahui@hadoop102 hadoop-2.7.2]$ yarn rmadmin -refreshNodes
17/06/24 14:55:56 INFO client.RMProxy: Connecting to ResourceManager at hadoop103/192.168.1.103:8033

4）檢查web瀏覽器面睛，退役節(jié)點的狀態(tài)為decommission in progress（退役中）絮蒿，說明數(shù)據(jù)節(jié)點正在復(fù)制塊到其他節(jié)點。

1111.png

5）等待退役節(jié)點狀態(tài)為decommissioned（所有塊已經(jīng)復(fù)制完成）叁鉴，停止該節(jié)點及節(jié)點資源管理器土涝。注意：如果副本數(shù)是3，服役的節(jié)點小于等于3幌墓，是不能退役成功的但壮，需要修改副本數(shù)后才能退役。

22222.png

[liyahui@hadoop105 hadoop-2.7.2]$ sbin/hadoop-daemon.sh stop datanode
stopping datanode
[liyahui@hadoop105 hadoop-2.7.2]$ sbin/yarn-daemon.sh stop nodemanager
stopping nodemanager

6）從include文件中刪除退役節(jié)點常侣，再運(yùn)行刷新節(jié)點的命令
? （1）從namenode的dfs.hosts文件中刪除退役節(jié)點hadoop105

hadoop102
hadoop103
hadoop104

? （2）刷新namenode蜡饵，刷新resourcemanager

[liyahui@hadoop102 hadoop-2.7.2]$ hdfs dfsadmin -refreshNodes
Refresh nodes successful
[liyahui@hadoop102 hadoop-2.7.2]$ yarn rmadmin -refreshNodes
17/06/24 14:55:56 INFO client.RMProxy: Connecting to ResourceManager at hadoop103/192.168.1.103:8033

7）從namenode的slave文件中刪除退役節(jié)點hadoop105

hadoop102
hadoop103
hadoop104

8）如果數(shù)據(jù)不均衡，可以用命令實現(xiàn)集群的再平衡

[liyahui@hadoop102 hadoop-2.7.2]$ sbin/start-balancer.sh 
starting balancer, logging to /opt/module/hadoop-2.7.2/logs/hadoop-liyahui-balancer-hadoop102.out
Time Stamp               Iteration#  Bytes Already Moved  Bytes Left To Move  Bytes Being Moved

Attention Please--文章來自互聯(lián)網(wǎng)資料整理胳施，如有雷同溯祸，純屬李小李抄襲，如有侵權(quán)請聯(lián)系刪除 From 李小李

最后編輯于：2019.03.28 14:18:05

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末舞肆，一起剝皮案震驚了整個濱河市焦辅，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌椿胯，老刑警劉巖筷登，帶你破解...
沈念sama閱讀 222,104評論 6贊 515
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異哩盲，居然都是意外死亡前方，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 94,816評論 3贊 399
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門种冬，熙熙樓的掌柜王于貴愁眉苦臉地迎上來镣丑，“玉大人，你說我怎么就攤上這事娱两≥航常” “怎么了？”我有些...
開封第一講書人閱讀 168,697評論 0贊 360
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵十兢，是天一觀的道長趣竣。經(jīng)常有香客問我，道長旱物，這世上最難降的妖魔是什么遥缕？我笑而不...
開封第一講書人閱讀 59,836評論 1贊 298
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮宵呛，結(jié)果婚禮上单匣，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好户秤，可當(dāng)我...
茶點故事閱讀 68,851評論 6贊 397
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布码秉。她就那樣靜靜地躺著，像睡著了一般鸡号。火紅的嫁衣襯著肌膚如雪转砖。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 52,441評論 1贊 310
城市分裂傳說
那天鲸伴，我揣著相機(jī)與錄音府蔗，去河邊找鬼。笑死汞窗，一個胖子當(dāng)著我的面吹牛姓赤，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播杉辙，決...
沈念sama閱讀 40,992評論 3贊 421
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼模捂，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了蜘矢？” 一聲冷哼從身側(cè)響起狂男，我...
開封第一講書人閱讀 39,899評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎品腹，沒想到半個月后岖食，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 46,457評論 1贊 318
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡舞吭，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 38,529評論 3贊 341
?白月光啟示錄
正文我和宋清朗相戀三年泡垃，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片羡鸥。...
茶點故事閱讀 40,664評論 1贊 352
活死人
序言：一個原本活蹦亂跳的男人離奇死亡蔑穴，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出惧浴，到底是詐尸還是另有隱情存和，我是刑警寧澤，帶...
沈念sama閱讀 36,346評論 5贊 350
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布衷旅，位于F島的核電站捐腿，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏柿顶。R本人自食惡果不足惜茄袖，卻給世界環(huán)境...
茶點故事閱讀 42,025評論 3贊 334
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望嘁锯。院中可真熱鬧宪祥，春花似錦聂薪、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 32,511評論 0贊 24
一樁弒父案胆建，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至肘交，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間扑馁，已是汗流浹背涯呻。一陣腳步聲響...
開封第一講書人閱讀 33,611評論 1贊 272
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留腻要，地道東北人复罐。一個月前我還...
沈念sama閱讀 49,081評論 3贊 377
代替公主和親
正文我出身青樓，卻偏偏與公主長得像雄家，于是被迫代替她去往敵國和親效诅。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 45,675評論 2贊 359