添加DataNode
對于新添加的DataNode節(jié)點(diǎn),需要啟動(dòng)datanode進(jìn)程贤笆,從而將其添加入集群
- 在新增的節(jié)點(diǎn)上挤安,運(yùn)行sbin/hadoop-daemon.sh start datanode即可
- 然后在namenode通過hdfs dfsadmin -report查看集群情況
- 最后還需要對hdfs負(fù)載設(shè)置均衡挡篓,因?yàn)槟J(rèn)的數(shù)據(jù)傳輸帶寬比較低,可以設(shè)置為64M恬砂,即hdfs dfsadmin -setBalancerBandwidth 67108864即可
- 默認(rèn)balancer的threshold為10%咧纠,即各個(gè)節(jié)點(diǎn)與集群總的存儲(chǔ)使用率相差不超過10%,我們可將其設(shè)置為5%
- 然后啟動(dòng)Balancer泻骤,sbin/start-balancer.sh -threshold 5漆羔,等待集群自均衡完成即可
添加Nodemanager
由于Hadoop 2.X引入了YARN框架,所以對于每個(gè)計(jì)算節(jié)點(diǎn)都可以通過NodeManager進(jìn)行管理狱掂,同理啟動(dòng)NodeManager進(jìn)程后演痒,即可將其加入集群
- 在新增節(jié)點(diǎn),運(yùn)行sbin/yarn-daemon.sh start nodemanager即可
在ResourceManager趋惨,通過yarn node -list查看集群情況
錯(cuò)誤集
- Journal Storage Directory (/path/of/journal) not formatted
- Type 1:
當(dāng)你從異常信息中看到JournalNode not formatted鸟顺,如果在異常中看到Journal節(jié)點(diǎn)都提示需要格式化JournalNode。這個(gè)時(shí)候如果是新的集群器虾,可以重新格式化NameNode讯嫂,同時(shí)JournalNode的目錄也會(huì)被格式化 - Type 2:
如果只是其中幾個(gè)Journal結(jié)點(diǎn)出現(xiàn)此異常,可以檢查Journal結(jié)點(diǎn)相應(yīng)的目錄是否有權(quán)限兆沙。
并且欧芽,從正常的Journal Node拷貝內(nèi)容到異常的Journal結(jié)點(diǎn) - Type 3:
如果是從普通的HDFS更新到HA HDFS,可以使用:
hdfs namenode -initializeSharedEdits
也就是你可以不用格式化NameNode就可以格式化你的JournalNode目錄
- Type 1: