Hadoop重新格式化HDFS的方法

一礁扮、記一次“不合格”的方法

這種方法也是網(wǎng)上參考博客得來的，一開始就覺得有問題，后來真的發(fā)現(xiàn)了問題材蛛。

首先停止已經(jīng)啟動的hadoop：

[hadoop@localhost ~]$ stop-all.sh

然后查看hadoop配置文件hdfs-site.xml,確定dfs.name.dir、dfs.data.dir以及Hadoop.tmp.dir所指定的目錄怎抛，并將其刪除卑吭。我的hadoop配置的目錄都在${HADOOP_HOME}/tmp目錄下，故將此目錄刪除就可以了：

[hadoop@localhost ~]$ rm -rf tmp

最后重新執(zhí)行hadoop格式化HDFS的命令：

[hadoop@localhost ~]$ hadoop namenode -format

格式化完成后马绝，啟動hadoop豆赏，并驗證是否格式化成功：

#啟動hadoop
[hadoop@localhost ~]$ start-all.sh 
#在hadoop文件系統(tǒng)中新建一個測試目錄
[hadoop@localhost ~]$ hdfs dfs -mkdir /test
#分別在master和slave節(jié)點上查看新建的test目錄，發(fā)現(xiàn)目錄都可以查看到
[hadoop@localhost ~]$ hdfs dfs -ls /
Found 1 items
drwxr-xr-x   - hadoop supergroup          0 2017-03-19 14:19 /test

顯然富稻，在HDFS文件系統(tǒng)中新建的test目錄在mater和slave節(jié)點中都可以查看的到掷邦，但是，這就說明重新格式化成功了嗎椭赋？

存在的問題
當(dāng)我在slave節(jié)點執(zhí)行jps時抚岗，發(fā)現(xiàn)datenode進(jìn)程不存在！

[hadoop@localhost ~]$ jps
22533 Jps
22369 NodeManager

二哪怔、問題產(chǎn)生的原因及修正方法

在網(wǎng)上查資料發(fā)現(xiàn)儿普，問題產(chǎn)生的原因是重新格式化HDFS時，只刪除了master節(jié)點上的指定目錄爷辙，但是沒有刪除slaves節(jié)點上的相應(yīng)目錄。
當(dāng)我們執(zhí)行文件系統(tǒng)格式化時挟鸠，會在namenode數(shù)據(jù)文件夾（即配置文件中dfs.name.dir在本地系統(tǒng)的路徑）中保存一個current/VERSION文件，記錄namespaceID篷扩，標(biāo)識了所格式化的 namenode的版本兄猩。如果我們頻繁的格式化namenode，那么datanode中保存（即配置文件中dfs.data.dir在本地系統(tǒng)的路徑）的current/VERSION文件只是你第一次格式化時保存的namenode的ID鉴未，因此就會造成datanode與namenode之間的id不一致枢冤。

我們來看master節(jié)的namespaceId：

[hadoop@localhost ~]$ cat tmp/dfs/name/current/VERSION 
#Sun Mar 19 14:13:51 CST 2017
namespaceID=901261394
clusterID=CID-5f83be8b-32e9-46ec-818c-404bd6dae38a
cTime=0
storageType=NAME_NODE
blockpoolID=BP-358141862-10.10.18.236-1489904031006
layoutVersion=-63

再來看slave節(jié)點的ID：

[hadoop@localhost ~]$ cat tmp/dfs/data/current/VERSION 
#Sun Mar 19 14:08:39 CST 2017
storageID=DS-91139d5d-43a0-4f9f-b523-8c4c8172f96c
clusterID=CID-9a1fa32b-018a-4466-af12-366444622470
cTime=0
datanodeUuid=b492e32e-a90e-4bab-84b0-ee4b4092b1d0
storageType=DATA_NODE
layoutVersion=-56

并沒有在slave節(jié)點中發(fā)現(xiàn)namespaceID,不過master和slave都有clusterID，我嘗試將slave節(jié)點中的clusterID改為和master的clusterID一致铜秆，然后重啟hadoop淹真，發(fā)現(xiàn)正常了：

[hadoop@localhost ~]$ hdfs dfs -ls /
Found 1 items
drwxr-xr-x   - hadoop supergroup          0 2017-03-19 14:19 /test

三、總結(jié)

總結(jié)：重新格式化集群HDFS的正確方法是將集群中相應(yīng)的目錄都刪除连茧，然后執(zhí)行格式化命令核蘸。
1、重新格式化意味著集群的數(shù)據(jù)會被全部刪除啸驯，格式化前需考慮數(shù)據(jù)備份或轉(zhuǎn)移問題客扎；
2、先刪除主節(jié)點（即namenode節(jié)點）罚斗，Hadoop的臨時存儲目錄tmp徙鱼、namenode存儲永久性元數(shù)據(jù)目錄dfs/name、Hadoop系統(tǒng)日志文件目錄log 中的內(nèi)容（注意是刪除目錄下的內(nèi)容不是目錄）针姿；
3袱吆、刪除所有數(shù)據(jù)節(jié)點(即datanode節(jié)點) ，Hadoop的臨時存儲目錄tmp距淫、namenode存儲永久性元數(shù)據(jù)目錄dfs/name绞绒、Hadoop系統(tǒng)日志文件目錄log 中的內(nèi)容；
4榕暇、格式化一個新的分布式文件系統(tǒng)：

hadoop namenode -format

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末蓬衡，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子彤枢，更是在濱河造成了極大的恐慌狰晚，老刑警劉巖，帶你破解...
沈念sama閱讀 216,496評論 6贊 501
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件堂污，死亡現(xiàn)場離奇詭異，居然都是意外死亡龄砰，警方通過查閱死者的電腦和手機盟猖，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,407評論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門讨衣，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人式镐，你說我怎么就攤上這事反镇。” “怎么了娘汞？”我有些...
開封第一講書人閱讀 162,632評論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵歹茶，是天一觀的道長。經(jīng)常有香客問我你弦，道長惊豺，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,180評論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任禽作，我火速辦了婚禮尸昧，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘旷偿。我一直安慰自己烹俗，他們只是感情好，可當(dāng)我...
茶點故事閱讀 67,198評論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布萍程。她就那樣靜靜地躺著幢妄，像睡著了一般。火紅的嫁衣襯著肌膚如雪茫负。梳的紋絲不亂的頭發(fā)上蕉鸳，一...
開封第一講書人閱讀 51,165評論 1贊 299
城市分裂傳說
那天，我揣著相機與錄音朽褪，去河邊找鬼置吓。笑死，一個胖子當(dāng)著我的面吹牛缔赠，可吹牛的內(nèi)容都是我干的衍锚。我是一名探鬼主播，決...
沈念sama閱讀 40,052評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼嗤堰，長吁一口氣：“原來是場噩夢啊……” “哼戴质！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起踢匣，我...
開封第一講書人閱讀 38,910評論 0贊 274
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤告匠，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后离唬，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體后专，經(jīng)...
沈念sama閱讀 45,324評論 1贊 310
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,542評論 2贊 332
?白月光啟示錄
正文我和宋清朗相戀三年输莺，在試婚紗的時候發(fā)現(xiàn)自己被綠了戚哎。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片裸诽。...
茶點故事閱讀 39,711評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖型凳，靈堂內(nèi)的尸體忽然破棺而出丈冬，到底是詐尸還是另有隱情，我是刑警寧澤甘畅，帶...
沈念sama閱讀 35,424評論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布埂蕊，位于F島的核電站，受9級特大地震影響疏唾，放射性物質(zhì)發(fā)生泄漏蓄氧。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 41,017評論 3贊 326
男人毒藥：我在死后第九天來索命
文/蒙蒙一荸实、第九天我趴在偏房一處隱蔽的房頂上張望匀们。院中可真熱鬧，春花似錦准给、人聲如沸泄朴。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,668評論 0贊 22
一樁弒父案露氮，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽祖灰。三九已至，卻和暖如春畔规，著一層夾襖步出監(jiān)牢的瞬間局扶，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 32,823評論 1贊 269
情欲美人皮
我被黑心中介騙來泰國打工叁扫，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留三妈，地道東北人。一個月前我還...
沈念sama閱讀 47,722評論 2贊 368
代替公主和親
正文我出身青樓莫绣，卻偏偏與公主長得像畴蒲，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子对室，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,611評論 2贊 353

Hadoop重新格式化HDFS的方法

一礁扮、記一次“不合格”的方法

二哪怔、問題產(chǎn)生的原因及修正方法

三、總結(jié)

推薦閱讀更多精彩內(nèi)容