Hadoop重新格式化HDFS的方法

一礁扮、記一次“不合格”的方法


這種方法也是網(wǎng)上參考博客得來的,一開始就覺得有問題,后來真的發(fā)現(xiàn)了問題材蛛。

  • 首先停止已經(jīng)啟動的hadoop:
[hadoop@localhost ~]$ stop-all.sh 
  • 然后查看hadoop配置文件hdfs-site.xml,確定dfs.name.dir、dfs.data.dir以及Hadoop.tmp.dir所指定的目錄怎抛,并將其刪除卑吭。我的hadoop配置的目錄都在${HADOOP_HOME}/tmp目錄下,故將此目錄刪除就可以了:
[hadoop@localhost ~]$ rm -rf tmp
  • 最后重新執(zhí)行hadoop格式化HDFS的命令:
[hadoop@localhost ~]$ hadoop namenode -format
  • 格式化完成后马绝,啟動hadoop豆赏,并驗證是否格式化成功:
#啟動hadoop
[hadoop@localhost ~]$ start-all.sh 
#在hadoop文件系統(tǒng)中新建一個測試目錄
[hadoop@localhost ~]$ hdfs dfs -mkdir /test
#分別在master和slave節(jié)點上查看新建的test目錄,發(fā)現(xiàn)目錄都可以查看到
[hadoop@localhost ~]$ hdfs dfs -ls /
Found 1 items
drwxr-xr-x   - hadoop supergroup          0 2017-03-19 14:19 /test

顯然富稻,在HDFS文件系統(tǒng)中新建的test目錄在mater和slave節(jié)點中都可以查看的到掷邦,但是,這就說明重新格式化成功了嗎椭赋?

  • 存在的問題
    當(dāng)我在slave節(jié)點執(zhí)行jps時抚岗,發(fā)現(xiàn)datenode進(jìn)程不存在!
[hadoop@localhost ~]$ jps
22533 Jps
22369 NodeManager

二哪怔、問題產(chǎn)生的原因及修正方法


在網(wǎng)上查資料發(fā)現(xiàn)儿普,問題產(chǎn)生的原因是重新格式化HDFS時,只刪除了master節(jié)點上的指定目錄爷辙,但是沒有刪除slaves節(jié)點上的相應(yīng)目錄。
當(dāng)我們執(zhí)行文件系統(tǒng)格式化時挟鸠,會在namenode數(shù)據(jù)文件夾(即配置文件中dfs.name.dir在本地系統(tǒng)的路徑)中保存一個current/VERSION文件,記錄namespaceID篷扩,標(biāo)識了所格式化的 namenode的版本兄猩。如果我們頻繁的格式化namenode,那么datanode中保存(即配置文件中dfs.data.dir在本地系統(tǒng)的路徑)的current/VERSION文件只是你第一次格式化時保存的namenode的ID鉴未,因此就會造成datanode與namenode之間的id不一致枢冤。

  • 我們來看master節(jié)的namespaceId:
[hadoop@localhost ~]$ cat tmp/dfs/name/current/VERSION 
#Sun Mar 19 14:13:51 CST 2017
namespaceID=901261394
clusterID=CID-5f83be8b-32e9-46ec-818c-404bd6dae38a
cTime=0
storageType=NAME_NODE
blockpoolID=BP-358141862-10.10.18.236-1489904031006
layoutVersion=-63
  • 再來看slave節(jié)點的ID:
[hadoop@localhost ~]$ cat tmp/dfs/data/current/VERSION 
#Sun Mar 19 14:08:39 CST 2017
storageID=DS-91139d5d-43a0-4f9f-b523-8c4c8172f96c
clusterID=CID-9a1fa32b-018a-4466-af12-366444622470
cTime=0
datanodeUuid=b492e32e-a90e-4bab-84b0-ee4b4092b1d0
storageType=DATA_NODE
layoutVersion=-56

并沒有在slave節(jié)點中發(fā)現(xiàn)namespaceID,不過master和slave都有clusterID,我嘗試將slave節(jié)點中的clusterID改為和master的clusterID一致铜秆,然后重啟hadoop淹真,發(fā)現(xiàn)正常了:

[hadoop@localhost ~]$ hdfs dfs -ls /
Found 1 items
drwxr-xr-x   - hadoop supergroup          0 2017-03-19 14:19 /test

三、總結(jié)


  • 總結(jié):重新格式化集群HDFS的正確方法是將集群中相應(yīng)的目錄都刪除连茧,然后執(zhí)行格式化命令核蘸。
    1、重新格式化意味著集群的數(shù)據(jù)會被全部刪除啸驯,格式化前需考慮數(shù)據(jù)備份或轉(zhuǎn)移問題客扎;
    2、先刪除主節(jié)點(即namenode節(jié)點)罚斗,Hadoop的臨時存儲目錄tmp徙鱼、namenode存儲永久性元數(shù)據(jù)目錄dfs/name、Hadoop系統(tǒng)日志文件目錄log 中的內(nèi)容 (注意是刪除目錄下的內(nèi)容不是目錄)针姿;
    3袱吆、刪除所有數(shù)據(jù)節(jié)點(即datanode節(jié)點) ,Hadoop的臨時存儲目錄tmp距淫、namenode存儲永久性元數(shù)據(jù)目錄dfs/name绞绒、Hadoop系統(tǒng)日志文件目錄log 中的內(nèi)容;
    4榕暇、格式化一個新的分布式文件系統(tǒng):
hadoop namenode -format  
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末蓬衡,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子彤枢,更是在濱河造成了極大的恐慌狰晚,老刑警劉巖,帶你破解...
    沈念sama閱讀 216,496評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件堂污,死亡現(xiàn)場離奇詭異,居然都是意外死亡龄砰,警方通過查閱死者的電腦和手機盟猖,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,407評論 3 392
  • 文/潘曉璐 我一進(jìn)店門讨衣,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人式镐,你說我怎么就攤上這事反镇。” “怎么了娘汞?”我有些...
    開封第一講書人閱讀 162,632評論 0 353
  • 文/不壞的土叔 我叫張陵歹茶,是天一觀的道長。 經(jīng)常有香客問我你弦,道長惊豺,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,180評論 1 292
  • 正文 為了忘掉前任禽作,我火速辦了婚禮尸昧,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘旷偿。我一直安慰自己烹俗,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 67,198評論 6 388
  • 文/花漫 我一把揭開白布萍程。 她就那樣靜靜地躺著幢妄,像睡著了一般。 火紅的嫁衣襯著肌膚如雪茫负。 梳的紋絲不亂的頭發(fā)上蕉鸳,一...
    開封第一講書人閱讀 51,165評論 1 299
  • 那天,我揣著相機與錄音朽褪,去河邊找鬼置吓。 笑死,一個胖子當(dāng)著我的面吹牛缔赠,可吹牛的內(nèi)容都是我干的衍锚。 我是一名探鬼主播,決...
    沈念sama閱讀 40,052評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼嗤堰,長吁一口氣:“原來是場噩夢啊……” “哼戴质!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起踢匣,我...
    開封第一講書人閱讀 38,910評論 0 274
  • 序言:老撾萬榮一對情侶失蹤告匠,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后离唬,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體后专,經(jīng)...
    沈念sama閱讀 45,324評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,542評論 2 332
  • 正文 我和宋清朗相戀三年输莺,在試婚紗的時候發(fā)現(xiàn)自己被綠了戚哎。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片裸诽。...
    茶點故事閱讀 39,711評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖型凳,靈堂內(nèi)的尸體忽然破棺而出丈冬,到底是詐尸還是另有隱情,我是刑警寧澤甘畅,帶...
    沈念sama閱讀 35,424評論 5 343
  • 正文 年R本政府宣布埂蕊,位于F島的核電站,受9級特大地震影響疏唾,放射性物質(zhì)發(fā)生泄漏蓄氧。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,017評論 3 326
  • 文/蒙蒙 一荸实、第九天 我趴在偏房一處隱蔽的房頂上張望匀们。 院中可真熱鬧,春花似錦准给、人聲如沸泄朴。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,668評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽祖灰。三九已至,卻和暖如春畔规,著一層夾襖步出監(jiān)牢的瞬間局扶,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,823評論 1 269
  • 我被黑心中介騙來泰國打工叁扫, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留三妈,地道東北人。 一個月前我還...
    沈念sama閱讀 47,722評論 2 368
  • 正文 我出身青樓莫绣,卻偏偏與公主長得像畴蒲,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子对室,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,611評論 2 353

推薦閱讀更多精彩內(nèi)容

  • 終極算法 關(guān)注微信號每天收聽我們的消息終極算法為您推送精品閱讀 前言 Hadoop 在大數(shù)據(jù)技術(shù)體系中的地位至關(guān)...
    Yespon閱讀 129,860評論 12 168
  • HDFS是Hadoop Distribute File System 的簡稱模燥,也就是Hadoop的一個分布式文件系...
    大佛愛讀書閱讀 868評論 0 0
  • 之前的有點忘記了,這里在云筆記拿出來再玩玩.看不懂的可以留言 大家可以嘗試下Ambari來配置Hadoop的相關(guān)環(huán)...
    HT_Jonson閱讀 2,957評論 0 50
  • 想要將pdf文件變小,可以考慮使用pdf壓縮的方法掩宜,借助壓縮軟件強大的壓縮功能可以比較快捷的將pdf文件變小蔫骂,下面...
    南梔姑娘呀閱讀 935評論 0 0
  • 拖著疲憊的空殼爬上了床,因為我病復(fù)發(fā)了牺汤。 打開知乎偶然看到這樣一個問題『如何忘記一個深愛的人』辽旋。我習(xí)慣性的點了進(jìn)去...
    小飛象呢吶閱讀 185評論 0 0