hadoop 操作HDFS 命令

hadoop HDFS常用文件操作命令

命令基本格式:

hadoop fs -cmd < args >

1.ls

hadoop fs -ls /

列出hdfs文件系統(tǒng)根目錄下的目錄和文件

hadoop fs -ls -R /

列出hdfs文件系統(tǒng)所有的目錄和文件

2.put

hadoop fs -put < local file > < hdfs file >

hdfs file的父目錄一定要存在蜕提，否則命令不會執(zhí)行

hadoop fs -put < local file or dir >...< hdfs dir >

hdfs dir 一定要存在巍佑，否則命令不會執(zhí)行

hadoop fs -put - < hdsf file>

從鍵盤讀取輸入到hdfs file中乱投，按Ctrl+D結(jié)束輸入选调，hdfs file不能存在，否則命令不會執(zhí)行

2.1.moveFromLocal

hadoop fs -moveFromLocal < local src > ... < hdfs dst >

與put相類似霎俩，命令執(zhí)行后源文件 local src 被刪除哀军，也可以從從鍵盤讀取輸入到hdfs file中

2.2.copyFromLocal

hadoop fs -copyFromLocal < local src > ... < hdfs dst >

與put相類似，也可以從從鍵盤讀取輸入到hdfs file中

3.get

hadoop fs -get < hdfs file > < local file or dir>

local file不能和 hdfs file名字不能相同打却，否則會提示文件已存在杉适，沒有重名的文件會復(fù)制到本地

hadoop fs -get < hdfs file or dir > ... < local dir >

拷貝多個文件或目錄到本地時，本地要為文件夾路徑

注意：如果用戶不是root柳击， local 路徑要為用戶文件夾下的路徑猿推，否則會出現(xiàn)權(quán)限問題，

3.1.moveToLocal

當(dāng)前版本中還未實(shí)現(xiàn)此命令

3.2.copyToLocal

hadoop fs -copyToLocal < local src > ... < hdfs dst >

與get相類似

4.rm

hadoop fs -rm < hdfs file > ...
hadoop fs -rm -r < hdfs dir>...

每次可以刪除多個文件或目錄

5.mkdir

hadoop fs -mkdir < hdfs path>

只能一級一級的建目錄捌肴，父目錄不存在的話使用這個命令會報錯

hadoop fs -mkdir -p < hdfs path>

所創(chuàng)建的目錄如果父目錄不存在就創(chuàng)建該父目錄

6.getmerge

hadoop fs -getmerge < hdfs dir > < local file >

將hdfs指定目錄下所有文件排序后合并到local指定的文件中蹬叭，文件不存在時會自動創(chuàng)建，文件存在時會覆蓋里面的內(nèi)容

hadoop fs -getmerge -nl < hdfs dir > < local file >

加上nl后状知，合并到local file中的hdfs文件之間會空出一行

7.cp

hadoop fs -cp < hdfs file > < hdfs file >

目標(biāo)文件不能存在秽五，否則命令不能執(zhí)行，相當(dāng)于給文件重命名并保存试幽，源文件還存在

hadoop fs -cp < hdfs file or dir >... < hdfs dir >

目標(biāo)文件夾要存在筝蚕，否則命令不能執(zhí)行

8.mv

hadoop fs -mv < hdfs file > < hdfs file >

目標(biāo)文件不能存在，否則命令不能執(zhí)行铺坞，相當(dāng)于給文件重命名并保存起宽，源文件不存在

hadoop fs -mv < hdfs file or dir >... < hdfs dir >

源路徑有多個時，目標(biāo)路徑必須為目錄济榨，且必須存在坯沪。

注意：跨文件系統(tǒng)的移動（local到hdfs或者反過來）都是不允許的

9.count

hadoop fs -count < hdfs path >

統(tǒng)計hdfs對應(yīng)路徑下的目錄個數(shù)，文件個數(shù)擒滑，文件總計大小

顯示為目錄個數(shù)腐晾，文件個數(shù)，文件總計大小丐一，輸入路徑

10.du

hadoop fs -du < hdsf path>

顯示hdfs對應(yīng)路徑下每個文件夾和文件的大小

hadoop fs -du -s < hdsf path>

顯示hdfs對應(yīng)路徑下所有文件和的大小

hadoop fs -du - h < hdsf path>

顯示hdfs對應(yīng)路徑下每個文件夾和文件的大小,文件的大小用方便閱讀的形式表示藻糖，例如用64M代替67108864

11.text

hadoop fs -text < hdsf file>

將文本文件或某些格式的非文本文件通過文本格式輸出

12.setrep

hadoop fs -setrep -R 3 < hdfs path >

改變一個文件在hdfs中的副本個數(shù)，上述命令中數(shù)字3為所設(shè)置的副本個數(shù)库车，-R選項可以對一個人目錄下的所有目錄+文件遞歸執(zhí)行改變副本個數(shù)的操作

13.stat

hdoop fs -stat [format] < hdfs path >

返回對應(yīng)路徑的狀態(tài)信息

[format]可選參數(shù)有：%b（文件大芯奁狻），%o（Block大心堋）洋满，%n（文件名），%r（副本個數(shù)）珍坊，%y（最后一次修改日期和時間）

可以這樣書寫hadoop fs -stat %b%o%n < hdfs path >牺勾，不過不建議，這樣每個字符輸出的結(jié)果不是太容易分清楚

14.tail

hadoop fs -tail < hdfs file >

在標(biāo)準(zhǔn)輸出中顯示文件末尾的1KB數(shù)據(jù)

15.archive

hadoop archive -archiveName name.har -p < hdfs parent dir > < src >* < hdfs dst >

命令中參數(shù)name：壓縮文件名阵漏，自己任意茸っ瘛；< hdfs parent dir > ：壓縮文件所在的父目錄履怯；< src >：要壓縮的文件名川无；< hdfs dst >：壓縮文件存放路徑

*示例：hadoop archive -archiveName hadoop.har -p /user 1.txt 2.txt /des

示例中將hdfs中/user目錄下的文件1.txt，2.txt壓縮成一個名叫hadoop.har的文件存放在hdfs中/des目錄下虑乖，如果1.txt懦趋，2.txt不寫就是將/user目錄下所有的目錄和文件壓縮成一個名叫hadoop.har的文件存放在hdfs中/des目錄下

顯示har的內(nèi)容可以用如下命令：

hadoop fs -ls /des/hadoop.jar

顯示har壓縮的是那些文件可以用如下命令

hadoop fs -ls -R har:///des/hadoop.har

注意：har文件不能進(jìn)行二次壓縮。如果想給.har加文件疹味，只能找到原來的文件仅叫，重新創(chuàng)建一個。har文件中原來文件的數(shù)據(jù)并沒有變化糙捺，har文件真正的作用是減少NameNode和DataNode過多的空間浪費(fèi)

16.balancer

hdfs balancer

如果管理員發(fā)現(xiàn)某些DataNode保存數(shù)據(jù)過多诫咱，某些DataNode保存數(shù)據(jù)相對較少，可以使用上述命令手動啟動內(nèi)部的均衡過程

17.dfsadmin

hdfs dfsadmin -help

管理員可以通過dfsadmin管理HDFS洪灯，用法可以通過上述命令查看

hdfs dfsadmin -report

顯示文件系統(tǒng)的基本數(shù)據(jù)

hdfs dfsadmin -safemode < enter | leave | get | wait >
enter：進(jìn)入安全模式坎缭；leave：離開安全模式；get：獲知是否開啟安全模式；
wait：等待離開安全模式

最后編輯于：2021.12.03 11:38:23

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末掏呼，一起剝皮案震驚了整個濱河市坏快，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌憎夷，老刑警劉巖莽鸿，帶你破解...
沈念sama閱讀 206,968評論 6贊 482
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異拾给，居然都是意外死亡祥得，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,601評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門蒋得，熙熙樓的掌柜王于貴愁眉苦臉地迎上來级及，“玉大人，你說我怎么就攤上這事额衙〈辞В” “怎么了？”我有些...
開封第一講書人閱讀 153,220評論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵入偷，是天一觀的道長追驴。經(jīng)常有香客問我，道長疏之，這世上最難降的妖魔是什么殿雪？我笑而不...
開封第一講書人閱讀 55,416評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮锋爪，結(jié)果婚禮上丙曙，老公的妹妹穿的比我還像新娘。我一直安慰自己其骄，他們只是感情好亏镰，可當(dāng)我...
茶點(diǎn)故事閱讀 64,425評論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著拯爽，像睡著了一般索抓。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上毯炮，一...
開封第一講書人閱讀 49,144評論 1贊 285
城市分裂傳說
那天逼肯，我揣著相機(jī)與錄音，去河邊找鬼桃煎。笑死篮幢，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的为迈。我是一名探鬼主播三椿，決...
沈念sama閱讀 38,432評論 3贊 401
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼缺菌，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了搜锰？” 一聲冷哼從身側(cè)響起伴郁，我...
開封第一講書人閱讀 37,088評論 0贊 261
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎纽乱，沒想到半個月后蛾绎，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體昆箕，經(jīng)...
沈念sama閱讀 43,586評論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡鸦列，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,028評論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了鹏倘。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片薯嗤。...
茶點(diǎn)故事閱讀 38,137評論 1贊 334
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖纤泵，靈堂內(nèi)的尸體忽然破棺而出骆姐，到底是詐尸還是另有隱情，我是刑警寧澤捏题，帶...
沈念sama閱讀 33,783評論 4贊 324
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布玻褪，位于F島的核電站，受9級特大地震影響公荧，放射性物質(zhì)發(fā)生泄漏带射。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,343評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一循狰、第九天我趴在偏房一處隱蔽的房頂上張望窟社。院中可真熱鬧，春花似錦绪钥、人聲如沸灿里。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,333評論 0贊 19
一樁弒父案程腹，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽匣吊。三九已至，卻和暖如春寸潦，著一層夾襖步出監(jiān)牢的瞬間缀去，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,559評論 1贊 262
情欲美人皮
我被黑心中介騙來泰國打工甸祭，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留缕碎，地道東北人。一個月前我還...
沈念sama閱讀 45,595評論 2贊 355
代替公主和親
正文我出身青樓池户，卻偏偏與公主長得像咏雌，于是被迫代替她去往敵國和親凡怎。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,901評論 2贊 345

hadoop 操作HDFS 命令

hadoop HDFS常用文件操作命令

命令基本格式:

1.ls

列出hdfs文件系統(tǒng)根目錄下的目錄和文件

列出hdfs文件系統(tǒng)所有的目錄和文件

2.put

hdfs file的父目錄一定要存在蜕提，否則命令不會執(zhí)行

hdfs dir 一定要存在巍佑，否則命令不會執(zhí)行

從鍵盤讀取輸入到hdfs file中乱投，按Ctrl+D結(jié)束輸入选调，hdfs file不能存在，否則命令不會執(zhí)行

2.1.moveFromLocal

與put相類似霎俩，命令執(zhí)行后源文件 local src 被刪除哀军，也可以從從鍵盤讀取輸入到hdfs file中

2.2.copyFromLocal

與put相類似，也可以從從鍵盤讀取輸入到hdfs file中

3.get

local file不能和 hdfs file名字不能相同打却，否則會提示文件已存在杉适，沒有重名的文件會復(fù)制到本地

拷貝多個文件或目錄到本地時，本地要為文件夾路徑

注意：如果用戶不是root柳击， local 路徑要為用戶文件夾下的路徑猿推，否則會出現(xiàn)權(quán)限問題，

3.1.moveToLocal

3.2.copyToLocal

與get相類似

4.rm

每次可以刪除多個文件或目錄

5.mkdir

只能一級一級的建目錄捌肴，父目錄不存在的話使用這個命令會報錯

所創(chuàng)建的目錄如果父目錄不存在就創(chuàng)建該父目錄

6.getmerge

將hdfs指定目錄下所有文件排序后合并到local指定的文件中蹬叭，文件不存在時會自動創(chuàng)建，文件存在時會覆蓋里面的內(nèi)容

加上nl后状知，合并到local file中的hdfs文件之間會空出一行

7.cp

目標(biāo)文件不能存在秽五，否則命令不能執(zhí)行，相當(dāng)于給文件重命名并保存试幽，源文件還存在

目標(biāo)文件夾要存在筝蚕，否則命令不能執(zhí)行

8.mv

目標(biāo)文件不能存在，否則命令不能執(zhí)行铺坞，相當(dāng)于給文件重命名并保存起宽，源文件不存在

源路徑有多個時，目標(biāo)路徑必須為目錄济榨，且必須存在坯沪。

注意：跨文件系統(tǒng)的移動（local到hdfs或者反過來）都是不允許的

9.count

統(tǒng)計hdfs對應(yīng)路徑下的目錄個數(shù)，文件個數(shù)擒滑，文件總計大小

顯示為目錄個數(shù)腐晾，文件個數(shù)，文件總計大小丐一，輸入路徑

10.du

顯示hdfs對應(yīng)路徑下每個文件夾和文件的大小

顯示hdfs對應(yīng)路徑下所有文件和的大小

顯示hdfs對應(yīng)路徑下每個文件夾和文件的大小,文件的大小用方便閱讀的形式表示藻糖，例如用64M代替67108864

11.text

將文本文件或某些格式的非文本文件通過文本格式輸出

12.setrep

改變一個文件在hdfs中的副本個數(shù)，上述命令中數(shù)字3為所設(shè)置的副本個數(shù)库车，-R選項可以對一個人目錄下的所有目錄+文件遞歸執(zhí)行改變副本個數(shù)的操作

13.stat

返回對應(yīng)路徑的狀態(tài)信息

[format]可選參數(shù)有：%b（文件大芯奁狻），%o（Block大心堋）洋满，%n（文件名），%r（副本個數(shù)）珍坊，%y（最后一次修改日期和時間）

可以這樣書寫hadoop fs -stat %b%o%n < hdfs path >牺勾，不過不建議，這樣每個字符輸出的結(jié)果不是太容易分清楚

14.tail

在標(biāo)準(zhǔn)輸出中顯示文件末尾的1KB數(shù)據(jù)

15.archive

命令中參數(shù)name：壓縮文件名阵漏，自己任意茸っ瘛；< hdfs parent dir > ：壓縮文件所在的父目錄履怯；< src >：要壓縮的文件名川无；< hdfs dst >：壓縮文件存放路徑

*示例：hadoop archive -archiveName hadoop.har -p /user 1.txt 2.txt /des

示例中將hdfs中/user目錄下的文件1.txt，2.txt壓縮成一個名叫hadoop.har的文件存放在hdfs中/des目錄下虑乖，如果1.txt懦趋，2.txt不寫就是將/user目錄下所有的目錄和文件壓縮成一個名叫hadoop.har的文件存放在hdfs中/des目錄下

顯示har的內(nèi)容可以用如下命令：

顯示har壓縮的是那些文件可以用如下命令

注意：har文件不能進(jìn)行二次壓縮。如果想給.har加文件疹味，只能找到原來的文件仅叫，重新創(chuàng)建一個。har文件中原來文件的數(shù)據(jù)并沒有變化糙捺，har文件真正的作用是減少NameNode和DataNode過多的空間浪費(fèi)

16.balancer

如果管理員發(fā)現(xiàn)某些DataNode保存數(shù)據(jù)過多诫咱，某些DataNode保存數(shù)據(jù)相對較少，可以使用上述命令手動啟動內(nèi)部的均衡過程

17.dfsadmin

管理員可以通過dfsadmin管理HDFS洪灯，用法可以通過上述命令查看

顯示文件系統(tǒng)的基本數(shù)據(jù)

推薦閱讀更多精彩內(nèi)容