080-BigData-08HDFS

一作谭、HDFS概念

1贝或、概念

HDFS，它是一個文件系統(tǒng)酱床，全稱：Hadoop Distributed File System昧捷，用于存儲文件通過目錄樹來定位文件靡挥；其次贮泞，它是分布式的啃擦，由很多服務(wù)器聯(lián)合起來實現(xiàn)其功能令蛉，集群中的服務(wù)器有各自的角色。

2祷安、組成

1）HDFS集群包括汇鞭，NameNode和DataNode以及Secondary Namenode。
2）NameNode負責(zé)管理整個文件系統(tǒng)的元數(shù)據(jù)读整，以及每一個路徑（文件）所對應(yīng)的數(shù)據(jù)塊信息米间。
3）DataNode 負責(zé)管理用戶的文件數(shù)據(jù)塊，每一個數(shù)據(jù)塊都可以在多個datanode上存儲多個副本另玖。
4）Secondary NameNode用來監(jiān)控HDFS狀態(tài)的輔助后臺程序，每隔一段時間獲取HDFS元數(shù)據(jù)的快照蹦哼。

3妆丘、HDFS 文件塊大小

HDFS中的文件在物理上是分塊存儲（block）奶赠，塊的大小可以通過配置參數(shù)( dfs.blocksize)來規(guī)定毅戈，默認大小在hadoop2.x版本中是128M，老版本中是64M
HDFS的塊比磁盤的塊大扇单，其目的是為了最小化尋址開銷。如果塊設(shè)置得足夠大凉倚，從磁盤傳輸數(shù)據(jù)的時間會明顯大于定位這個塊開始位置所需的時間。因而杏糙，傳輸一個由多個塊組成的文件的時間取決于磁盤傳輸速率宏侍。
如果尋址時間約為10ms，而傳輸速率為100MB/s绷耍，為了使尋址時間僅占傳輸時間的1%，我們要將塊大小設(shè)置約為100MB崎苗。默認的塊大小128MB肌蜻。
塊的大兴纹邸：10ms100100M/s = 100M

image.png

二祷杈、命令行操作

1但汞、上傳文件

傳一個test文件

hdfs dfs -put test /

然后在網(wǎng)頁查看

image.png

2、基本語法

bin/hadoop fs 具體命令

參數(shù)：

[-appendToFile <localsrc> ... <dst>]
[-cat [-ignoreCrc] <src> ...]
[-checksum <src> ...]
[-chgrp [-R] GROUP PATH...]
[-chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...]
[-chown [-R] [OWNER][:[GROUP]] PATH...]
[-copyFromLocal [-f] [-p] <localsrc> ... <dst>]
[-copyToLocal [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]
[-count [-q] <path> ...]
[-cp [-f] [-p] <src> ... <dst>]
[-createSnapshot <snapshotDir> [<snapshotName>]]
[-deleteSnapshot <snapshotDir> <snapshotName>]
[-df [-h] [<path> ...]]
        [-du [-s] [-h] <path> ...]
        [-expunge]
        [-get [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]
        [-getfacl [-R] <path>]
        [-getmerge [-nl] <src> <localdst>]
        [-help [cmd ...]]
        [-ls [-d] [-h] [-R] [<path> ...]]
        [-mkdir [-p] <path> ...]
        [-moveFromLocal <localsrc> ... <dst>]
        [-moveToLocal <src> <localdst>]
        [-mv <src> ... <dst>]
        [-put [-f] [-p] <localsrc> ... <dst>]
        [-renameSnapshot <snapshotDir> <oldName> <newName>]
        [-rm [-f] [-r|-R] [-skipTrash] <src> ...]
        [-rmdir [--ignore-fail-on-non-empty] <dir> ...]
        [-setfacl [-R] [{-b|-k} {-m|-x <acl_spec>} <path>]|[--set <acl_spec> <path>]]
        [-setrep [-R] [-w] <rep> <path> ...]
        [-stat [format] <path> ...]
        [-tail [-f] <file>]
        [-test -[defsz] <path>]
        [-text [-ignoreCrc] <src> ...]
        [-touchz <path> ...]
        [-usage [cmd ...]]

3容贝、常用命令實操

（1）-help：輸出這個命令參數(shù)
bin/hdfs dfs -help rm
（2）-ls: 顯示目錄信息
hadoop fs -ls /
Hadoop fs -lsr /
（3）-mkdir：在hdfs上創(chuàng)建目錄
hadoop fs -mkdir -p /hdfs路徑
（4）-moveFromLocal從本地剪切粘貼到hdfs
hadoop fs -moveFromLocal 本地路徑 /hdfs路徑
（5）--appendToFile ：追加一個文件到已經(jīng)存在的文件末尾
hadoop fs -appendToFile 本地路徑 /hdfs路徑
（6）-cat ：顯示文件內(nèi)容
hadoop fs -cat /hdfs路徑
（7）-tail -f：監(jiān)控文件
hadoop fs -tail -f /hdfs路徑
（8）-chmod、-chown：linux文件系統(tǒng)中的用法一樣，修改文件所屬權(quán)限
hadoop fs -chmod 777 /hdfs路徑
hadoop fs -chown someuser:somegrp /hdfs路徑
（9）-cp ：從hdfs的一個路徑拷貝到hdfs的另一個路徑
hadoop fs -cp /hdfs路徑1 / hdfs路徑2
（10）-mv：在hdfs目錄中移動/重命名文件
hadoop fs -mv /hdfs路徑 / hdfs路徑
（11）-get：等同于copyToLocal满力，就是從hdfs下載文件到本地
hadoop fs -get / hdfs路徑 ./本地路徑
（12）-getmerge ：合并下載多個文到linux本地，比如hdfs的目錄 /aaa/下有多個文件:log.1, log.2,log.3,...（注：是合成到Linux本地）
hadoop fs -getmerge /aaa/log.* ./log.sum
合成到不同的目錄：hadoop fs -getmerge /hdfs1路徑 /hdfs2路徑 /
（13）-put：等同于copyFromLocal
hadoop fs -put /本地路徑 /hdfs路徑
（14）-rm：刪除文件或文件夾
hadoop fs -rm -r /hdfs路徑
（15）-df ：統(tǒng)計文件系統(tǒng)的可用空間信息
hadoop fs -df -h / hdfs路徑
（16）-du統(tǒng)計文件夾的大小信息
[root@bigdata131 hadoop-2.8.4]$ hadoop fs -du -s -h / hdfs路徑
188.5 M /user/root/wcinput

[root@bigdata131 hadoop-2.8.4] $hadoop fs -du -h / hdfs路徑 188.5 M / hdfs路徑 97 / hdfs路徑（17）-count：統(tǒng)計一個指定目錄下的文件節(jié)點數(shù)量 hadoop fs -count /aaa/ [root@bigdata131 hadoop-2.8.4]$ hadoop fs -count / hdfs路徑
1 2 197657784 / hdfs路徑
嵌套文件層級悔耘；包含文件的總數(shù)
（18）-setrep：設(shè)置hdfs中文件的副本數(shù)量：3是副本數(shù)，可改
hadoop fs -setrep 3 / hdfs路徑

這里設(shè)置的副本數(shù)只是記錄在namenode的元數(shù)據(jù)中我擂，是否真的會有這么多副本衬以，還得看datanode的數(shù)量缓艳。因為目前只有3臺設(shè)備，最多也就3個副本看峻，只有節(jié)點數(shù)的增加到10臺時阶淘，副本數(shù)才能達到10溪窒。

三宛瞄、Maven準(zhǔn)備

Maven下載地址

Binary：編譯之后的二進制文件

Source：表示可以查看源代碼的，比Binary大一點

修改配置：

image.png

然后再換一個快的下載源摩幔，目前阿里云稍微快點舶担。

image.png

<!--使用阿里云鏡像去下載Jar包蒲跨，速度更快-->
  <mirrors>
    <mirror>
      <id>alimaven</id>
      <name>aliyun maven</name>
      <url>http://maven.aliyun.com/nexus/content/groups/public/</url>
      <mirrorOf>central</mirrorOf>        
    </mirror>
  </mirrors>

image.png

打開IDEA捌臊，選擇maven工程

image.png

創(chuàng)建一個maven工程举庶，好了后界面：

image.png

創(chuàng)建好之后替梨，再設(shè)置一下maven：

image.png

我們不用默認的信认，用我們自己的maven清寇，所以選擇一下：

image.png

配置文件和下載路徑也選擇一下：

image.png

其中下載地址已經(jīng)自動識別了妥泉。但配置文件需要手選一下。

image.png

可以坐等下載一下何鸡。

image.png

跑一下：

image.png

可以跑通龙亲。

接下來是重點配置：

<dependencies>
<dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-common</artifactId>
            <version>2.8.4</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-hdfs</artifactId>
            <version>2.8.4</version>
        </dependency>
        <dependency>
            <groupId>org.apache.hadoop</groupId>
            <artifactId>hadoop-client</artifactId>
            <version>2.8.4</version>
        </dependency>

        <dependency>
            <groupId>org.projectlombok</groupId>
            <artifactId>lombok</artifactId>
            <version>1.16.10</version>
        </dependency>

        <dependency>
            <groupId>log4j</groupId>
            <artifactId>log4j</artifactId>
            <version>1.2.17</version>
        </dependency>
        <dependency>
            <groupId>org.slf4j</groupId>
            <artifactId>slf4j-api</artifactId>
            <version>1.7.7</version>
        </dependency>

        <!-- https://mvnrepository.com/artifact/junit/junit -->
        <dependency>
            <groupId>junit</groupId>
            <artifactId>junit</artifactId>
            <version>4.12</version>
            <scope>test</scope>
        </dependency>
   </dependencies>

image.png

配置然后下載。

接下來更重要。

我們把Linux的hadoop包直接解壓到j(luò)dk目錄里面：

image.png

添加文件下載地址

提取碼：vq34

下載上面文件放進bin目錄下：

image.png

這樣做的目的就是：可以在win里面用一些hadoop命令了钉跷。

配置win電腦的HADOOP_HOME環(huán)境變量：

image.png

PATH里面也要添加上：

image.png

上面修改hadoop和jdk同級目錄。

附：Mac版本

選擇binary zip archive下載

conf文件下有一個settings.xml文件。在這里面我們可以修改一下鏡像的位置，默認的鏡像下載速度很慢，我們可以換成阿里云的鏡像。

image.png

    <mirror>
          <!--This sends everything else to /public -->
          <id>nexus</id>
          <mirrorOf>*</mirrorOf>
          <url>http://maven.aliyun.com/nexus/content/groups/public/</url>
        </mirror>
    <mirror>
          <!--This is used to direct the public snapshots repo in the
                     profile below over to a different nexus group -->
          <id>nexus-public-snapshots</id>
          <mirrorOf>public-snapshots</mirrorOf>
          <url>http://maven.aliyun.com/nexus/content/repositories/snapshots/</url>
        </mirror>

image.png

我們也可以把倉庫的位置換了没隘，倉庫就是我們通過maven下載的jar包存放的地方眶诈。

image.png

寫自己想放的位置

<localRepository>/Users/mac03/apache-maven-3.6.1/repository</localRepository>

image.png

打開終端輸入命令 vim ~/.bash_profile （編輯環(huán)境變量配置文件）

vi ~/.bash_profile

image.png

遇到權(quán)限浙炼，加個sudo

在環(huán)境變量文件中加上如下的配置

 export MAVEN_HOME=/Users/mac03/apache-maven-3.6.1/apache-maven/src

 export PATH=$PATH:$MAVEN_HOME/bin

配置好以后宴偿，更新一下

source ~/.bash_profile

測試一下好了沒

mvn -v

image.png

這樣就代表配置好了

四娩践、測試一下是否好了

創(chuàng)建一個Java工程：

public class HdfsClientDemo1 {
    public static void main(String[] args) throws Exception {
        // 1 獲取文件系統(tǒng)
        Configuration configuration = new Configuration();
        // 配置在集群上運行
        configuration.set("fs.defaultFS", "hdfs://bigdata131:9000");
        FileSystem fileSystem = FileSystem.get(configuration);

        // 直接配置訪問集群的路徑和訪問集群的用戶名稱
//      FileSystem fileSystem = FileSystem.get(new URI("hdfs://bigdata111:9000"),configuration, "itstar");

        // 2 把本地文件上傳到文件系統(tǒng)中
        fileSystem.copyFromLocalFile(new Path("f:/hello.txt"), new Path("/hello1.copy.txt"));

        // 3 關(guān)閉資源
        fileSystem.close();
        System.out.println("over");
    }
}

image.png

按alt加回車導(dǎo)包，選hadoop的包

image.png

準(zhǔn)備好上傳的文件

image.png

跑一下，看看效果：

image.png

去看看成功沒：

image.png

果然傳過來了钉蒲！很好~

報紅解決如下：

log4j解決報紅的下載地址

提取碼：ywq1

下一篇：081-BigData-09HDFS上傳與下載

最后編輯于：2019.08.23 17:35:17

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末切端，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子顷啼，更是在濱河造成了極大的恐慌踏枣，老刑警劉巖，帶你破解...
沈念sama閱讀 218,525評論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件钙蒙，死亡現(xiàn)場離奇詭異茵瀑，居然都是意外死亡，警方通過查閱死者的電腦和手機躬厌，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,203評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門马昨，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人扛施，你說我怎么就攤上這事偏陪。” “怎么了煮嫌？”我有些...
開封第一講書人閱讀 164,862評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵笛谦，是天一觀的道長。經(jīng)常有香客問我昌阿，道長饥脑，這世上最難降的妖魔是什么恳邀？我笑而不...
開封第一講書人閱讀 58,728評論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮灶轰，結(jié)果婚禮上谣沸，老公的妹妹穿的比我還像新娘。我一直安慰自己笋颤，他們只是感情好乳附，可當(dāng)我...
茶點故事閱讀 67,743評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著伴澄，像睡著了一般赋除。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上非凌，一...
開封第一講書人閱讀 51,590評論 1贊 305
城市分裂傳說
那天举农，我揣著相機與錄音，去河邊找鬼敞嗡。笑死颁糟，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的喉悴。我是一名探鬼主播棱貌，決...
沈念sama閱讀 40,330評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼箕肃！你這毒婦竟也來了婚脱？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 39,244評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤突雪，失蹤者是張志新（化名）和其女友劉穎起惕，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體咏删，經(jīng)...
沈念sama閱讀 45,693評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡惹想，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,885評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了督函。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片嘀粱。...
茶點故事閱讀 40,001評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖辰狡，靈堂內(nèi)的尸體忽然破棺而出锋叨，到底是詐尸還是另有隱情，我是刑警寧澤宛篇，帶...
沈念sama閱讀 35,723評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布娃磺，位于F島的核電站，受9級特大地震影響叫倍，放射性物質(zhì)發(fā)生泄漏偷卧。R本人自食惡果不足惜豺瘤，卻給世界環(huán)境...
茶點故事閱讀 41,343評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望听诸。院中可真熱鬧坐求，春花似錦、人聲如沸晌梨。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,919評論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽仔蝌。三九已至泛领，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間掌逛，已是汗流浹背师逸。一陣腳步聲響...
開封第一講書人閱讀 33,042評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工司倚，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留豆混，地道東北人。一個月前我還...
沈念sama閱讀 48,191評論 3贊 370
代替公主和親
正文我出身青樓动知，卻偏偏與公主長得像皿伺，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子盒粮，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 44,955評論 2贊 355

080-BigData-08HDFS

一作谭、HDFS概念

二祷杈、命令行操作

三宛瞄、Maven準(zhǔn)備

接下來是重點配置：

接下來更重要。

我們把Linux的hadoop包直接解壓到j(luò)dk目錄里面：

附：Mac版本

四娩践、測試一下是否好了

推薦閱讀更多精彩內(nèi)容