Hadoop概述

Hadoop

1、 Hadoop的介紹

Hadoop最早起源于Nutch蛛砰。Nutch的設計目標是構建一個大型的全網(wǎng)搜索引擎娃肿，包括網(wǎng)頁抓取咕缎、索引、查詢等功能料扰，但隨著抓取網(wǎng)頁數(shù)量的增加凭豪，遇到了嚴重的可擴展性問題——如何解決數(shù)十億網(wǎng)頁的存儲和索引問題。
2003年记罚、2004年谷歌發(fā)表的兩篇論文為該問題提供了可行的解決方案。

——分布式文件系統(tǒng)（GFS）Google File System(谷歌文件系統(tǒng)）壳嚎，可用于處理海量網(wǎng)頁的存儲

——分布式計算框架MAPREDUCE桐智，可用于處理海量網(wǎng)頁的索引計算問題。

Nutch的開發(fā)人員完成了相應的開源實現(xiàn)HDFS和MAPREDUCE烟馅，并從Nutch中剝離成為獨立項目HADOOP说庭，到2008年1月，HADOOP成為Apache頂級項目.

狹義上來說郑趁，hadoop就是單獨指代hadoop這個軟件刊驴，

HDFS ：分布式文件系統(tǒng)
MapReduce : 分布式計算系統(tǒng)
Yarn：分布式樣集群資源管理

廣義上來說，hadoop指代大數(shù)據(jù)的一個生態(tài)圈寡润，包括很多其他的軟件

1558225014064.png

2捆憎、hadoop的歷史版本和發(fā)行版公司

2.1 Hadoop歷史版本

1.x版本系列：hadoop版本當中的第二代開源版本，主要修復0.x版本的一些bug等

2.x版本系列：架構產(chǎn)生重大變化梭纹，引入了yarn平臺等許多新特性

3.x版本系列: 加入多namenoode新特性

2.2 Hadoop三大發(fā)行版公司

免費開源版本apache:

http://hadoop.apache.org/

優(yōu)點：擁有全世界的開源貢獻者躲惰，代碼更新迭代版本比較快，

缺點：版本的升級变抽，版本的維護础拨，版本的兼容性，版本的補丁都可能考慮不太周到绍载，

apache所有軟件的下載地址（包括各種歷史版本）：

http://archive.apache.org/dist/

免費開源版本hortonWorks：

https://hortonworks.com/

hortonworks主要是雅虎主導Hadoop開發(fā)的副總裁诡宗，帶領二十幾個核心成員成立Hortonworks，核心產(chǎn)品軟件HDP（ambari）击儡，HDF免費開源塔沃，并且提供一整套的web管理界面，供我們可以通過web界面管理我們的集群狀態(tài)阳谍，web管理界面軟件HDF網(wǎng)址（http://ambari.apache.org/）

軟件收費版本ClouderaManager:

https://www.cloudera.com/

cloudera主要是美國一家大數(shù)據(jù)公司在apache開源hadoop的版本上芳悲，通過自己公司內(nèi)部的各種補丁立肘，實現(xiàn)版本之間的穩(wěn)定運行，大數(shù)據(jù)生態(tài)圈的各個版本的軟件都提供了對應的版本名扛，解決了版本的升級困難谅年，版本兼容性等各種問題

3、hadoop的架構模型

1.x的版本架構模型介紹

1558232908565.png

文件系統(tǒng)核心模塊：

NameNode：集群當中的主節(jié)點肮韧，管理元數(shù)據(jù)(文件的大小融蹂，文件的位置，文件的權限)弄企，主要用于管理集群當中的各種數(shù)據(jù)

secondaryNameNode：主要能用于hadoop當中元數(shù)據(jù)信息的輔助管理

DataNode：集群當中的從節(jié)點超燃，主要用于存儲集群當中的各種數(shù)據(jù)

數(shù)據(jù)計算核心模塊：

JobTracker：接收用戶的計算請求任務，并分配任務給從節(jié)點

TaskTracker：負責執(zhí)行主節(jié)點JobTracker分配的任務

2.x的版本架構模型介紹

第一種：NameNode與ResourceManager單節(jié)點架構模型

1558232924095.png

文件系統(tǒng)核心模塊：

NameNode：集群當中的主節(jié)點拘领，主要用于管理集群當中的各種數(shù)據(jù)

secondaryNameNode：主要能用于hadoop當中元數(shù)據(jù)信息的輔助管理

DataNode：集群當中的從節(jié)點组贺，主要用于存儲集群當中的各種數(shù)據(jù)

數(shù)據(jù)計算核心模塊：

ResourceManager：接收用戶的計算請求任務顷牌，并負責集群的資源分配

NodeManager：負責執(zhí)行主節(jié)點APPmaster分配的任務

第二種：NameNode單節(jié)點與ResourceManager高可用架構模型

1558232966712.png

文件系統(tǒng)核心模塊：

NameNode：集群當中的主節(jié)點，主要用于管理集群當中的各種數(shù)據(jù)

secondaryNameNode：主要能用于hadoop當中元數(shù)據(jù)信息的輔助管理

DataNode：集群當中的從節(jié)點，主要用于存儲集群當中的各種數(shù)據(jù)

數(shù)據(jù)計算核心模塊：

ResourceManager：接收用戶的計算請求任務庄新，并負責集群的資源分配赊窥，以及計算任務的劃分逝钥，通過zookeeper實現(xiàn)ResourceManager的高可用

NodeManager：負責執(zhí)行主節(jié)點ResourceManager分配的任務

第三種：NameNode高可用與ResourceManager單節(jié)點架構模型

1558232980575.png

文件系統(tǒng)核心模塊：

NameNode：集群當中的主節(jié)點隘弊，主要用于管理集群當中的各種數(shù)據(jù)，其中nameNode可以有兩個送悔，形成高可用狀態(tài)

DataNode：集群當中的從節(jié)點慢显，主要用于存儲集群當中的各種數(shù)據(jù)

JournalNode：文件系統(tǒng)元數(shù)據(jù)信息管理

數(shù)據(jù)計算核心模塊：

ResourceManager：接收用戶的計算請求任務，并負責集群的資源分配欠啤，以及計算任務的劃分

NodeManager：負責執(zhí)行主節(jié)點ResourceManager分配的任務

第四種：NameNode與ResourceManager高可用架構模型

1558232995675.png

文件系統(tǒng)核心模塊：

NameNode：集群當中的主節(jié)點荚藻，主要用于管理集群當中的各種數(shù)據(jù)，一般都是使用兩個洁段，實現(xiàn)HA高可用

JournalNode：元數(shù)據(jù)信息管理進程鞋喇，一般都是奇數(shù)個

DataNode：從節(jié)點，用于數(shù)據(jù)的存儲

數(shù)據(jù)計算核心模塊：

ResourceManager：Yarn平臺的主節(jié)點眉撵，主要用于接收各種任務侦香，通過兩個，構建成高可用

NodeManager：Yarn平臺的從節(jié)點纽疟，主要用于處理ResourceManager分配的任務

4罐韩、appache版本hadoop重新編譯

4.1為什么要編譯hadoop

由于appache給出的hadoop的安裝包沒有提供帶C程序訪問的接口，所以我們在使用本地庫（本地庫可以用來做壓縮污朽，以及支持C程序等等）的時候就會出問題,需要對Hadoop源碼包進行重新編譯.

4.2編譯環(huán)境的準備

4.2.1：準備linux環(huán)境

準備一臺linux環(huán)境散吵，內(nèi)存4G或以上，硬盤40G或以上，我這里使用的是Centos6.9 64位的操作系統(tǒng)（注意：一定要使用64位的操作系統(tǒng)）

4.2.2：虛擬機聯(lián)網(wǎng)矾睦，關閉防火墻晦款，關閉selinux

wps1.jpg

關閉防火墻命令：

service  iptables   stop
chkconfig   iptables  off

關閉selinux

vim /etc/selinux/config

4.2.3：安裝jdk1.7

注意hadoop-2.7.5 這個版本的編譯，只能使用jdk1.7枚冗，如果使用jdk1.8那么就會報錯

查看centos6.9自帶的openjdk

rpm -qa | grep java

將所有這些openjdk全部卸載掉

rpm -e java-1.6.0-openjdk-1.6.0.41-1.13.13.1.el6_8.x86_64 tzdata-java-2016j-1.el6.noarch java-1.7.0-openjdk-1.7.0.131-2.6.9.0.el6_8.x86_64

注意：這里一定不要使用jdk1.8缓溅，親測jdk1.8會出現(xiàn)錯誤

將我們jdk的安裝包上傳到/export/softwares（我這里使用的是jdk1.7.0_71這個版本）

解壓我們的jdk壓縮包

統(tǒng)一兩個路徑

mkdir -p /export/servers
mkdir -p /export/softwares
cd /export/softwares
tar -zxvf jdk-7u71-linux-x64.tar.gz -C ../servers/

配置環(huán)境變量

vim /etc/profile

export JAVA_HOME=/export/servers/jdk1.7.0_71
export PATH=:$JAVA_HOME/bin:$PATH

[圖片上傳失敗...(image-ed4f2c-1565695660005)]

讓修改立即生效

source /etc/profile

4.2.4：安裝maven

這里使用maven3.x以上的版本應該都可以，不建議使用太高的版本赁温，強烈建議使用3.0.5的版本即可

將maven的安裝包上傳到/export/softwares

然后解壓maven的安裝包到/export/servers

cd /export/softwares/
tar -zxvf apache-maven-3.0.5-bin.tar.gz -C ../servers/

配置maven的環(huán)境變量

vim /etc/profile

export MAVEN_HOME=/export/servers/apache-maven-3.0.5
export MAVEN_OPTS="-Xms4096m -Xmx4096m"
export PATH=:$MAVEN_HOME/bin:$PATH

[圖片上傳失敗...(image-270739-1565695660005)]

讓修改立即生效

source /etc/profile

解壓maven的倉庫

tar -zxvf mvnrepository.tar.gz -C /export/servers/

修改maven的配置文件

cd  /export/servers/apache-maven-3.0.5/conf
vim settings.xml

指定我們本地倉庫存放的路徑

[圖片上傳失敗...(image-af03aa-1565695660005)]

添加一個我們阿里云的鏡像地址坛怪，會讓我們下載jar包更快

 <mirror>
      <id>alimaven</id>
      <name>aliyun maven</name>
      <url>http://maven.aliyun.com/nexus/content/groups/public/</url>
      <mirrorOf>central</mirrorOf>
    </mirror>

[圖片上傳失敗...(image-3484ef-1565695660005)]

4.2.5：安裝findbugs

解壓findbugs

tar -zxvf findbugs-1.3.9.tar.gz -C ../servers/

配置findbugs的環(huán)境變量

vim /etc/profile

export JAVA_HOME=/export/servers/jdk1.7.0_75
export PATH=:$JAVA_HOME/bin:$PATH

export MAVEN_HOME=/export/servers/apache-maven-3.0.5
export PATH=:$MAVEN_HOME/bin:$PATH

export FINDBUGS_HOME=/export/servers/findbugs-1.3.9
export PATH=:$FINDBUGS_HOME/bin:$PATH

[圖片上傳失敗...(image-2e5b69-1565695660005)]

讓修改立即生效

source /etc/profile

4.2.6：在線安裝一些依賴包

yum install autoconf automake libtool cmake
yum install ncurses-devel
yum install openssl-devel
yum install lzo-devel zlib-devel gcc gcc-c++

bzip2壓縮需要的依賴包

yum install -y  bzip2-devel

4.2.7：安裝protobuf

解壓protobuf并進行編譯

cd  /export/softwares
tar -zxvf protobuf-2.5.0.tar.gz -C ../servers/
cd   /export/servers/protobuf-2.5.0
./configure
make && make install

4.2.8、安裝snappy

cd /export/softwares/
tar -zxf snappy-1.1.1.tar.gz  -C ../servers/
cd ../servers/snappy-1.1.1/
./configure
make && make install

4.2.9：編譯hadoop源碼

對源碼進行編譯

cd  /export/softwares
tar -zxvf hadoop-2.7.5-src.tar.gz  -C ../servers/
cd  /export/servers/hadoop-2.7.5

編譯支持snappy壓縮：

mvn package -DskipTests -Pdist,native -Dtar -Drequire.snappy -e -X

編譯完成之后我們需要的壓縮包就在下面這個路徑里面

/export/servers/hadoop-2.7.5/hadoop-dist/target

5股囊、Hadoop安裝

集群規(guī)劃

服務器IP	192.168.174.100	192.168.174.110	192.168.174.120
主機名	node01	node02	node03
NameNode	是	否	否
SecondaryNameNode	是	否	否
dataNode	是	是	是
ResourceManager	是	否	否
NodeManager	是	是	是

第一步：上傳apache hadoop包并解壓

解壓命令

cd /export/softwares
tar -zxvf hadoop-2.7.5.tar.gz -C ../servers/

bin/hadoop checknative :檢查本地包

[圖片上傳失敗...(image-98a00b-1565695660005)]

第二步：修改配置文件

修改core-site.xml

第一臺機器執(zhí)行以下命令

cd  /export/servers/hadoop-2.7.5/etc/hadoop
vim  core-site.xml

<configuration>

    <property>
        <name>fs.default.name</name>
        <value>hdfs://node01:8020</value>
    </property>
    
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/export/servers/hadoop-2.7.5/hadoopDatas/tempDatas</value>

    </property>

    <!--  緩沖區(qū)大小袜匿，實際工作中根據(jù)服務器性能動態(tài)調(diào)整 -->

    <property>
        <name>io.file.buffer.size</name>
        <value>4096</value>
    </property>

    <!--  開啟hdfs的垃圾桶機制，刪除掉的數(shù)據(jù)可以從垃圾桶中回收稚疹，單位分鐘 -->
    <property>
        <name>fs.trash.interval</name>
        <value>10080</value>
    </property>
</configuration>

修改hdfs-site.xml

第一臺機器執(zhí)行以下命令

cd  /export/servers/hadoop-2.7.5/etc/hadoop
vim hdfs-site.xml

<configuration>
     <property>
            <name>dfs.namenode.secondary.http-address</name>
            <value>node01:50090</value>
    </property>

    <property>
        <name>dfs.namenode.http-address</name>
        <value>node01:50070</value>
    </property>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:///export/servers/hadoop-2.7.5/hadoopDatas/namenodeDatas,file:///export/servers/hadoop-2.7.5/hadoopDatas/namenodeDatas2</value>
    </property>
    <!--  定義dataNode數(shù)據(jù)存儲的節(jié)點位置居灯，實際工作中，一般先確定磁盤的掛載目錄内狗，然后多個目錄用怪嫌，進行分割  -->

    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:///export/servers/hadoop-2.7.5/hadoopDatas/datanodeDatas,file:///export/servers/hadoop-2.7.5/hadoopDatas/datanodeDatas2</value>
    </property> 
    
    <property>
        <name>dfs.namenode.edits.dir</name>
        <value>file:///export/servers/hadoop-2.7.5/hadoopDatas/nn/edits</value>
    </property>

    <property>
        <name>dfs.namenode.checkpoint.dir</name>
        <value>file:///export/servers/hadoop-2.7.5/hadoopDatas/snn/name</value>
    </property>
    
    <property>
        <name>dfs.namenode.checkpoint.edits.dir</name>
        <value>file:///export/servers/hadoop-2.7.5/hadoopDatas/dfs/snn/edits</value>
    </property>

    <property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>


    <property>
        <name>dfs.permissions</name>
        <value>false</value>
    </property>

    <property>
        <name>dfs.blocksize</name>
        <value>134217728</value>
    </property>

</configuration>

修改hadoop-env.sh

第一臺機器執(zhí)行以下命令

cd  /export/servers/hadoop-2.7.5/etc/hadoop
vim  hadoop-env.sh

export JAVA_HOME=/export/servers/jdk1.8.0_141

修改mapred-site.xml

第一臺機器執(zhí)行以下命令

cd  /export/servers/hadoop-2.7.5/etc/hadoop
vim  mapred-site.xml

<configuration>
    
    <property>
        <name>mapreduce.job.ubertask.enable</name>
        <value>true</value>
    </property>


    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>node01:10020</value>
    </property>
 
    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>node01:19888</value>
    </property>

</configuration>

修改yarn-site.xml

第一臺機器執(zhí)行以下命令

cd  /export/servers/hadoop-2.7.5/etc/hadoop
vim  yarn-site.xml

<configuration>
    <property>
        <name>yarn.resourcemanager.hostname</name>
        <value>node01</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    
    <property>
        <name>yarn.log-aggregation-enable</name>
        <value>true</value>
    </property>
    <property>
        <name>yarn.log-aggregation.retain-seconds</name>
        <value>604800</value>
    </property>
    <property>    
        <name>yarn.nodemanager.resource.memory-mb</name>    
        <value>20480</value>
    </property>
    <property>  
             <name>yarn.scheduler.minimum-allocation-mb</name>
            <value>2048</value>
    </property>
    <property>
        <name>yarn.nodemanager.vmem-pmem-ratio</name>
        <value>2.1</value>
    </property>

</configuration>

修改mapred-env.sh

? <property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>

第一臺機器執(zhí)行以下命令

cd  /export/servers/hadoop-2.7.5/etc/hadoop
vim  mapred-env.sh

export JAVA_HOME=/export/servers/jdk1.8.0_141

修改slaves

修改slaves文件，然后將安裝包發(fā)送到其他機器其屏，重新啟動集群即可

第一臺機器執(zhí)行以下命令

cd  /export/servers/hadoop-2.7.5/etc/hadoop
vim slaves

node01
node02
node03

第一臺機器執(zhí)行以下命令

mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/tempDatas
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/namenodeDatas
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/namenodeDatas2
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/datanodeDatas
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/datanodeDatas2
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/nn/edits
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/snn/name
mkdir -p /export/servers/hadoop-2.7.5/hadoopDatas/dfs/snn/edits

安裝包的分發(fā)

第一臺機器執(zhí)行以下命令

cd  /export/servers/
scp -r hadoop-2.7.5 node02:$PWD
scp -r hadoop-2.7.5 node03:$PWD

第三步：配置hadoop的環(huán)境變量

三臺機器都要進行配置hadoop的環(huán)境變量

三臺機器執(zhí)行以下命令

vim  /etc/profile

export HADOOP_HOME=/export/servers/hadoop-2.7.5
export PATH=:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

配置完成之后生效

source /etc/profile

第四步：啟動集群

要啟動 Hadoop 集群喇勋，需要啟動 HDFS 和 YARN 兩個模塊缨该。
注意：首次啟動 HDFS 時偎行，必須對其進行格式化操作。本質(zhì)上是一些清理和
準備工作贰拿，因為此時的 HDFS 在物理上還是不存在的蛤袒。

hdfs namenode -format 或者 hadoop namenode –format

準備啟動

第一臺機器執(zhí)行以下命令

cd  /export/servers/hadoop-2.7.5/
bin/hdfs namenode -format
sbin/start-dfs.sh
sbin/start-yarn.sh
sbin/mr-jobhistory-daemon.sh start historyserver

三個端口查看界面

http://node01:50070/explorer.html#/ 查看hdfs

http://node01:8088/cluster 查看yarn集群

http://node01:19888/jobhistory 查看歷史完成的任務

測試1,分布式存儲的測試
hdfs dfs -put baoqiang.txt /

測試2,分布式計算的測試
cd /export/servers/hadoop-2.7.5/share/hadoop/mapreduce/
hadoop jar hadoop-mapreduce-examples-2.7.5.jar pi 2 10

?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市膨更，隨后出現(xiàn)的幾起案子妙真，更是在濱河造成了極大的恐慌，老刑警劉巖荚守，帶你破解...
沈念sama閱讀 218,546評論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件珍德，死亡現(xiàn)場離奇詭異，居然都是意外死亡矗漾，警方通過查閱死者的電腦和手機锈候，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,224評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來敞贡，“玉大人泵琳，你說我怎么就攤上這事。” “怎么了获列？”我有些...
開封第一講書人閱讀 164,911評論 0贊 354
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵谷市，是天一觀的道長。經(jīng)常有香客問我击孩，道長迫悠，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 58,737評論 1贊 294
?港島之戀（遺憾婚禮）
正文為了忘掉前任溯壶，我火速辦了婚禮及皂，結果婚禮上，老公的妹妹穿的比我還像新娘且改。我一直安慰自己验烧，他們只是感情好，可當我...
茶點故事閱讀 67,753評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布又跛。她就那樣靜靜地躺著碍拆，像睡著了一般。火紅的嫁衣襯著肌膚如雪慨蓝。梳的紋絲不亂的頭發(fā)上感混，一...
開封第一講書人閱讀 51,598評論 1贊 305
城市分裂傳說
那天，我揣著相機與錄音礼烈，去河邊找鬼弧满。笑死，一個胖子當著我的面吹牛此熬，可吹牛的內(nèi)容都是我干的庭呜。我是一名探鬼主播，決...
沈念sama閱讀 40,338評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼犀忱，長吁一口氣：“原來是場噩夢啊……” “哼募谎！你這毒婦竟也來了？” 一聲冷哼從身側響起阴汇，我...
開封第一講書人閱讀 39,249評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤数冬，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后搀庶，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 45,696評論 1贊 314
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡哥倔，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 37,888評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年秸架，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片未斑。...
茶點故事閱讀 40,013評論 1贊 348
活死人
序言：一個原本活蹦亂跳的男人離奇死亡咕宿，死狀恐怖币绩，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情府阀，我是刑警寧澤缆镣，帶...
沈念sama閱讀 35,731評論 5贊 346
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站试浙，受9級特大地震影響董瞻，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜田巴，卻給世界環(huán)境...
茶點故事閱讀 41,348評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一钠糊、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧壹哺，春花似錦抄伍、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,929評論 0贊 22
一樁弒父案截珍，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至箩朴，卻和暖如春岗喉，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背炸庞。一陣腳步聲響...
開封第一講書人閱讀 33,048評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工钱床，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人埠居。一個月前我還...
沈念sama閱讀 48,203評論 3贊 370
代替公主和親
正文我出身青樓查牌，卻偏偏與公主長得像，于是被迫代替她去往敵國和親拐格。傳聞我的和親對象是個殘疾皇子僧免，可洞房花燭夜當晚...
茶點故事閱讀 44,960評論 2贊 355

Hadoop概述

Hadoop

1、 Hadoop的介紹

2捆憎、hadoop的歷史版本和發(fā)行版公司

2.1 Hadoop歷史版本

2.2 Hadoop三大發(fā)行版公司

3、hadoop的架構模型

1.x的版本架構模型介紹

2.x的版本架構模型介紹

4罐韩、appache版本hadoop重新編譯

4.1為什么要編譯hadoop

4.2編譯環(huán)境的準備

4.2.1：準備linux環(huán)境

4.2.2：虛擬機聯(lián)網(wǎng)矾睦，關閉防火墻晦款，關閉selinux

4.2.3：安裝jdk1.7

4.2.4：安裝maven

4.2.5：安裝findbugs

4.2.6：在線安裝一些依賴包

4.2.7：安裝protobuf

4.2.8、安裝snappy

4.2.9：編譯hadoop源碼

5股囊、Hadoop安裝

第一步：上傳apache hadoop包并解壓

第二步：修改配置文件

修改core-site.xml

修改hdfs-site.xml

修改hadoop-env.sh

修改mapred-site.xml

修改yarn-site.xml

修改mapred-env.sh

修改slaves

第三步：配置hadoop的環(huán)境變量

第四步：啟動集群

推薦閱讀更多精彩內(nèi)容