hadoop-2.7.4集群的安裝配置

hadoop集群的安裝配置

簡(jiǎn)介

Apache?Hadoop?項(xiàng)目是一個(gè)可靠的，可擴(kuò)展的分布式計(jì)算的開(kāi)源軟件秽浇。

Apache Hadoop軟件庫(kù)是一個(gè)框架，允許使用簡(jiǎn)單的編程模型跨計(jì)算機(jī)群集分布式處理大型數(shù)據(jù)集。它旨在從單臺(tái)服務(wù)器擴(kuò)展到數(shù)千臺(tái)機(jī)器句灌，每臺(tái)機(jī)器提供本地計(jì)算和存儲(chǔ)。該庫(kù)本身不是依靠硬件來(lái)提供高可用性欠拾，而是設(shè)計(jì)用于在應(yīng)用層檢測(cè)和處理故障胰锌，從而在一組計(jì)算機(jī)之上提供高可用性服務(wù)，每個(gè)計(jì)算機(jī)都可能出現(xiàn)故障藐窄。

該項(xiàng)目包括這些模塊：

Hadoop Common：支持其他Hadoop模塊的常用實(shí)用程序
Hadoop Distributed File System (HDFS?)：提供對(duì)應(yīng)用程序數(shù)據(jù)的高吞吐量訪問(wèn)的分布式文件系統(tǒng)资昧。
Hadoop YARN：作業(yè)調(diào)度和集群資源管理的框架。
Hadoop MapReduce：一個(gè)用于并行處理大型數(shù)據(jù)集的基于YARN的系統(tǒng)荆忍。

安裝配置

1. 安裝jdk

集群中的每臺(tái)服務(wù)器都需要安裝jdk,步驟如下：
cd /opt
wget http://download.oracle.com/otn-pub/java/jdk/8u151-b12/e758a0de34e24606bca991d704f6dcbf/jdk-8u151-linux-x64.tar.gz
tar -zxvf jdk-8u151-linux-x64.tar.gz
sudo vim /etc/profile
接下來(lái)格带，在文件最后面添加jdk路徑，并保存退出:
#java
export JAVA_HOME=/opt/jdk1.8.0_144
export JRE_HOME=/opt/jdk1.8.0_144/jre
export CLASSPATH=$JAVA_HOME/lib
export PATH=:$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
最后是文件生效东揣，執(zhí)行命令：
source /etc/profile
查看版本践惑，命令：
java -version

2. 修改主機(jī)名及ip映射

集群中的每臺(tái)服務(wù)器都需要配置,步驟如下：
vim /etc/hosts
打開(kāi)文件后，添加或修改相應(yīng)的映射(ip 主機(jī)名)嘶卧，例如如下：
10.24.106.80 spark.datanode1
10.24.106.81 spark.datanode2
10.24.106.82 spark.namenode
vim /etc/hostname
打開(kāi)文件后尔觉，修改主機(jī)名，和/etc/hosts文件中相同芥吟。
最后需要重啟使其生效

3. 創(chuàng)建用戶

集群中的每臺(tái)服務(wù)器都需要?jiǎng)?chuàng)建,步驟如下：
命令如下：    
useradd hadoop #創(chuàng)建用戶名為hadoop的用戶
passwd hadoop #為hadoop用戶設(shè)置密碼
接下來(lái)侦铜，為hadoop用戶賦予root權(quán)限，命令：
vim /etc/sudoers
在該文件中加入下面一行內(nèi)容,并保存退出(修改文件內(nèi)容需要更改文件的權(quán)限钟鸵，保存退出之后钉稍，需要把權(quán)限再次更改回去)：
hadoop    ALL=(ALL:ALL)       ALL
最后使用hadoop用戶登錄系統(tǒng)

4. 主機(jī)之間通過(guò)ssh無(wú)密鑰登錄

集群中的每臺(tái)服務(wù)器都需要配置,步驟如下：
cd /home
下邊命令用于生成公鑰(id_rsa.pub)和私鑰(id_rsa)，并鍵入下面命令后一直回車(chē)就可以了棺耍，密鑰在/home/.ssh目錄下贡未。
ssh-keygen -t rsa -P ''
cd .ssh
接下來(lái)把所有服務(wù)器生成的公鑰全部追加進(jìn)authorized_keys文件中，意思就是這個(gè)文件中有集群中所有服務(wù)器的公鑰蒙袍，該文件在.ssh目錄下俊卤，如沒(méi)有該文件可以自己創(chuàng)建一個(gè)。
最后把擁有集群中所有服務(wù)器的公鑰的這個(gè)文件通過(guò)scp命令遠(yuǎn)程復(fù)制到每臺(tái)服務(wù)器中,相當(dāng)于每臺(tái)服務(wù)器的authorized_keys文件中內(nèi)容相同害幅。
現(xiàn)在可以通過(guò)ssh免密碼來(lái)遠(yuǎn)程登錄其他服務(wù)器了(第一次需要消恍，后面在登陸就不需要了)，例如：
ssh 10.24.106.80

5. 安裝hadoop

cd /opt
wget http://mirror.stjschools.org/public/apache/hadoop/common/hadoop-2.7.4/hadoop-2.7.4-src.tar.gz
tar -zxvf hadoop-2.7.4-src.tar.gz
添加環(huán)境變量：
vim /etc/profile
在文件中追加下面內(nèi)容以现，并保存退出后狠怨，在使其文件生效约啊。
#hadoop
export PATH=${HADOOP_HOME}/bin:$PATH
export HADOOP_HOME=/opt/hadoop-2.7.4/
現(xiàn)在創(chuàng)建數(shù)據(jù)存放目錄：
可以先通過(guò)命令df -h 查看一下那個(gè)磁盤(pán)下空間比較多，就把數(shù)據(jù)放在相應(yīng)的目錄下佣赖，例如：
cd /home
mkdir -p hadoop/dfs/data
mkdir -p hadoop/dfs/name
mkdir -p hadoop/tmp
上面目錄用于存放數(shù)據(jù)需要大一點(diǎn)的空間恰矩。
cd hadoop-2.7.4
接下來(lái)進(jìn)入配置目錄，進(jìn)行相應(yīng)的配置：
cd etc/hadoop
1. 編輯hadoop-env.sh文件
找到 JAVA_HOME 改為 JDK 的安裝目錄,例如如下：
export JAVA_HOME=/opt/jdk1.8.0_144
2. 編輯slaves文件添加從服務(wù)器的主機(jī)名
例如如下(下面兩臺(tái)服務(wù)器為slaves):
spark.datanode1
spark.datanode2
3. 編輯core-site.xml文件
vim core-site.xml
添加如下內(nèi)容：
<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://spark.namenode:9002</value>
    </property>
    <property>
        <name>io.file.buffer.size</name>
        <value>131072</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/home/hadoop/tmp</value>
        <description>Abase for other temporary   directories.</description>
    </property>
</configuration>

最后保存退出
配置解釋?zhuān)?第一個(gè)value值是<value>hdfs://你的主服務(wù)器的主機(jī)名:端口(默認(rèn)為9000茵汰，若該端口被占可以更換其他的)</value>
第二個(gè)value值是<value>序列文件中使用的讀/寫(xiě)緩沖區(qū)的大小(一般為131072)</value>
第三個(gè)value值是<value>file:/hadoop的臨時(shí)目錄(上面已經(jīng)提前創(chuàng)建了)</value>
4. 編輯hdfs-site.xml文件
vim hdfs-site.xml
添加如下內(nèi)容：
<configuration>
   <property>
          <name>dfs.namenode.secondary.http-address</name>
          <value>spark.namenode:9001</value>
   </property>
   <property>
         <name>dfs.namenode.name.dir</name>
         <value>file:/home/hadoop/dfs/name</value>
   </property>
   <property>
          <name>dfs.datanode.data.dir</name>
          <value>file:/home/hadoop/dfs/data</value>
   </property>
   <property>
           <name>dfs.replication</name>
           <value>3</value>
   </property>
   <property>
           <name>dfs.webhdfs.enabled</name>
           <value>true</value>
   </property>
</configuration>
5. 編輯mapred-site.xml
首先復(fù)制mapred-site.xml.template文件,并命名為mapred-site.xml
cp mapred-site.xml.template mapred-site.xml
vim mapred-site.xml
添加以下內(nèi)容：
<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>spark.namenode:10020</value>
    </property>
    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>spark.namenode:19888</value>
    </property>
</configuration>
6. 編輯yarn-site.xml文件
vim yarn-site.xml
<configuration>
    <property>
            <name>yarn.nodemanager.aux-services</name>
            <value>mapreduce_shuffle</value>
    </property>
    <property>
            <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
            <value>org.apache.hadoop.mapred.ShuffleHandler</value>
    </property>
    <property>
            <name>yarn.resourcemanager.address</name>
            <value>spark.namenode:8032</value>
    </property>
    <property>
            <name>yarn.resourcemanager.scheduler.address</name>
            <value>spark.namenode:8030</value>
    </property>
    <property>
            <name>yarn.resourcemanager.resource-tracker.address</name>
            <value>spark.namenode:8031</value>
    </property>
    <property>
            <name>yarn.resourcemanager.admin.address</name>
            <value>spark.namenode:8033</value>

    </property>
    <property>
            <name>yarn.resourcemanager.webapp.address</name>
            <value>spark.namenode:8088</value>
    </property>
</configuration>
所有配置已經(jīng)完成枢里。
接下來(lái)，該hadoop-2.7.4文件夾分發(fā)給集群中的各個(gè)服務(wù)器蹂午，使用scp遠(yuǎn)程復(fù)制命令,例如：
scp -r hadoop-2.7.4 hadoop@spark.datanode1:/opt
scp -r hadoop-2.7.4 hadoop@spark.datanode2:/opt
首次啟動(dòng)HDFS時(shí)栏豺，必須格式化。 將一個(gè)新的分布式文件系統(tǒng)格式化為hdfs豆胸，在master上執(zhí)行如下命令：
cd hadoop-2.7.4
./bin/hadoop namenode -format
啟動(dòng)hadoop
./sbin/start-dfs.sh
./sbin/start-yarn.sh
./sbin/mr-jobhistory-daemon.sh start historyserver
查看進(jìn)程服務(wù)奥洼，命令如下：
jps
在master上可以看到
namenode
secondarynamenode
resourcemanager
在slaves上看到：
datanode
nodemanager
查看端口占用情況,命令如下：
netstat -tupln
最后訪問(wèn)web-ui頁(yè)面
namenode頁(yè)面
http://10.24.106.82:50070 
resourcemanager頁(yè)面
http://10.24.106.82:8088
歷史任務(wù)界面
http://10.24.106.82.19888

END

最后編輯于：2019.05.23 11:53:29

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市晚胡，隨后出現(xiàn)的幾起案子灵奖，更是在濱河造成了極大的恐慌，老刑警劉巖估盘，帶你破解...
沈念sama閱讀 206,311評(píng)論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件瓷患，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡遣妥，警方通過(guò)查閱死者的電腦和手機(jī)擅编，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,339評(píng)論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)箫踩，“玉大人爱态，你說(shuō)我怎么就攤上這事【持樱” “怎么了锦担？”我有些...
開(kāi)封第一講書(shū)人閱讀 152,671評(píng)論 0贊 342
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)慨削。經(jīng)常有香客問(wèn)我洞渔，道長(zhǎng)，這世上最難降的妖魔是什么缚态？我笑而不...
開(kāi)封第一講書(shū)人閱讀 55,252評(píng)論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任磁椒，我火速辦了婚禮，結(jié)果婚禮上猿规，老公的妹妹穿的比我還像新娘衷快。我一直安慰自己宙橱，他們只是感情好姨俩，可當(dāng)我...
茶點(diǎn)故事閱讀 64,253評(píng)論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布蘸拔。她就那樣靜靜地躺著，像睡著了一般环葵。火紅的嫁衣襯著肌膚如雪调窍。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書(shū)人閱讀 49,031評(píng)論 1贊 285
城市分裂傳說(shuō)
那天张遭，我揣著相機(jī)與錄音邓萨，去河邊找鬼。笑死菊卷，一個(gè)胖子當(dāng)著我的面吹牛缔恳，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播洁闰，決...
沈念sama閱讀 38,340評(píng)論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼歉甚，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了扑眉？” 一聲冷哼從身側(cè)響起纸泄，我...
開(kāi)封第一講書(shū)人閱讀 36,973評(píng)論 0贊 259
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎腰素，沒(méi)想到半個(gè)月后聘裁，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 43,466評(píng)論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡弓千，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,937評(píng)論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年衡便，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片计呈。...
茶點(diǎn)故事閱讀 38,039評(píng)論 1贊 333
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡砰诵，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出捌显，到底是詐尸還是另有隱情茁彭，我是刑警寧澤，帶...
沈念sama閱讀 33,701評(píng)論 4贊 323
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布扶歪，位于F島的核電站理肺，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏善镰。R本人自食惡果不足惜妹萨，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,254評(píng)論 3贊 307
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望炫欺。院中可真熱鬧乎完，春花似錦、人聲如沸品洛。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 30,259評(píng)論 0贊 19
一樁弒父案摩桶，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至帽揪，卻和暖如春硝清，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背转晰。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 31,485評(píng)論 1贊 262
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工芦拿，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人查邢。一個(gè)月前我還...
沈念sama閱讀 45,497評(píng)論 2贊 354
代替公主和親
正文我出身青樓蔗崎，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親扰藕。傳聞我的和親對(duì)象是個(gè)殘疾皇子蚁趁，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,786評(píng)論 2贊 345