準(zhǔn)備三個(gè)虛擬機(jī)
使用vagrant安裝虛擬機(jī)環(huán)境
1庸疾、首先安裝jdk(三臺(tái)機(jī)器都需要)
http://www.reibang.com/p/8829bc3a9217
2面氓、安裝hadoop2.9.2 下載hadoop2.9.2拳恋,下載地址:http://archive.apache.org/dist/hadoop/core/
放到 /opt 目錄下 掰读,解壓
tar -zxvf hadoop-2.9.2.tar.gz
mv hadoop-2.9.2 hadoop
配置hadoop環(huán)境變量 vi /etc/profile 添加如下配置
export HADOOP_HOME=/opt/hadoop
export PATH=$HADOOP_HOME/bin:$PATH
重新刷新配置 source /etc/profile,查看版本 hadoop version
配置env文件
vi /opt/hadoop/etc/hadoop/hadoop-env.sh
找到 “ export JAVA_HOME ” 這行周循,用來配置jdk路徑植兰,修改為:export JAVA_HOME=/opt/jdk1.8
配置核心組件文件
Hadoop的核心組件文件是core-site.xml,用vi編輯core-site.xml文件雇庙,需要將下面的配置代碼放在文件的<configuration>和</configuration>之間谓形。
執(zhí)行編輯core-site.xml文件的命令:
vi /opt/hadoop/etc/hadoop/core-site.xml
需要在<configuration>和</configuration>之間加入的代碼:
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop/tmp</value>
</property>
編輯完成后,退出并保存即可疆前!
配置文件系統(tǒng)
Hadoop的文件系統(tǒng)配置文件是hdfs-site.xml寒跳,用vi編輯該文件,需要將以下代碼放在文件的<configuration>和</configuration>之間竹椒。
執(zhí)行編輯hdfs-site.xml文件的命令:
vi /opt/hadoop/etc/hadoop/hdfs-site.xml
需要在<configuration>和</configuration>之間加入的代碼:
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
編輯完成后童太,退出保存即可!
配置 yarn-site.xml 文件
Yarn的站點(diǎn)配置文件是yarn-site.xml胸完,依然用vi編輯該文件书释,將以下代碼放在文件的<configuration>和</configuration>之間。
執(zhí)行編輯yarn-site.xml文件的命令:
vi /opt/hadoop/etc/hadoop/yarn-site.xml
需要在<configuration>和</configuration>之間加入的代碼:
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.address</name>
<value>master:18040</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>master:18030</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>master:18025</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address</name>
<value>master:18141</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>master:18088</value>
</property>
配置MapReduce計(jì)算框架文件
在/opt/hadoop/etc/hadoop目錄下赊窥,系統(tǒng)已經(jīng)有一個(gè)mapred-site.xml.template文件爆惧,我們需要將其復(fù)制并改名,位置不變锨能。
執(zhí)行復(fù)制和改名操作命令:
cp mapred-site.xml.template mapred-site.xml
然后 vi mapred-site.xml 文件扯再,需要將下面的代碼填充到文件的<configuration>和</configuration>之間。
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
配置master的slaves文件
slaves文件給出了Hadoop集群的slave節(jié)點(diǎn)列表址遇,該文件十分的重要熄阻,因?yàn)閱?dòng)Hadoop的時(shí)候,系統(tǒng)總是根據(jù)當(dāng)前slaves文件中的slave節(jié)點(diǎn)名稱列表啟動(dòng)集群倔约,不在列表中的slave節(jié)點(diǎn)便不會(huì)被視為計(jì)算節(jié)點(diǎn)秃殉。
執(zhí)行編輯slaves文件命令:
vi /opt/hadoop/etc/hadoop/slaves
注意:vi slaves 文件,應(yīng)該根據(jù)讀者您自己所搭建集群的實(shí)際情況進(jìn)行編輯浸剩。
例如:我這里已經(jīng)安裝了slave0和slave1钾军,并且計(jì)劃將它們?nèi)客度際adoop集群運(yùn)行。
所以應(yīng)當(dāng)加入以下代碼:
slave0
slave1
注意:刪除slaves文件中原來localhost那一行绢要!
復(fù)制master上的Hadoop到slave節(jié)點(diǎn)
通過復(fù)制master節(jié)點(diǎn)上的hadoop吏恭,能夠大大提高系統(tǒng)部署效率,假設(shè)我們有200臺(tái)需要配置…筆者豈不白頭
由于我這里有slave0和slave1袖扛,所以復(fù)制兩次砸泛。
scp -r /opt/hadoop root@192.168.56.101:/opt
scp -r /opt/hadoop root@192.168.56.102:/opt
Hadoop集群的啟動(dòng)-配置操作系統(tǒng)環(huán)境變量(三個(gè)節(jié)點(diǎn)都做)
vi ~/.bash_profile
最后把以下代碼追加到文件的尾部:
#HADOOP
export HADOOP_HOME=/opt/hadoop
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
保存退出后十籍,執(zhí)行命令:source ~/.bash_profile
創(chuàng)建Hadoop數(shù)據(jù)目錄(只在master做)
mkdir /opt/hadoopdata
格式化文件系統(tǒng)(只在master做)
hadoop namenode -format
啟動(dòng)和關(guān)閉Hadoop集群(只在master做)
cd /opt/hadoop/sbin
start-all.sh
參考:
https://blog.csdn.net/weixin_44198965/article/details/89603788