折騰了四天終于做好了集群野舶,寫寫總結(jié)吧!
部署hadoop集群需要多臺(tái)服務(wù)器宰衙,鑒于資源有限平道,使用近年來(lái)比較火的docker來(lái)搭建。使用docker虛擬出四個(gè)節(jié)點(diǎn)
第一步供炼、安裝Centos一屋,部署docker:
docker要求centos的版本必須是6.5以上(我使用的是7.3)
(1)安裝必要的網(wǎng)絡(luò)工具:
#yum install-y wget
#yum install-y gcc
#yum install -y vim
#yum install -y lrzsz
#yum -y install openssh-server
#yum -y install openssh-clients
(2)安裝docker
#yum install -y docker
(3)啟動(dòng)docker?
#service docker start
(4)下載鏡像(用版本6而不用版本7是因?yàn)?有較嚴(yán)重的bug,所以選用較為穩(wěn)定的6。docker的鏡像本身下載很慢的袋哼,所以這里我用的是daocloud的加速器冀墨,那下載速度杠杠的!)
#docker pull daocloud.io/centos:6
(5)鏡像拉取完成之后啟動(dòng)鏡像
#docker run -it -h master --name master daocloud.io/library/centos:6/bin/bash
鏡像啟動(dòng)成功涛贯,宿主機(jī)控制臺(tái)會(huì)直接進(jìn)入鏡像控制臺(tái)诽嘉。
返回宿主機(jī)控制臺(tái):Ctrl + P + Q
進(jìn)入鏡像控制臺(tái): docker attach (容器名稱或ID)
第二步、制作Hadoop鏡像
(1)進(jìn)入容器控制臺(tái),開(kāi)始搭建Hadoop虫腋,在搭建之前一樣要先把基礎(chǔ)工具給裝了骄酗,Hadoop是JAVA寫的所以JDK先給裝上
#wget --no-check-certificate --no-cookies --header"Cookie: oraclelicense=accept-securebackup-cookie"http://download.oracle.com/otn-pub/java/jdk/8u131-b11/d54c1d3a095b4ff2b6607d096fa80163/jdk-8u131-linux-x64.tar.gz
#mkdir/usr/java
#tar -zxvf jdk-8u131-linux-x64.tar.gz -C/usr/java
(2)修改環(huán)境變量
#vim /etc/profile
在最下方加入JAVA配置
export PATH USER LOGNAME MAIL HOSTNAME HISTSIZE HISTCONTROL
export JAVA_HOME=/usr/java/jdk1.8.0_131
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
source一下
#source /etc/profile
(3)配置ssh免密登錄
#ssh-keygen -t rsa -P''-f ~/.ssh/id_rsa
#cat ~/.ssh/id_rsa.pub>> ~/.ssh/authorized_keys
(4)關(guān)閉sellinux
#service sshd start
(5)測(cè)試一下
#ssh master
(6)如果沒(méi)什么問(wèn)題就代表一些準(zhǔn)備就緒。完成之后開(kāi)始下載Hadoop鏡像:
#wget?http://mirrors.hust.edu.cn/apache/hadoop/common/hadoop-2.8.3/hadoop-2.8.3.tar.gz
#mkdir /usr/local/hadoop
t#ar -zxvf hadoop-2.8.0.tar.gz -C /usr/local/hadoop
(7)配置環(huán)境變量
#vim /etc/profile
在最下方加入Hadoop配置
#export HADOOP_HOME=/usr/local/hadoop/hadoop-2.8.0
#export PATH=$PATH:$HADOOP_HOME/bin
(8)修改Hadoop的配置文件悦冀,進(jìn)入Hadoop的目錄
#cd /usr/local/hadoop/hadoop-2.8.0/etc/hadoop/
在hadoop-env.sh 和 yarn-env.sh 在開(kāi)頭添加JAVA環(huán)境變量JAVA_HOME
修改hadoop core-site.xml文件(怎樣修改百度上都有套路趋翻,這里不粘貼了)
修改hdfs-site.xml文件
修改mapred-site.xml文件
修改yarn-site.xml
(9)配置三個(gè)salve節(jié)點(diǎn)所以在slaves文件中添加
slave1
slave2
slave3
(10)完成之后嘗試一下
#ldd /usr/local/hadoop/hadoop-2.8.0/lib/native/libhadoop.so.1.0.0
(11)這時(shí)提示GLIBC_2.14 required,centos6的源最高到2.12盒蟆,這里需要2.14踏烙,所以只能手動(dòng)make安裝
wget http://ftp.gnu.org/gnu/glibc/glibc-2.14.tar.gz
tar zxvf glibc-2.14.tar.gz
cd glibc-2.14
mkdirbuild
cd build
../configure --prefix=/usr/local/glibc-2.14
make
make install
ln -sf /usr/local/glibc-2.14/lib/libc-2.14.so /lib64/libc.so.6
(12)完成之后再ldd就沒(méi)有問(wèn)題了!接下來(lái)就是構(gòu)建上面做的所有操作历等,將其變成一個(gè)鏡像以便復(fù)用讨惩,先Ctrl+p和Ctrl+q返回宿主機(jī)控制臺(tái)然后輸入命令:
docker inspect? --format='{{.NetworkSettings.IPAddress}}' master
接下來(lái)逐個(gè)啟動(dòng)鏡像
docker stop master
docker rm master
docker run -it -p 50070:50070 -p 19888:19888 -p 8088:8088 -h master --name master tsk/hadoop /bin/bash
docker run -it -h slave1 --name slave1 tsk/hadoop /bin/bash
docker inspect? --format='{{.NetworkSettings.IPAddress}}' slave1
docker run -it -h slave2 --name slave2 tsk/hadoop /bin/bash
docker inspect? --format='{{.NetworkSettings.IPAddress}}' slave2
docker run -it -h slave3 --name slave3 tsk/hadoop /bin/bash
docker inspect? --format='{{.NetworkSettings.IPAddress}}' slave3
(13)然后attach到每個(gè)節(jié)點(diǎn)上面source一下配置hosts,啟動(dòng)sshd募闲,并修改/etc/hosts中的ip映射文件步脓,完成之后開(kāi)始準(zhǔn)備啟動(dòng)Hadoop
/etc/hosts文件(四臺(tái)機(jī)器都要這樣配置)
182.17.0.2? ? master
182.17.0.3? ? slave1
182.17.0.4? ? slave2
182.17.0.5? ? slave3
(14)重新編譯一下環(huán)境變量
source /etc/profile
(15)啟動(dòng)hadoop
hadoop namenode -format
/usr/local/hadoop/hadoop-2.8.0/sbin/start-all.sh