Docker創(chuàng)建的集群下使用ansible部署hadoop

基礎(chǔ)環(huán)境

MBP, Palallels Desktop, Centos7

關(guān)鍵詞

docker, ansible, hadoop

集群架構(gòu)

集群包含4臺“虛擬主機(jī)”，采用Docker創(chuàng)建容器的方式創(chuàng)建噪伊，無需創(chuàng)建多臺虛擬機(jī)竹握，簡單方便薪缆。

OS	hostname	IP
Centos7	cluster-master	172.18.0.2
Centos7	cluster-slave1	172.18.0.3
Centos7	cluster-slave1	172.18.0.4
Centos7	cluster-slave1	172.18.0.5

Docker

docker 安裝

登錄到Centos 7寄主機(jī)中安裝docker

[root@centos-linux ~]# yum -y install docker.x86_64

啟動docker服務(wù)

[root@centos-linux ~]# systemctl start docker

Centos鏡像拉取

國內(nèi)使用docker.io拉取鏡像的時候非常慢烛缔，所以找了鏡像倉庫進(jìn)行拉取怒竿。
本次用到的鏡像倉庫是http://hub.daocloud.io, 在搜索欄中輸入centos并搜索

搜索centos

搜索結(jié)果

Centos鏡像描述

在檢索到的鏡像詳情右側(cè)給出了pull的命令荠雕，直接運(yùn)行即可稳其。

[root@centos-linux ~]# docker pull daocloud.io/library/centos:latest

拉取完成之后可以看到

[root@centos-linux ~]# docker images
REPOSITORY                   TAG                 IMAGE ID            CREATED             SIZE
daocloud.io/library/centos   latest              328edcd84f1b        3 weeks ago         192.5 MB

創(chuàng)建容器

按照集群的架構(gòu)驶赏，創(chuàng)建容器時需要設(shè)置固定IP，所以先要在docker下創(chuàng)建固定IP的子網(wǎng)

[root@centos-linux ~]# docker network create --subnet=172.18.0.0/16 netgroup

docker的子網(wǎng)創(chuàng)建完成之后就可以創(chuàng)建固定IP的容器了

[root@centos-linux ~]# docker run -d --privileged -ti -v /sys/fs/cgroup:/sys/fs/cgroup --name cluster-master -h cluster-master --net netgroup --ip 172.18.0.2 daocloud.io/library/centos /usr/sbin/init
[root@centos-linux ~]# docker run -d --privileged -ti -v /sys/fs/cgroup:/sys/fs/cgroup --name cluster-slave1 -h cluster-slave1 --net netgroup --ip 172.18.0.3 daocloud.io/library/centos /usr/sbin/init
[root@centos-linux ~]# docker run -d --privileged -ti -v /sys/fs/cgroup:/sys/fs/cgroup --name cluster-slave2 -h cluster-slave2 --net netgroup --ip 172.18.0.4 daocloud.io/library/centos /usr/sbin/init
[root@centos-linux ~]# docker run -d --privileged -ti -v /sys/fs/cgroup:/sys/fs/cgroup --name cluster-slave3 -h cluster-slave3 --net netgroup --ip 172.18.0.5 daocloud.io/library/centos /usr/sbin/init

在Centos7下使用簡單方式創(chuàng)建容器后遇到sshd啟動失敗的問題既鞠，所以需要添加參數(shù)--privileged和-v /sys/fs/cgroup:/sys/fs/cgroup煤傍，并在啟動的時候運(yùn)行/usr/sbin/init。

openssh

創(chuàng)建的centos容器中并沒有預(yù)裝ssh服務(wù)嘱蛋，需要登錄到所有容器中手動安裝蚯姆。

登錄容器

[root@centos-linux ~]# docker ps -a
CONTAINER ID        IMAGE                        COMMAND             CREATED             STATUS              PORTS               NAMES
328913df0d52        daocloud.io/library/centos   "/usr/sbin/init"    1 hours ago        Up 1 hours                             cluster-slave3
83361d4bf079        daocloud.io/library/centos   "/usr/sbin/init"    1 hours ago        Up 1 hours                             cluster-slave2
35d1e5732340        daocloud.io/library/centos   "/usr/sbin/init"    1 hours ago        Up 1 hours                             cluster-slave1
37fbcc24b0e3        daocloud.io/library/centos   "/usr/sbin/init"    1 hours ago        Up 1 hours                             cluster-master

[root@centos-linux ~]# docker exec -it 37fbcc24b0e3 /bin/bash

安裝openssh

[root@cluster-master /]# yum -y install openssh openssh-server openssh-clients

啟動ssh服務(wù)

[root@cluster-master /]# systemctl start sshd

ssh自動接受新的公鑰

master設(shè)置ssh登錄自動添加kown_hosts
vi編輯/etc/ssh/ssh_config配置文件
設(shè)置StrictHostKeyChecking為no

cluster-master公鑰分發(fā)

在master機(jī)上執(zhí)行ssh-keygen -t rsa并一路回車，完成之后會生成~/.ssh目錄洒敏，目錄下有id_rsa（私鑰文件）和id_rsa.pub（公鑰文件）龄恋，再將id_rsa.pub重定向到文件authorized_keys

[root@cluster-master /]# cd ~/.ssh
[root@cluster-master /]# cat id_rsa.pub>authorized_keys

文件生成之后用scp將公鑰文件分發(fā)到集群slave主機(jī)

[root@cluster-master /]# ssh root@cluster-slave1 'mkdir ~/.ssh'
[root@cluster-master /]# scp ~/.ssh/authorized_keys root@cluster-slave1:~/.ssh
[root@cluster-master /]# ssh root@cluster-slave2 'mkdir ~/.ssh'
[root@cluster-master /]# scp ~/.ssh/authorized_keys root@cluster-slave2:~/.ssh
[root@cluster-master /]# ssh root@cluster-slave3 'mkdir ~/.ssh'
[root@cluster-master /]# scp ~/.ssh/authorized_keys root@cluster-slave3:~/.ssh

分發(fā)完成之后測試是否已經(jīng)可以免輸入密碼登錄。另外本次實驗使用到了root用戶凶伙，如果在其他用戶下使用免密碼登錄郭毕，需要確保用戶對~/.ssh/authorized_keys文件有可操作權(quán)限。

Ansible

源碼安裝ansible

使用git將文件安裝在cluster-master的/opt目錄下镊靴，因為無需agent铣卡，所以安裝在一臺主控機(jī)上即可管理集群。容器中的centos沒有預(yù)裝git偏竟，在安裝之前需要事先安裝git:

[root@cluster-master /]# yum -y install git

在/opt下執(zhí)行

[root@cluster-master opt]# git clone git://github.com/ansible/ansible.git --recursive

在執(zhí)行ansible的env-setup之前需要安裝一些容器中沒有預(yù)裝的軟件包

[root@cluster-master opt]# yum -y install python-setuptools
[root@cluster-master opt]# easy_install pip
[root@cluster-master opt]# pip install paramiko PyYAML Jinja2 httplib2 six

進(jìn)入ansible目錄煮落，執(zhí)行安裝腳本

[root@cluster-master opt]# cd ./ansible
[root@cluster-master ansible]# source ./hacking/env-setup

配置ansible hosts

創(chuàng)建/opt/ansible/hosts文件，并將cluster內(nèi)的主機(jī)按組的方式寫入該文件

[cluster]
cluster-master
cluster-slave1
cluster-slave2
cluster-slave3

[master]
cluster-master

[slaves]
cluster-slave1
cluster-slave2
cluster-slave3

配置docker容器hosts

/etc/hosts文件在容器啟動時被重寫踊谋，直接修改內(nèi)容在容器重啟后不能保留蝉仇，為了讓容器在重啟之后獲取集群hosts，使用了一種啟動容器后重寫hosts的方法殖蚕。
需要在~/.bashrc中追加以下指令

:>/etc/hosts
cat >>/etc/hosts<<EOF
127.0.0.1   localhost
172.18.0.2  cluster-master
172.18.0.3  cluster-slave1
172.18.0.4  cluster-slave2
172.18.0.5  cluster-slave3
EOF

運(yùn)行source ~/.bashrc使之生效
這時可以看到/etc/hosts文件已經(jīng)被改為需要的內(nèi)容

[root@cluster-master ansible]# cat /etc/hosts
127.0.0.1   localhost
172.18.0.2  cluster-master
172.18.0.3  cluster-slave1
172.18.0.4  cluster-slave2
172.18.0.5  cluster-slave3

用ansible分發(fā).bashrc至集群slave下

ansible cluster -m copy -a "src=~/.bashrc dest=~/"

Hadoop

在集群中安裝openjdk

使用ansible在在集群中安裝openjdk

[root@cluster-master ansible]# ansible cluster -m yum -a "name=java-1.8.0-openjdk,java-1.8.0-openjdk-devel state=latest"

在cluster-master上安裝hadoop

將hadoop安裝包下載至/opt目錄下

[root@cluster-master opt]# wget http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.7.4/hadoop-2.7.4.tar.gz

下載完成之后解壓安裝包轿衔，并創(chuàng)建鏈接文件

[root@cluster-master opt]# tar -xzvf hadoop-2.7.4.tar.gz
[root@cluster-master opt]# ln -s hadoop-2.7.4 hadoop

設(shè)置java和hadoop環(huán)境變量(.bashrc)

# java
export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-1.8.0.141-1.b16.el7_3.x86_64
export PATH=$HADOOP_HOME/bin:$PATH
# hadoop
export HADOOP_HOME=/opt/hadoop
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

修改hadoop運(yùn)行所需配置文件

core-site.xml

<configuration>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/home/hadoop/tmp</value>
        <description>A base for other temporary directories.</description>
    </property>
    <!-- file system properties -->
    <property>
        <name>fs.default.name</name>
       <value>hdfs://cluster-master:9000</value>
    </property>
</configuration>

hdfs-site.xml

<configuration>
    <property>
        <name>dfs.replication</name>
        <value>3</value>
    </property>
</configuration>

mapred-site.xml

<configuration>
    <property>
        <name>mapred.job.tracker</name>
        <value>http://cluster-master:9001</value>
    </property>
</configuration>

yarn-site.xml

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.resourcemanager.address</name>
        <value>master:18040</value>
    </property>
</configuration>

打包hadoop文件

將hadoop鏈接文件和hadoop-2.7.4打包成一個文件方便ansible分發(fā)到slave主機(jī)

[root@cluster-master opt]# tar -cvf hadoop-dis.tar hadoop hadoop-2.7.4

使用ansible-playbook分發(fā).bashrc和hadoop-dis.tar至slave主機(jī)

---
- hosts: cluster
  tasks:
    - name: copy .bashrc to slaves
      copy: src=~/.bashrc dest=~/
      notify:
        - exec source
    - name: copy hadoop-dis.tar to slaves
      unarchive: src=/opt/hadoop-dis.tar dest=/opt

  handlers:
    - name: exec source
      shell: source ~/.bashrc

將以上yaml保存為hadoop-dis.yaml，并執(zhí)行

[root@cluster-master opt]# ansible-playbook hadoop-dis.yaml

hadoop-dis.tar會自動解壓到slave主機(jī)的/opt目錄下睦疫。

格式化namenode

[root@cluster-master opt]# hadoop namenode -format

啟動hadoop集群

到這一步已經(jīng)可以開始hadoop之旅了害驹，啟動比較簡單，在$HADOOP_HOME/sbin下有幾個啟動和停止的腳本如下：

[root@cluster-master opt]# cd $HADOOP_HOME/sbin
[root@cluster-master sbin]# ls -l
total 120
-rwxr-xr-x. 1 20415 101 2752 Aug  1 00:35 distribute-exclude.sh
-rwxr-xr-x. 1 20415 101 6452 Aug  1 00:35 hadoop-daemon.sh
-rwxr-xr-x. 1 20415 101 1360 Aug  1 00:35 hadoop-daemons.sh
-rwxr-xr-x. 1 20415 101 1640 Aug  1 00:35 hdfs-config.cmd
-rwxr-xr-x. 1 20415 101 1427 Aug  1 00:35 hdfs-config.sh
-rwxr-xr-x. 1 20415 101 2291 Aug  1 00:35 httpfs.sh
-rwxr-xr-x. 1 20415 101 3128 Aug  1 00:35 kms.sh
-rwxr-xr-x. 1 20415 101 4080 Aug  1 00:35 mr-jobhistory-daemon.sh
-rwxr-xr-x. 1 20415 101 1648 Aug  1 00:35 refresh-namenodes.sh
-rwxr-xr-x. 1 20415 101 2145 Aug  1 00:35 slaves.sh
-rwxr-xr-x. 1 20415 101 1779 Aug  1 00:35 start-all.cmd
-rwxr-xr-x. 1 20415 101 1471 Aug  1 00:35 start-all.sh
-rwxr-xr-x. 1 20415 101 1128 Aug  1 00:35 start-balancer.sh
-rwxr-xr-x. 1 20415 101 1401 Aug  1 00:35 start-dfs.cmd
-rwxr-xr-x. 1 20415 101 3734 Aug  1 00:35 start-dfs.sh
-rwxr-xr-x. 1 20415 101 1357 Aug  1 00:35 start-secure-dns.sh
-rwxr-xr-x. 1 20415 101 1571 Aug  1 00:35 start-yarn.cmd
-rwxr-xr-x. 1 20415 101 1347 Aug  1 00:35 start-yarn.sh
-rwxr-xr-x. 1 20415 101 1770 Aug  1 00:35 stop-all.cmd
-rwxr-xr-x. 1 20415 101 1462 Aug  1 00:35 stop-all.sh
-rwxr-xr-x. 1 20415 101 1179 Aug  1 00:35 stop-balancer.sh
-rwxr-xr-x. 1 20415 101 1455 Aug  1 00:35 stop-dfs.cmd
-rwxr-xr-x. 1 20415 101 3206 Aug  1 00:35 stop-dfs.sh
-rwxr-xr-x. 1 20415 101 1340 Aug  1 00:35 stop-secure-dns.sh
-rwxr-xr-x. 1 20415 101 1642 Aug  1 00:35 stop-yarn.cmd
-rwxr-xr-x. 1 20415 101 1340 Aug  1 00:35 stop-yarn.sh
-rwxr-xr-x. 1 20415 101 4295 Aug  1 00:35 yarn-daemon.sh
-rwxr-xr-x. 1 20415 101 1353 Aug  1 00:35 yarn-daemons.sh

主要使用HDFS蛤育，啟動start-dfs.sh即可

[root@cluster-master sbin]# ./start-dfs.sh
Starting namenodes on [cluster-master]
cluster-master: starting namenode, logging to /opt/hadoop-2.7.4/logs/hadoop-root-namenode-cluster-master.out
cluster-slave1: starting datanode, logging to /opt/hadoop-2.7.4/logs/hadoop-root-datanode-cluster-slave1.out
cluster-slave3: starting datanode, logging to /opt/hadoop-2.7.4/logs/hadoop-root-datanode-cluster-slave3.out
cluster-slave2: starting datanode, logging to /opt/hadoop-2.7.4/logs/hadoop-root-datanode-cluster-slave2.out
Starting secondary namenodes [0.0.0.0]
0.0.0.0: starting secondarynamenode, logging to /opt/hadoop-2.7.4/logs/hadoop-root-secondarynamenode-cluster-master.out

啟動完成之后會在master和slave看到以下進(jìn)程

cluster-master

[root@cluster-master sbin]# jps
2484 SecondaryNameNode
2648 Jps
2315 NameNode

cluster-slave

[root@cluster-slave1 logs]# jps
27502 DataNode
27583 Jps

體驗hadoop

在master端上傳文件試試

[root@cluster-master sbin]# hadoop dfs -put start-dfs.sh /
DEPRECATED: Use of this script to execute hdfs command is deprecated.
Instead use the hdfs command for it.

[root@cluster-master sbin]# hadoop dfs -ls /
DEPRECATED: Use of this script to execute hdfs command is deprecated.
Instead use the hdfs command for it.

Found 1 items
-rw-r--r--   3 root supergroup       3734 2017-08-26 10:57 /start-dfs.sh

總結(jié)

docker下部署hadoop確實比較奇葩宛官，但是對于個人學(xué)習(xí)來說確是十分簡便，不用在虛擬機(jī)里復(fù)制多套環(huán)境瓦糕，也簡化了網(wǎng)絡(luò)配置的步驟底洗，加上ansible的使用使得集群的管理更加高效。

最后編輯于：2018.01.09 16:12:58

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末咕娄，一起剝皮案震驚了整個濱河市亥揖，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌圣勒，老刑警劉巖费变，帶你破解...
沈念sama閱讀 212,454評論 6贊 493
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件摧扇，死亡現(xiàn)場離奇詭異，居然都是意外死亡胡控，警方通過查閱死者的電腦和手機(jī)扳剿，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,553評論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來昼激，“玉大人庇绽，你說我怎么就攤上這事〕壤В” “怎么了瞧掺？”我有些...
開封第一講書人閱讀 157,921評論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長凡傅。經(jīng)常有香客問我辟狈，道長，這世上最難降的妖魔是什么夏跷？我笑而不...
開封第一講書人閱讀 56,648評論 1贊 284
?港島之戀（遺憾婚禮）
正文為了忘掉前任哼转，我火速辦了婚禮，結(jié)果婚禮上槽华，老公的妹妹穿的比我還像新娘壹蔓。我一直安慰自己，他們只是感情好猫态，可當(dāng)我...
茶點(diǎn)故事閱讀 65,770評論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布佣蓉。她就那樣靜靜地躺著，像睡著了一般亲雪。火紅的嫁衣襯著肌膚如雪勇凭。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 49,950評論 1贊 291
城市分裂傳說
那天义辕，我揣著相機(jī)與錄音虾标，去河邊找鬼。笑死灌砖，一個胖子當(dāng)著我的面吹牛夺巩，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播周崭，決...
沈念sama閱讀 39,090評論 3贊 410
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼喳张！你這毒婦竟也來了续镇？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 37,817評論 0贊 268
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤销部，失蹤者是張志新（化名）和其女友劉穎摸航，沒想到半個月后制跟，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 44,275評論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡酱虎，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,592評論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年雨膨，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片读串。...
茶點(diǎn)故事閱讀 38,724評論 1贊 341
活死人
序言：一個原本活蹦亂跳的男人離奇死亡聊记，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出恢暖，到底是詐尸還是另有隱情排监，我是刑警寧澤，帶...
沈念sama閱讀 34,409評論 4贊 333
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布杰捂，位于F島的核電站舆床，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏嫁佳。R本人自食惡果不足惜挨队，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 40,052評論 3贊 316
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望蒿往。院中可真熱鬧盛垦，春花似錦、人聲如沸熄浓。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,815評論 0贊 21
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽赌蔑。三九已至俯在，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間娃惯，已是汗流浹背跷乐。一陣腳步聲響...
開封第一講書人閱讀 32,043評論 1贊 266
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留趾浅，地道東北人愕提。一個月前我還...
沈念sama閱讀 46,503評論 2贊 361
代替公主和親
正文我出身青樓，卻偏偏與公主長得像皿哨，于是被迫代替她去往敵國和親浅侨。傳聞我的和親對象是個殘疾皇子溃列，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,627評論 2贊 350