Hadoop-2.7.2集群的搭建——集群學習日記

前言

因為比賽的限制是使用Hadoop2.7.2敏簿，估在此文章下面的也是使用Hadoop2.7.2,具體下載地址為Hadoop2.7.2

開始的準備

目前在我的實驗室上有三臺Linux主機妖异，因為需要參加一個關(guān)于spark數(shù)據(jù)分析的比賽弄贿，所以眼見那幾臺服務器沒有人用待秃，我們團隊就拿來配置成集群嘹吨。具體打算配置如下的集群

主機名	IP地址（內(nèi)網(wǎng)）
SparkMaster	10.21.32.106
SparkWorker1	10.21.32.109
SparkWorker2	10.21.32.112

首先進行的是ssh免密碼登錄的操作

具體操作在上一篇學習日記當中已經(jīng)寫到了，在此不再詳細說萍恕。

配置Java環(huán)境

因為我那三臺電腦也是配置好了JDK了逸嘀，所以在此也不詳細說。
配置好Java的機子可以使用

java -version

來查看Java的版本

下載Hadoop2.7.2

因為我最后的文件是放在/usr/local下面的允粤，所以我也直接打開/usr/local文件夾下湖笨。直接

wget https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.7.2/hadoop-2.7.2.tar.gz

安裝Hadoop以及配置Hadoop環(huán)境

解壓

tar -zxvf hadoop-2.7.2.tar.gz

刪除

rm -rf hadoop-2.7.2.tar.gz

解壓刪除之后打開hadoop-2.7.2文件夾，在etc/hadoop/hadoop-env.sh中配置JDK的信息
先查看本機的jdk目錄地址在哪里

echo $JAVA_HOME

vi etc/hadoop/hadoop-env.sh

將

export JAVA_HOME=${JAVA_HOME}

改為

export JAVA_HOME=/usr/java/jdk1.8.0_131

為了方便我們以后開機之后可以立刻使用到Hadoop的bin目錄下的相關(guān)命令嚷狞，可以把hadoop文件夾下的bin和sbin目錄配置到/etc/profile文件中。

vi /etc/profile

添加

export PATH=$PATH:/usr/local/hadoop-2.7.2/bin:/usr/local/hadoop-2.7.7/sbin

按一下esc,按著shift+兩次z鍵保存

使用

source  /etc/profile

使得命令配置信息生效,是否生效可以通過

hadoop version

查看

配置Hadoop分布式集群

前言

考慮是為了建立spark集群登澜，所以主機命名為SparkMaster SparkWorker1 SparkWorker2

修改主機名

vi /etc/hostname

修改里面的名字為SprakMaster,按一下esc,按著shift+兩次z鍵保存。

設(shè)置hosts文件使得主機名和IP地址對應關(guān)系

vi /etc/hosts

配置主機名和IP地址的對應關(guān)系飘庄。

Ps:其他兩臺slave的主機也修改對應的SparkWorker1 SparkWorker2脑蠕，如果修改完主機名字之后戶籍的名字沒有生效，那么重啟系統(tǒng)便可以跪削。三臺機子的hostname與hosts均要修改

在==三臺==機子的總的hadoop-2.7.2文件夾下建立如下四個文件夾

目錄/tmp谴仙，用來存儲臨時生成的文件
目錄/hdfs，用來存儲集群數(shù)據(jù)
目錄hdfs/data碾盐，用來存儲真正的數(shù)據(jù)
目錄hdfs/name晃跺，用來存儲文件系統(tǒng)元數(shù)據(jù)

mkdir tmp hdfs hdfs/data hdfs/name

配置hadoop文件

在此先修改SparkMaster的配置文件，然后修改完畢后通過rsync命令復制到其他節(jié)點電腦上毫玖。

修改core-site.xml

vi etc/hadoop/core-site.xml

具體修改如下:

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://SparkMaster:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/usr/local/hadoop-2.7.2/tmp</value>
    </property>
    <property>
        <name>io.file.buffer.size</name>
        <value>131072</value>
    </property>
</configuration>

變量fs.defaultFS保存了NameNode的位置掀虎，HDFS和MapReduce組件都需要它。這就是它出現(xiàn)在core-site.xml文件中而不是hdfs-site.xml文件中的原因付枫。

修改marpred-site.xml

具體修改如下

首先我們需要的是將marpred-site.xml復制一份：

cp etc/hadoop/marpred-site.xml.template etc/hadoop/marpred-site.xml

vi etc/hadoop/marpred-site.xml.template

此處修改的是marpred-site.xml烹玉，不是marpred-site.xml.template。

具體修改如下

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>SparkMaster:10020</value>
    </property>
    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>SparkMaster:19888</value>
    </property>
</configuration>

修改hdfs-site.xml

vi etc/hadoop/hdfs-site.xml

具體修改如下

<configuration>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/usr/local/hadoop-2.7.2/hdfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/usr/local/hadoop-2.7.2/hdfs/data</value>
    </property>
    <property>
        <name>dfs.replication</name>
        <value>2</value>
    </property>
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>SparkMaster:9001</value>
    </property>
    <property>
    <name>dfs.webhdfs.enabled</name>
    <value>true</value>
    </property>
</configuration>

PS：變量dfs.replication指定了每個HDFS數(shù)據(jù)塊的復制次數(shù)阐滩，即HDFS存儲文件的副本個數(shù).我的實驗環(huán)境只有一臺Master和兩臺Worker（DataNode）二打，所以修改為2。

配置yarn-site.xml

vi etc/hadoop/yarn-site.xml

具體配置如下：

<configuration>
        <property>
               <name>yarn.nodemanager.aux-services</name>
               <value>mapreduce_shuffle</value>
        </property>
        <property>
               <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
               <value>org.apache.hadoop.mapred.ShuffleHandler</value>
        </property>
        <property>
               <name>yarn.resourcemanager.address</name>
               <value>SparkMaster:8032</value>
       </property>
       <property>
               <name>yarn.resourcemanager.scheduler.address</name>
               <value>SparkMaster:8030</value>
       </property>
       <property>
               <name>yarn.resourcemanager.resource-tracker.address</name>
               <value>SparkMaster:8031</value>
       </property>
       <property>
               <name>yarn.resourcemanager.admin.address</name>
               <value>SparkMaster:8033</value>
       </property>
       <property>
               <name>yarn.resourcemanager.webapp.address</name>
               <value>SparkMaster:8088</value>
       </property>
</configuration>

修改slaves的內(nèi)容

將localhost修改成為SparkWorker1掂榔、SparkWorker2

將`SparkMaster`節(jié)點的`hadoop-2.7.2/etc/下面的文件通過以下方式放去其他節(jié)點

rsync -av /usr/local/hadoop-2.7.2/etc/ SparkWorker1:/usr/local/hadoop-2.7.2/etc/

rsync -av /usr/local/hadoop-2.7.2/etc/ SparkWorker1:/usr/local/hadoop-2.7.2/etc/

完成之后可以查看SparkWorker1继效、SparkWorker2下面的文件是否變了

啟動hadoop分布式集群

在`SparkMaster`節(jié)點格式化集群的文件系統(tǒng)

輸入

hadoop namenode -format

啟動Hadoop集群

start-all.sh

查看各個節(jié)點的進程信息

使用

jps

查看各節(jié)點的進程信息
可以看到

此時分布式的hadoop集群已經(jīng)搭好了

在瀏覽器輸入

SparkMaster_IP:50070

SparkMaster_IP:8088

看到以下界面代表Hadoop集群已經(jīng)開啟了

結(jié)言

到此Hadoop的分布式集群就搭好了。這個Spark運行的基礎(chǔ)装获。

參見：CentOS 6.7安裝Hadoop 2.7.2
++王家林/王雁軍/王家虎的《Spark 核心源碼分析與開發(fā)實戰(zhàn)》++

文章出自kwongtai'blog瑞信，轉(zhuǎn)載請標明出處！

最后編輯于：2017.12.09 02:23:07

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末饱溢，一起剝皮案震驚了整個濱河市喧伞，隨后出現(xiàn)的幾起案子走芋，更是在濱河造成了極大的恐慌绩郎，老刑警劉巖，帶你破解...
沈念sama閱讀 206,311評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件翁逞，死亡現(xiàn)場離奇詭異肋杖，居然都是意外死亡，警方通過查閱死者的電腦和手機挖函，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,339評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門状植，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事津畸≌穸ǎ” “怎么了？”我有些...
開封第一講書人閱讀 152,671評論 0贊 342
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵肉拓，是天一觀的道長后频。經(jīng)常有香客問我，道長暖途，這世上最難降的妖魔是什么卑惜？我笑而不...
開封第一講書人閱讀 55,252評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮驻售，結(jié)果婚禮上露久，老公的妹妹穿的比我還像新娘。我一直安慰自己欺栗，他們只是感情好毫痕，可當我...
茶點故事閱讀 64,253評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著纸巷，像睡著了一般镇草。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上瘤旨，一...
開封第一講書人閱讀 49,031評論 1贊 285
城市分裂傳說
那天梯啤，我揣著相機與錄音，去河邊找鬼存哲。笑死因宇，一個胖子當著我的面吹牛，可吹牛的內(nèi)容都是我干的祟偷。我是一名探鬼主播察滑，決...
沈念sama閱讀 38,340評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼修肠！你這毒婦竟也來了贺辰？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 36,973評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤嵌施，失蹤者是張志新（化名）和其女友劉穎饲化，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體吗伤，經(jīng)...
沈念sama閱讀 43,466評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡吃靠，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 35,937評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了足淆。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片巢块。...
茶點故事閱讀 38,039評論 1贊 333
活死人
序言：一個原本活蹦亂跳的男人離奇死亡礁阁，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出族奢，到底是詐尸還是另有隱情姥闭，我是刑警寧澤，帶...
沈念sama閱讀 33,701評論 4贊 323
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布越走，位于F島的核電站泣栈，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏弥姻。R本人自食惡果不足惜南片，卻給世界環(huán)境...
茶點故事閱讀 39,254評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望庭敦。院中可真熱鬧疼进，春花似錦、人聲如沸秧廉。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,259評論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽疼电。三九已至嚼锄，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間蔽豺，已是汗流浹背区丑。一陣腳步聲響...
開封第一講書人閱讀 31,485評論 1贊 262
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留修陡，地道東北人沧侥。一個月前我還...
沈念sama閱讀 45,497評論 2贊 354
代替公主和親
正文我出身青樓，卻偏偏與公主長得像魄鸦，于是被迫代替她去往敵國和親宴杀。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 42,786評論 2贊 345

Hadoop-2.7.2集群的搭建——集群學習日記

前言

開始的準備

首先進行的是ssh免密碼登錄的操作

配置Java環(huán)境

下載Hadoop2.7.2

安裝Hadoop以及配置Hadoop環(huán)境

配置Hadoop分布式集群

前言

修改主機名

設(shè)置hosts文件使得主機名和IP地址對應關(guān)系

在==三臺==機子的總的hadoop-2.7.2文件夾下建立如下四個文件夾

配置hadoop文件

修改core-site.xml

修改marpred-site.xml

修改hdfs-site.xml

配置yarn-site.xml

修改slaves的內(nèi)容

將SparkMaster節(jié)點的`hadoop-2.7.2/etc/下面的文件通過以下方式放去其他節(jié)點

啟動hadoop分布式集群

在SparkMaster節(jié)點格式化集群的文件系統(tǒng)

啟動Hadoop集群

查看各個節(jié)點的進程信息

結(jié)言

推薦閱讀更多精彩內(nèi)容

將`SparkMaster`節(jié)點的`hadoop-2.7.2/etc/下面的文件通過以下方式放去其他節(jié)點

在`SparkMaster`節(jié)點格式化集群的文件系統(tǒng)