Hadoop-2.7.2集群的搭建——集群學習日記

前言

因為比賽的限制是使用Hadoop2.7.2敏簿,估在此文章下面的也是使用Hadoop2.7.2,具體下載地址為Hadoop2.7.2

開始的準備

目前在我的實驗室上有三臺Linux主機妖异,因為需要參加一個關(guān)于spark數(shù)據(jù)分析的比賽弄贿,所以眼見那幾臺服務器沒有人用待秃,我們團隊就拿來配置成集群嘹吨。具體打算配置如下的集群

主機名 IP地址(內(nèi)網(wǎng))
SparkMaster 10.21.32.106
SparkWorker1 10.21.32.109
SparkWorker2 10.21.32.112

首先進行的是ssh免密碼登錄的操作

具體操作在上一篇學習日記當中已經(jīng)寫到了,在此不再詳細說萍恕。

配置Java環(huán)境

因為我那三臺電腦也是配置好了JDK了逸嘀,所以在此也不詳細說。
配置好Java的機子可以使用

java -version

來查看Java的版本

下載Hadoop2.7.2

因為我最后的文件是放在/usr/local下面的允粤,所以我也直接打開/usr/local文件夾下湖笨。直接

wget https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.7.2/hadoop-2.7.2.tar.gz

安裝Hadoop以及配置Hadoop環(huán)境

解壓

tar -zxvf hadoop-2.7.2.tar.gz

刪除

rm -rf hadoop-2.7.2.tar.gz

解壓刪除之后打開hadoop-2.7.2文件夾,在etc/hadoop/hadoop-env.sh中配置JDK的信息
先查看本機的jdk目錄地址在哪里

echo $JAVA_HOME
vi etc/hadoop/hadoop-env.sh

export JAVA_HOME=${JAVA_HOME}

改為

export JAVA_HOME=/usr/java/jdk1.8.0_131

為了方便我們以后開機之后可以立刻使用到Hadoop的bin目錄下的相關(guān)命令嚷狞,可以把hadoop文件夾下的binsbin目錄配置到/etc/profile文件中。

vi /etc/profile

添加

export PATH=$PATH:/usr/local/hadoop-2.7.2/bin:/usr/local/hadoop-2.7.7/sbin

按一下esc,按著shift+兩次z鍵保存

使用

source  /etc/profile

使得命令配置信息生效,是否生效可以通過

hadoop version

查看

配置Hadoop分布式集群

前言

考慮是為了建立spark集群登澜,所以主機命名為SparkMaster SparkWorker1 SparkWorker2

修改主機名

vi /etc/hostname

修改里面的名字為SprakMaster,按一下esc,按著shift+兩次z鍵保存。

設(shè)置hosts文件使得主機名和IP地址對應關(guān)系

vi /etc/hosts

配置主機名和IP地址的對應關(guān)系飘庄。

Ps:其他兩臺slave的主機也修改對應的SparkWorker1 SparkWorker2脑蠕,如果修改完主機名字之后戶籍的名字沒有生效,那么重啟系統(tǒng)便可以跪削。三臺機子的hostname與hosts均要修改

在==三臺==機子的總的hadoop-2.7.2文件夾下建立如下四個文件夾

  • 目錄/tmp谴仙,用來存儲臨時生成的文件
  • 目錄/hdfs,用來存儲集群數(shù)據(jù)
  • 目錄hdfs/data碾盐,用來存儲真正的數(shù)據(jù)
  • 目錄hdfs/name晃跺,用來存儲文件系統(tǒng)元數(shù)據(jù)
mkdir tmp hdfs hdfs/data hdfs/name

配置hadoop文件

在此先修改SparkMaster的配置文件,然后修改完畢后通過rsync命令復制到其他節(jié)點電腦上毫玖。

修改core-site.xml

vi etc/hadoop/core-site.xml

具體修改如下:

<configuration>
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://SparkMaster:9000</value>
    </property>
    <property>
        <name>hadoop.tmp.dir</name>
        <value>file:/usr/local/hadoop-2.7.2/tmp</value>
    </property>
    <property>
        <name>io.file.buffer.size</name>
        <value>131072</value>
    </property>
</configuration>

變量fs.defaultFS保存了NameNode的位置掀虎,HDFS和MapReduce組件都需要它。這就是它出現(xiàn)在core-site.xml文件中而不是hdfs-site.xml文件中的原因付枫。

修改marpred-site.xml

具體修改如下

首先我們需要的是將marpred-site.xml復制一份:

cp etc/hadoop/marpred-site.xml.template etc/hadoop/marpred-site.xml
vi etc/hadoop/marpred-site.xml.template 

此處修改的是marpred-site.xml烹玉,不是marpred-site.xml.template

具體修改如下

<configuration>
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
    <property>
        <name>mapreduce.jobhistory.address</name>
        <value>SparkMaster:10020</value>
    </property>
    <property>
        <name>mapreduce.jobhistory.webapp.address</name>
        <value>SparkMaster:19888</value>
    </property>
</configuration>

修改hdfs-site.xml

vi etc/hadoop/hdfs-site.xml

具體修改如下

<configuration>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/usr/local/hadoop-2.7.2/hdfs/name</value>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/usr/local/hadoop-2.7.2/hdfs/data</value>
    </property>
    <property>
        <name>dfs.replication</name>
        <value>2</value>
    </property>
    <property>
        <name>dfs.namenode.secondary.http-address</name>
        <value>SparkMaster:9001</value>
    </property>
    <property>
    <name>dfs.webhdfs.enabled</name>
    <value>true</value>
    </property>
</configuration>

PS:變量dfs.replication指定了每個HDFS數(shù)據(jù)塊的復制次數(shù)阐滩,即HDFS存儲文件的副本個數(shù).我的實驗環(huán)境只有一臺Master和兩臺Worker(DataNode)二打,所以修改為2。

配置yarn-site.xml

vi etc/hadoop/yarn-site.xml

具體配置如下:

<configuration>
        <property>
               <name>yarn.nodemanager.aux-services</name>
               <value>mapreduce_shuffle</value>
        </property>
        <property>
               <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
               <value>org.apache.hadoop.mapred.ShuffleHandler</value>
        </property>
        <property>
               <name>yarn.resourcemanager.address</name>
               <value>SparkMaster:8032</value>
       </property>
       <property>
               <name>yarn.resourcemanager.scheduler.address</name>
               <value>SparkMaster:8030</value>
       </property>
       <property>
               <name>yarn.resourcemanager.resource-tracker.address</name>
               <value>SparkMaster:8031</value>
       </property>
       <property>
               <name>yarn.resourcemanager.admin.address</name>
               <value>SparkMaster:8033</value>
       </property>
       <property>
               <name>yarn.resourcemanager.webapp.address</name>
               <value>SparkMaster:8088</value>
       </property>
</configuration>

修改slaves的內(nèi)容

localhost修改成為SparkWorker1掂榔、SparkWorker2

SparkMaster節(jié)點的`hadoop-2.7.2/etc/下面的文件通過以下方式放去其他節(jié)點

rsync -av /usr/local/hadoop-2.7.2/etc/ SparkWorker1:/usr/local/hadoop-2.7.2/etc/
rsync -av /usr/local/hadoop-2.7.2/etc/ SparkWorker1:/usr/local/hadoop-2.7.2/etc/

完成之后可以查看SparkWorker1继效、SparkWorker2下面的文件是否變了

啟動hadoop分布式集群

SparkMaster節(jié)點格式化集群的文件系統(tǒng)

輸入

hadoop namenode -format

啟動Hadoop集群

start-all.sh

查看各個節(jié)點的進程信息

使用

jps

查看各節(jié)點的進程信息
可以看到

此時分布式的hadoop集群已經(jīng)搭好了

在瀏覽器輸入

SparkMaster_IP:50070
SparkMaster_IP:8088

看到以下界面代表Hadoop集群已經(jīng)開啟了

結(jié)言

到此Hadoop的分布式集群就搭好了。這個Spark運行的基礎(chǔ)装获。

參見:CentOS 6.7安裝Hadoop 2.7.2
++王家林/王雁軍/王家虎的《Spark 核心源碼分析與開發(fā)實戰(zhàn)》++

文章出自kwongtai'blog瑞信,轉(zhuǎn)載請標明出處!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末饱溢,一起剝皮案震驚了整個濱河市喧伞,隨后出現(xiàn)的幾起案子走芋,更是在濱河造成了極大的恐慌绩郎,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,311評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件翁逞,死亡現(xiàn)場離奇詭異肋杖,居然都是意外死亡,警方通過查閱死者的電腦和手機挖函,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,339評論 2 382
  • 文/潘曉璐 我一進店門状植,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事津畸≌穸ǎ” “怎么了?”我有些...
    開封第一講書人閱讀 152,671評論 0 342
  • 文/不壞的土叔 我叫張陵肉拓,是天一觀的道長后频。 經(jīng)常有香客問我,道長暖途,這世上最難降的妖魔是什么卑惜? 我笑而不...
    開封第一講書人閱讀 55,252評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮驻售,結(jié)果婚禮上露久,老公的妹妹穿的比我還像新娘。我一直安慰自己欺栗,他們只是感情好毫痕,可當我...
    茶點故事閱讀 64,253評論 5 371
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著纸巷,像睡著了一般镇草。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上瘤旨,一...
    開封第一講書人閱讀 49,031評論 1 285
  • 那天梯啤,我揣著相機與錄音,去河邊找鬼存哲。 笑死因宇,一個胖子當著我的面吹牛,可吹牛的內(nèi)容都是我干的祟偷。 我是一名探鬼主播察滑,決...
    沈念sama閱讀 38,340評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼修肠!你這毒婦竟也來了贺辰?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 36,973評論 0 259
  • 序言:老撾萬榮一對情侶失蹤嵌施,失蹤者是張志新(化名)和其女友劉穎饲化,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體吗伤,經(jīng)...
    沈念sama閱讀 43,466評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡吃靠,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,937評論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了足淆。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片巢块。...
    茶點故事閱讀 38,039評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡礁阁,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出族奢,到底是詐尸還是另有隱情姥闭,我是刑警寧澤,帶...
    沈念sama閱讀 33,701評論 4 323
  • 正文 年R本政府宣布越走,位于F島的核電站泣栈,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏弥姻。R本人自食惡果不足惜南片,卻給世界環(huán)境...
    茶點故事閱讀 39,254評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望庭敦。 院中可真熱鬧疼进,春花似錦、人聲如沸秧廉。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,259評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽疼电。三九已至嚼锄,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間蔽豺,已是汗流浹背区丑。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留修陡,地道東北人沧侥。 一個月前我還...
    沈念sama閱讀 45,497評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像魄鸦,于是被迫代替她去往敵國和親宴杀。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 42,786評論 2 345

推薦閱讀更多精彩內(nèi)容