Hadoop集群搭建

環(huán)境

安裝環(huán)境

環(huán)境 配置
Linux Centos6.5
Java JDK1.8
Hadoop Hadoop 2.7.3

節(jié)點(diǎn)配置

創(chuàng)建用戶(hù)組

groupadd hadoop
useradd hadoop -g hadoop

JDK安裝

需要提前安裝好jdk编曼,jdk版本參考:
https://wiki.apache.org/hadoop/HadoopJavaVersions

ssh免密碼登陸

分別在三臺(tái)機(jī)器生成ssh公鑰和私鑰
ssh-keygen -t rsa
將三臺(tái)機(jī)器的公鑰放到authorized_keys

cd ~/.ssh
cat id_rsa.pub >> authorized_keys
ssh hadoop@10.xxx.xxx.2 ~/.ssh/id_rsa.pub >> authorized_keys
ssh hadoop@10.xxx.xxx.3 ~/.ssh/id_rsa.pub >> authorized_keys

這兩步需要輸入對(duì)應(yīng)機(jī)器的hadoop賬戶(hù)密碼讲冠,因?yàn)榇藭r(shí)還沒(méi)有無(wú)密碼免登錄面哼。
將authorized_keys拷貝到另外兩臺(tái)機(jī)器:

scp authorized_keys hadoop@10.xxx.xxx.2:~/.ssh/
scp authorized_keys hadoop@10.xxx.xxx.3:~/.ssh/

這樣可以直接登錄另外兩臺(tái)機(jī)器绰垂,而不需要密碼了一睁。
注意:如果這時(shí)仍然需要輸入密碼杰赛,那有可能是authorized_keys權(quán)限問(wèn)題,將其改為600即可苔咪。

chmod 600 authorized_keys

Hadoop安裝

下載hadoop鏡像文件

http://hadoop.apache.org/releases.html

解壓縮

tar -zxvf hadoop-2.7.3.tar.gz

配置hadoop配置文件

hadoop的配置文件都在${HADOOP_HOME}/etc/hadoop/下面。

配置hadoop-env.sh

修改JDK安裝目錄

#export JAVA_HOME=${JAVA_HOME}
export JAVA_HOME=/opt/xxx/java/jdk1.8.0_111/

配置slaves文件

在slaves文件中添加所有從節(jié)點(diǎn)的IP

10.xxx.xxx.2
10.xxx.xxx.3

配置core-site.xml

<configuration>
        <!-- 指定使用HDFS作為默認(rèn)文件系統(tǒng)柳骄,并且指定其N(xiāo)ameNode節(jié)點(diǎn) -->
        <property>
                <name>fs.defaultFS</name>
                <value>hdfs://10.xxx.xxx.1:9000</value>
        </property>
        <!-- 在使用序列化文件時(shí)候讀寫(xiě)緩沖區(qū)大小 -->
        <property>
                <name>io.file.buffer.size</name>
                <value>131072</value>
        </property>
        <!-- 指定臨時(shí)目錄 -->
        <property>
                <name>hadoop.tmp.dir</name>
                <value>/home/hadoop/hadoop/tmp</value>
        </property>

</configuration>

配置hdfs-site.xml

<configuration>
        <!-- SecondaryNameNode地址 -->
        <property>
                <name>dfs.namenode.secondary.http-address</name>
                <value>http://10.xxx.xxx.1:50090</value>
        </property>
        <!-- hdfs副本數(shù)量 -->
        <property>
                <name>dfs.replication</name>
                <value>2</value>
        </property>
        <!-- namenode數(shù)據(jù)存儲(chǔ)目錄 -->
        <property>
                <name>dfs.namenode.name.dir</name>
                <value>file:/home/hadoop/hadoop/hdfs/name</value>
        </property>
        <!-- datanode數(shù)據(jù)存儲(chǔ)目錄 -->
        <property>
                <name>dfs.datanode.name.dir</name>
                <value>file:/home/hadoop/hadoop/hdfs/data</value>
        </property>
        <!-- hdfs 塊大小 128M -->
        <property>
                <name>dfs.bocksize</name>
                <value>134217728</value>
        </property>
</configuration>

配置mapred-site.xml

mapred-site.xml沒(méi)有提供团赏,而是提供了其模版mapred-siter.xml.template,我們需要復(fù)制一個(gè)

cp mapred-site.xml.template mapred-site.xml
<configuration>
        <!-- 配置mapreduce執(zhí)行框架 -->
        <property>
                <name>mapreduce.framework.name</name>
                <value>yarn</value>
        </property>
        <!-- 配置mapreduce任務(wù)歷史服務(wù)地址 -->
        <property>
                <name>mapreduce.jobhistory.address</name>
                <value>http://10.xxx.xxx.1:10020</value>
        </property>
        <!-- 配置mapreduce任務(wù)服務(wù)ui地址 -->
        <property>
                <name>mapreduce.jobhistory.webapp.address</name>
                <value>http://10.xxx.xxx.1:19888</value>
        </property>
</configuration>

配置yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>
        <!-- 配置ResourceManger的主機(jī)和端口耐薯,為客戶(hù)端提交任務(wù)使用 -->
        <property>
                <name>yarn.resourcemanager.address</name>
                <value>http://10.xxx.xxx.1:8032</value>
        </property>
        <!-- ApplicationMasters通過(guò)提供ResourceManger提供的地址獲取調(diào)度資源 -->
        <property>
                <name>yarn.resourcemanager.scheduler.address</name>
                <value>http://10.xxx.xxx.1:8030</value>
        </property>
        <!-- 為NodeManger提供ResourceManager的地址 -->
        <property>
                <name>yarn.resourcemanager.resource-tracker.address</name>
                <value>http://10.xxx.xxx.1:8031</value>
        </property>
        <!-- 指定管理命令的地址 -->
        <property>
                <name>yarn.resourcemanager.admin.address</name>
                <value>http://10.xxx.xxx.1:8033</value>
        </property>
        <!-- ResourceManger web ui 地址 -->
        <!--
        <property>
                <name>yarn.resourcemanager.webapp.address</name>
                <value>http://10.xxx.xxx.1:8088</value>
        </property>
        -->
</configuration>

需要注意的是不能有以下配置:

 <property>
       <name>yarn.resourcemanager.webapp.address</name>
       <value>http://10.xxx.xxx.1:8088</value>
</property>

否則ResourceManeger啟動(dòng)不起來(lái)舔清,之后看下為什么?

分發(fā)節(jié)點(diǎn)

將配置配置好的hadoop復(fù)制到其它節(jié)點(diǎn):

scp -r hadoop-2.7.3 hadoop@10.xxx.xxx.2:/home/hadoop/
scp -r hadoop-2.7.3 hadoop@10.xxx.xxx.3:/home/hadoop/

格式化NameNode

bin/hdfs namenode -format 

....
17/03/27 18:11:29 INFO common.Storage: Storage directory /home/hadoop/hadoop/hdfs/name has been successfully formatted.
......

啟動(dòng)hdfs和yarn

sbin/start-hdfs.sh
sbin/start-yarn.sh

web查看NameNode

 http://10.xxx.xxx.1:50070

web查看ResourceManager

http://10.xxx.xxx.1:8080/cluster

注意:如果報(bào)了下面這個(gè)問(wèn)題曲初,應(yīng)該是你的/etc/hosts下面并沒(méi)有slave 的ip地址体谒,將slave的地址填上即可。

2017-05-31 04:08:54,915 INFO org.apache.hadoop.hdfs.server.datanode.DataNode: Block pool BP-1212305280-172.26.3.61-1496217355761 (Datanode Uuid null) service to /10.5.234.238:9000 beginning handshake with NN
2017-05-31 04:08:54,929 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: Initialization failed for Block pool BP-1212305280-172.26.3.61-1496217355761 (Datanode Uuid null) service to /10.5.234.238:9000 Datanode denied communication with namenode because hostname cannot be resolved (ip=10.5.237.131, hostname=10.5.237.131): DatanodeRegistration(0.0.0.0:50010, datanodeUuid=62026f56-a10d-4ddc-962c-48eaff24a8a2, infoPort=50075, infoSecurePort=0, ipcPort=50020, storageInfo=lv=-56;cid=CID-d7717928-6909-4dc8-bbfd-dea4d6d509db;nsid=1819736668;c=0)
        at org.apache.hadoop.hdfs.server.blockmanagement.DatanodeManager.registerDatanode(DatanodeManager.java:873)
        at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.registerDatanode(FSNamesystem.java:4529)
        at org.apache.hadoop.hdfs.server.namenode.NameNodeRpcServer.registerDatanode(NameNodeRpcServer.java:1286)
        at org.apache.hadoop.hdfs.protocolPB.DatanodeProtocolServerSideTranslatorPB.registerDatanode(DatanodeProtocolServerSideTranslatorPB.java:96)
        at org.apache.hadoop.hdfs.protocol.proto.DatanodeProtocolProtos$DatanodeProtocolService$2.callBlockingMethod(DatanodeProtocolProtos.java:28752)
        at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRpcEngine.java:616)
        at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:982)
        at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:2049)
        at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:2045)
        at java.security.AccessController.doPrivileged(Native Method)
        at javax.security.auth.Subject.doAs(Subject.java:422)
        at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1698)
        at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2043)

這里只是集群的基礎(chǔ)配置复斥,后續(xù)會(huì)跟進(jìn)各種配置营密。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市目锭,隨后出現(xiàn)的幾起案子评汰,更是在濱河造成了極大的恐慌,老刑警劉巖痢虹,帶你破解...
    沈念sama閱讀 216,591評(píng)論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件被去,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡奖唯,警方通過(guò)查閱死者的電腦和手機(jī)惨缆,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,448評(píng)論 3 392
  • 文/潘曉璐 我一進(jìn)店門(mén),熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)丰捷,“玉大人坯墨,你說(shuō)我怎么就攤上這事〔⊥” “怎么了捣染?”我有些...
    開(kāi)封第一講書(shū)人閱讀 162,823評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)停巷。 經(jīng)常有香客問(wèn)我耍攘,道長(zhǎng),這世上最難降的妖魔是什么畔勤? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,204評(píng)論 1 292
  • 正文 為了忘掉前任蕾各,我火速辦了婚禮,結(jié)果婚禮上庆揪,老公的妹妹穿的比我還像新娘式曲。我一直安慰自己,他們只是感情好缸榛,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,228評(píng)論 6 388
  • 文/花漫 我一把揭開(kāi)白布吝羞。 她就那樣靜靜地躺著始鱼,像睡著了一般。 火紅的嫁衣襯著肌膚如雪脆贵。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書(shū)人閱讀 51,190評(píng)論 1 299
  • 那天起暮,我揣著相機(jī)與錄音卖氨,去河邊找鬼。 笑死负懦,一個(gè)胖子當(dāng)著我的面吹牛筒捺,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播纸厉,決...
    沈念sama閱讀 40,078評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼系吭,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了颗品?” 一聲冷哼從身側(cè)響起肯尺,我...
    開(kāi)封第一講書(shū)人閱讀 38,923評(píng)論 0 274
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎躯枢,沒(méi)想到半個(gè)月后则吟,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,334評(píng)論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡锄蹂,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,550評(píng)論 2 333
  • 正文 我和宋清朗相戀三年氓仲,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片得糜。...
    茶點(diǎn)故事閱讀 39,727評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡敬扛,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出朝抖,到底是詐尸還是另有隱情啥箭,我是刑警寧澤,帶...
    沈念sama閱讀 35,428評(píng)論 5 343
  • 正文 年R本政府宣布槽棍,位于F島的核電站捉蚤,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏炼七。R本人自食惡果不足惜缆巧,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,022評(píng)論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望豌拙。 院中可真熱鬧陕悬,春花似錦、人聲如沸按傅。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,672評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至拼岳,卻和暖如春枝誊,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背惜纸。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 32,826評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工叶撒, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人耐版。 一個(gè)月前我還...
    沈念sama閱讀 47,734評(píng)論 2 368
  • 正文 我出身青樓祠够,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親粪牲。 傳聞我的和親對(duì)象是個(gè)殘疾皇子古瓤,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,619評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • 最近在學(xué)習(xí)大數(shù)據(jù),在自己本地裝了三個(gè)虛擬機(jī)腺阳,學(xué)習(xí)搭建hadoop集群落君。記錄下過(guò)程,方便日后查看亭引。 1.準(zhǔn)備工作 ...
    90后老青年閱讀 434評(píng)論 1 1
  • 環(huán)境準(zhǔn)備 1叽奥、軟件版本 四臺(tái)服務(wù)器配置,系統(tǒng):centos6.5痛侍、內(nèi)存:1G朝氓、硬盤(pán):20G四臺(tái)服務(wù)器分配的IP地址...
    程序男保姆閱讀 119評(píng)論 0 0
  • 本文用以記錄hadoop分布式集群搭建過(guò)程 基礎(chǔ)環(huán)境準(zhǔn)備 1、軟件環(huán)境 centos 6.5 三臺(tái)服務(wù)器分配的IP...
    遠(yuǎn)方的貓dj閱讀 982評(píng)論 0 2
  • 一主届、設(shè)置主機(jī)名稱(chēng)當(dāng)四臺(tái)服務(wù)器安裝好之后赵哲,獲得它們的IP地址,并設(shè)置主機(jī)名 修改主機(jī)名稱(chēng)君丁,四臺(tái)機(jī)器分別設(shè)置為:mas...
    Mr_ZhaiDK閱讀 552評(píng)論 0 1
  • 虛擬機(jī)Java與Hadoop的安裝與配置 Java安裝1.開(kāi)啟vm共享文件夾,并將jdk與Hadoop的安裝文件放...
    K也許K閱讀 479評(píng)論 0 2