hadoop_cluster搭建

配置環(huán)境：
ubuntu 14.0.4 +hadoop.2.7.1
1.設置用戶sudo權(quán)限

chmod u+w /etc/sudoers
vim /etc/sudoers

在root ALL=(ALL) ALL添加
cms(這是我的用戶名根據(jù)實際情況填寫) ALL=(ALL) ALL

chmod u-w /etc/sudoers

2.設置靜態(tài)IP
systems settings---network----wired---options
彈出框承二，選擇ipv4 settings
地址為192.168.31.131（注意ip地址熟丸、網(wǎng)關弯洗、DNS等與自動方式的ip一致）

需設置的內(nèi)容

3.安裝jdk
4.配置另外兩臺機器
虛擬機--管理--克隆
選擇（虛擬機中的當前狀態(tài)--創(chuàng)建連接克禄峙）
設置靜態(tài)ip，分別為192.168.31.132聘鳞，192.168.31.133

5.集群環(huán)境配置
1）修改當前機器名稱
修改三臺機器里文件/etc/hostname里的值即可墨榄，修改成功后用hostname命令查看當前主機名是否設置成功。

一定要將圖中該行注釋掉磷籍，否則最后通過命令hdfs dfsadmin -report
查看 DataNode 是否正常啟動時 Live datanodes 為 0 （個人在這個坑里搗鼓了好久）

特別注意

2）配置hosts文件
在所有機器/etc/hosts文件后面加
192.168.31.131 Master
192.168.31.132 Slave1
192.168.31.133 Slave2
ping 測試

Paste_Image.png

配置ssh免登錄
1）三臺機器安裝ssh
2）Master機器利用ssh-keygen命令生成一個無密碼密鑰對。
在Master機器上執(zhí)行以下命令：
ssh-keygen –t rsa
生成的密鑰對：id_rsa（私鑰）和id_rsa.pub（公鑰）现柠，默認存儲在/home/用戶名/.ssh目錄下院领。

查看"/home/用戶名/"下是否有".ssh"文件夾，且".ssh"文件下是否有兩個剛生產(chǎn)的無密碼密鑰對够吩。
3）接著在Master節(jié)點上做如下配置比然，把id_rsa.pub追加到授權(quán)的key里面去。
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
查看是否成功

4）將公鑰復制到slave1和slave2
在master上執(zhí)行

ssh-copy-id -i ~/.ssh/id_rsa.pub slave2```
并且ssh slave1等測試周循。

####hadoop配置文件（路徑hadoop.2.7.1/etc/hadoop）（在master上配置）
#####安裝hadoop
1.在官網(wǎng)上下載hadoop-2.7.1.tar.gz
2.解壓：```tar -zxvf hadoop-2.7.1.tar.gz```
3.配置環(huán)境變量
打開/etc/profile
添加（連同java的環(huán)境變量强法，一起給出）：

![環(huán)境變量](http://upload-images.jianshu.io/upload_images/1908836-6dcb17be3a5221d9.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

```soure /etc/profile```  讓配置文件立即執(zhí)行
####修改配置文件
這里我只把我的實例貼出來，經(jīng)供參考湾笛，更多詳細配置請參照官方文檔
1.hadoop-env.sh
該文件是 hadoop運行基本環(huán)境的配置饮怯，需要修改的為 java虛擬機的位置。
故在該文件中修改 JAVA_HOME值為本機安裝位置

The java implementation to use.

export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64

2.core-site.xml

<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/hadoop</value> #記住該位置嚎研，為防止找不到該文件位置以及hadoop namenode -format不成功蓖墅，每次在應在/opt新建一個hadoop目錄
</property>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value>
</property>
</configuration>

3.hdfs-site.xml
```<configuration>
  <property>
    <name>dfs.replication</name>
    <value>2</value>
  </property>
  <property>
    <name>dfs.datanode.data.dir</name>
    <value>file:///opt/hadoop/datanode</value>
  </property>
  <property>#該namenode屬性在復制到slave中去時應刪除
    <name>dfs.namenode.name.dir</name>
    <value>file:///opt/hadoop/namenode</value>
  </property>
    <property>#該namenode屬性在復制到slave中去時應刪除
        <name>dfs.namenode.secondary.http-address</name>
        <value>master:9001</value>
    </property>
<property>#該namenode屬性在復制到slave中去時應刪除
        <name>dfs.webhdfs.enabled</name>
        <value>true</value>
    </property>
</configuration>

4.mapred-site.xml
這個是mapreduce 任務的配置，由于 hadoop2.x使用了yarn 框架临扮，所以要實現(xiàn)分布式部署论矾，必須在 mapreduce.framework.name屬性下配置為yarn。
版本中/etc/hadoop/ 中找不到 mapred-site.xml文件公条，默認情況下拇囊，/hadoop-2。7.1/etc/hadoop/文件夾下有 mapred.xml.template文件
復制并重命名
cp mapred-site.xml.template mapred-site.xml
編輯器打開此新建文件
vi mapred-site.xml
然后編輯mapred-site.xml

<configuration>
<property>  
          <name>mapreduce.framework.name</name>  
          <value>yarn</value>  
          <description>Execution framework set to Hadoop YARN.</description>  
     </property>
<property>  
          <name>mapreduce.jobhistory.address</name>  
          <value>master:10020</value>  
          <description>MapReduce JobHistory Server host:port, default port is 10020</description>  
     </property>  
     <property>  
          <name>mapreduce.jobhistory.webapp.address</name>  
          <value>master:19888</value>  
          <description>MapReduce JobHistory Server Web UI host:port, default port is 19888.</description>  
     </property>  

</configuration>

jobhistory是 Hadoop自帶了一個歷史服務器靶橱，用于記錄 Mapreduce歷史作業(yè)寥袭。默認情況下， jobhistory沒有啟動关霸，可用手動通過命令啟動传黄，如下所示：
Shell代碼
``jobhistory-daemon.sh start historyserver```

5.yarn-site.xml
該文件為yarn 框架的配置

<configuration>
   <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.nodemanager.auxservices.mapreduce.shuffle.class</name>
        <value>org.apache.hadoop.mapred.ShuffleHandler</value>
    </property>
    <property>
        <name>yarn.resourcemanager.address</name>
        <value>master:8032</value>
    </property>
    <property>
        <name>yarn.resourcemanager.scheduler.address</name>
        <value>master:8030</value>
    </property>
    <property>
        <name>yarn.resourcemanager.resource-tracker.address</name>
        <value>master:8031</value>
    </property>
    <property>
        <name>yarn.resourcemanager.admin.address</name>
        <value>master:8033</value>
    </property>
    <property>
       <name>yarn.resourcemanager.webapp.address</name> <value>master:8088</value>                                                                                                  
    </property>


<!-- Site specific YARN configuration properties -->

</configuration>

6.slaves
該文件里面保存所有slave節(jié)點的信息，hdfs
寫入以下內(nèi)容（hosts里從機的主機名）：

Slave1
Slave2

7.向節(jié)點服務器slave1队寇、slave2復制我們剛剛在master服務器上配置好的hadoop

scp -r  hadoop-2.7.1 slave1 
scp -r  hadoop-2.7.1 slave2

配置slave1膘掰、slave2
1）配置環(huán)境變量，/etc/profile 與上面master配置一致
2）刪除hdfs-site中的多余屬性（在前面已標注）

啟動hadoop

在每次namenod之前，最好
在三個機器/opt下先刪除臨時文件 hadoop
然后新建 hadoop/
修改權(quán)限：

chown -R cms hadoop

避免
hadoop namenode -format 失敗
1)執(zhí)行hadoop namenode -format
出現(xiàn)

則成功格式化HDFS
如果不成功识埋，執(zhí)行上述刪除臨時文件夾等步驟再格式化

2）在master上啟動集群
start-dfs.sh
start-yarn.sh

3)用jps檢驗各后臺進程是否成功啟動
master

slave1

slave2

缺少任一進程都表示出錯凡伊。另外還需要在 Master 節(jié)點上通過命令 hdfs dfsadmin -report
查看 DataNode 是否正常啟動，如果 Live datanodes 不為 0 窒舟，則說明集群啟動成功系忙。例如我這邊一共有2 個 Datanodes：

master:8088能顯示你的集群狀態(tài)
master: 50070能進行一些節(jié)點的管理

#######向hadoop集群系統(tǒng)提交第一個mapreduce任務
1)hadoop fs -mkdir /tmp 在虛擬分布式文件系統(tǒng)上創(chuàng)建一個測試目錄tmp
2)hadoop fs -put 1.txt /tmp/1.txt
將當前目錄下的帶有任意單詞的文件復制到虛擬分布式文件系統(tǒng)中
例如，我的文件

3)hadoop fs -ls /tmp查看文件系統(tǒng)中是否存在我們所復制的文件

4)復制hadoop安裝目錄下的mapreduce example 的jar 包到/opt目錄下
cp /hadoop-2.7.1/share/mapreduce/hadoop-mapreduce-examples-2.7.1.jar /opt
5)運行單詞計數(shù)mapreduce任務
hadoop jar /opt/hadoop-mapreduce-examples-2.7.1.jar wordcount /tmp/1.txt /tmp/1_out

運行成功

4）查看任務輸出

li  1
ou  2
rt  2
we  3```
至此惠豺，集群搭建成功

最后編輯于：2017.12.04 04:19:28

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末银还，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子洁墙，更是在濱河造成了極大的恐慌蛹疯，老刑警劉巖，帶你破解...
沈念sama閱讀 211,123評論 6贊 490
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件热监，死亡現(xiàn)場離奇詭異捺弦，居然都是意外死亡，警方通過查閱死者的電腦和手機孝扛，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,031評論 2贊 384
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門羹呵，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人疗琉，你說我怎么就攤上這事∏嘎粒” “怎么了盈简？”我有些...
開封第一講書人閱讀 156,723評論 0贊 345
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長太示。經(jīng)常有香客問我柠贤，道長，這世上最難降的妖魔是什么类缤？我笑而不...
開封第一講書人閱讀 56,357評論 1贊 283
?港島之戀（遺憾婚禮）
正文為了忘掉前任臼勉，我火速辦了婚禮，結(jié)果婚禮上餐弱，老公的妹妹穿的比我還像新娘宴霸。我一直安慰自己，他們只是感情好膏蚓，可當我...
茶點故事閱讀 65,412評論 5贊 384
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布瓢谢。她就那樣靜靜地躺著，像睡著了一般驮瞧。火紅的嫁衣襯著肌膚如雪氓扛。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 49,760評論 1贊 289
城市分裂傳說
那天论笔，我揣著相機與錄音采郎，去河邊找鬼千所。笑死，一個胖子當著我的面吹牛蒜埋，可吹牛的內(nèi)容都是我干的淫痰。我是一名探鬼主播，決...
沈念sama閱讀 38,904評論 3贊 405
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼理茎，長吁一口氣：“原來是場噩夢啊……” “哼黑界！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起皂林，我...
開封第一講書人閱讀 37,672評論 0贊 266
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤朗鸠，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后础倍，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體烛占，經(jīng)...
沈念sama閱讀 44,118評論 1贊 303
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 36,456評論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年沟启，在試婚紗的時候發(fā)現(xiàn)自己被綠了忆家。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 38,599評論 1贊 340
活死人
序言：一個原本活蹦亂跳的男人離奇死亡德迹，死狀恐怖芽卿，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情胳搞，我是刑警寧澤卸例，帶...
沈念sama閱讀 34,264評論 4贊 328
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站肌毅，受9級特大地震影響筷转，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜悬而，卻給世界環(huán)境...
茶點故事閱讀 39,857評論 3贊 312
男人毒藥：我在死后第九天來索命
文/蒙蒙一呜舒、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧笨奠，春花似錦袭蝗、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,731評論 0贊 21
一樁弒父案呻袭，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至腺兴，卻和暖如春左电，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,956評論 1贊 264
情欲美人皮
我被黑心中介騙來泰國打工篓足，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留段誊，地道東北人。一個月前我還...
沈念sama閱讀 46,286評論 2贊 360
代替公主和親
正文我出身青樓栈拖，卻偏偏與公主長得像连舍，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子涩哟，可洞房花燭夜當晚...
茶點故事閱讀 43,465評論 2贊 348

hadoop_cluster搭建

The java implementation to use.

啟動hadoop

推薦閱讀更多精彩內(nèi)容