Hadoop學(xué)習(xí)之路——基本環(huán)境配置

????Hadoop是一個(gè)能夠?qū)Υ罅繑?shù)據(jù)進(jìn)行分布式處理的軟件框架跺涤, 以一種可靠、高效监透、可伸縮的方式進(jìn)行數(shù)據(jù)處理桶错。本文首先介紹一種偽分布式模式的安裝(雖然各個(gè)模塊是在各個(gè)進(jìn)程上分開運(yùn)行的,但是只是運(yùn)行在一個(gè)操作系統(tǒng)上的胀蛮,并不是真正的分布式)院刁,用于初步開發(fā)調(diào)試,體驗(yàn)Hadoop粪狼。

一退腥、虛擬機(jī)環(huán)境配置

????筆者使用的是虛擬機(jī)軟件是VMWare, 所安裝的操作系統(tǒng)是CentOS, 操作系統(tǒng)的光盤映像可以去官網(wǎng)下載(鏈接-CentOS Project)。光盤映像的安裝安裝操作提示一步步進(jìn)行即可鸳玩,網(wǎng)上也有很多步驟詳細(xì)的教程阅虫,不再贅述。

? ? 操作系統(tǒng)安裝完畢之后不跟,就可以進(jìn)行相關(guān)配置啦!

? ? 首先查看虛擬機(jī)的IP地址颓帝,在VMWare軟件的菜單欄選擇 編輯->虛擬網(wǎng)絡(luò)編輯器 就可以看到。

查看ip地址

打開虛擬機(jī)后窝革,將ip地址設(shè)置為剛剛看到的固定的ip购城。點(diǎn)擊右上角的連接標(biāo)志,選擇有線設(shè)置進(jìn)行配置虐译。

ip地址的第四個(gè)字段可以自行設(shè)置瘪板,保證前面部分跟之前看到的本機(jī)ip相同即可,注意不能設(shè)置為0漆诽,至于網(wǎng)關(guān)侮攀,一般的網(wǎng)關(guān)是網(wǎng)段.1,在vmware中是.2地址厢拭。


這些配置好之后兰英,就可以正式的進(jìn)入Hadoop的配置啦~因?yàn)槭褂锰摂M機(jī)界面比較麻煩,筆者使用XShell連接虛擬機(jī)供鸠,通過命令行界面進(jìn)行操作畦贸,這也有利于以后開發(fā)項(xiàng)目時(shí)操作服務(wù)器的熟悉。連接方法和XShell軟件筆者放在另一篇博文里~(XShell及Xftp連接虛擬機(jī) - 簡書

二楞捂、Hadoop環(huán)境配置

首先檢查虛擬機(jī)的網(wǎng)卡是否為開機(jī)啟動(dòng)薄坏,查看配置文件趋厉。(ens33是之前建立的有線連接的名字,不一定固定)

cat /etc/sysconfig/network-scripts/ifcfg-ens33


如果ONBOOT不是yes, 使用vim編輯修改這一配置文件即可胶坠。關(guān)于如何使用linux系統(tǒng)常用的命令不是本文的重點(diǎn)君账,不再贅述。

2.1 配置jdk

我們首先在用戶的根目錄下創(chuàng)建一個(gè)名為soft的文件夾涵但,將jdk的壓縮包通過xftp上傳到soft文件夾中杈绸。在centOS里默認(rèn)安裝了一個(gè)JDK帖蔓,是openJDK(開源版的)矮瘟。或者使用筆者提供的jdk塑娇。

鏈接:https://pan.baidu.com/s/1pcGcnn-a_YTOZB6FIR88mA 密碼:mojt

解壓文件

tar -zxvf jdk-8u65-linux-x64.tar.gz

解壓完成后澈侠,在hadoop用戶的根目錄有一個(gè)jdk1.8.0_65目錄


2.2? 配置環(huán)境變量

使用su命令切換到root用戶

使用vim修改/etc/profile文件,?在profile文件最后添加

JAVA_HOME=/home/hadoop/jdk1.8.0_65

export PATH=$PATH:$JAVA_HOME/bin


使用source命令把修改的環(huán)境變量生效埋酬,jdk配置就完成了哨啃。(此時(shí)可以在普通用戶下操作)

source etc/profile

2.3 配置Hadoop

首先需要將Hadoop壓縮包上傳到虛擬機(jī)上。方便起見写妥,我們?nèi)匀簧蟼鞯街皠?chuàng)建的soft文件夾拳球。這里提供一個(gè)Hadoop壓縮包的資源,大家也可以在網(wǎng)上自由下載珍特。

鏈接:https://pan.baidu.com/s/1VcUmWSTuHsIRlnvJYNhOaw 密碼:7ymn

上傳完成后同樣要進(jìn)行解壓祝峻,解壓完成在hadoop用戶的根目錄下有一個(gè)hadoop-2.6.0目錄

tar -zxvf hadoop-2.6.0.tar.gz

接著就需要使用vim修改配置文件hadoop-2.6.0/etc/hadoop/hadoop-env.sh, 注意這里JAVA_HOME的值是jdk在虛擬機(jī)上的解壓路徑扎筒,讀者可以根據(jù)自己虛擬機(jī)的情況自行設(shè)置

export JAVA_HOME=/home/hadoop/jdk1.8.0_65

然后繼續(xù)修改配置文件hadoop-2.6.0/etc/hadoop/core-site.xml莱找, 在<property></property>處貼如下代碼

<property>??????

????????<name>fs.defaultFS</name>??????

????????<value>hdfs://hadoop:9000</value>

</property>

保存之后,繼續(xù)修改hadoop-2.6.0/etc/hadoop/hdfs-site.xml嗜桌, 在<configuration></configuration>處添加下列代碼

<configuration>

????????<property> ???????

????????????????<name>dfs.replication</name> ??????

????????????????<value>1</value>

????????</property>

</configuration>

保存之后奥溺,繼續(xù)修改hadoop-2.6.0/etc/hadoop/mapred-site.xml文件,需要注意的是骨宠,此文件在hadoop文件夾中并不存在浮定,文件夾中只有一個(gè)名為mapred-site.xml.template的模板文件,我們需要首先使用cp命令將模板文件復(fù)制并重命名為我們的目標(biāo)文件

cp etc/hadoop/mapred-site.xml.template etc/hadoop/mapred-site.xml

復(fù)制完成之后层亿,我們在mapred-site.xml中進(jìn)行修改桦卒,在<configuration></configuration>處添加代碼

<configuration>

????????????<property> ???????

????????????????????<name>mapreduce.framework.name</name> ???????

????????????????????<value>yarn</value> ???

????????????</property>

</configuration>

保存之后,還需要修改hadoop-2.6.0/etc/hadoop/yarn-site.xml棕所,需要添加的代碼如下:


最后修改/etc/hosts文件(root用戶操作闸盔,在文件中添加一行: ip 主機(jī)名稱

如:192.168.44.199? hadoop

2.4 格式化HDFS

需要進(jìn)入hadoop解壓目錄,執(zhí)行如下操作:

bin/hdfs namenode -format

注意:格式化只能操作一次琳省,如果因?yàn)槟撤N原因迎吵,集群不能用躲撰,需要再次格式化,需要把上一次格式化的信息刪除击费,在/tmp目錄里執(zhí)行 rm –rf*

2.5? 啟動(dòng)集群

所有配置進(jìn)行到這里拢蛋,Hadoop的基本環(huán)境就配置完成了~接著就可以啟動(dòng)集群啦~

sbin/start-all.sh

同樣這一命令需要進(jìn)入到Hadoop的解壓目錄下才可以使用,需要輸入四次當(dāng)前用戶的密碼蔫巩。至于為什么要四次輸入當(dāng)前用戶密碼以及如何免密啟動(dòng)谆棱,可以參考筆者的另一篇博文~(SSH互信 - 簡書

啟動(dòng)后,我們在命令行輸入jps來查看當(dāng)前的java進(jìn)程圆仔。如果之前的配置沒有出錯(cuò)垃瞧,我們會(huì)看到有以下輸出!除了jps進(jìn)程本身之外還應(yīng)有五個(gè)進(jìn)程坪郭,這些進(jìn)程的意義涉及到HDFS的結(jié)構(gòu)个从,可以參考 Hadoop分布式文件系統(tǒng):架構(gòu)和設(shè)計(jì)

三、完結(jié)撒花~

:)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末歪沃,一起剝皮案震驚了整個(gè)濱河市嗦锐,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌沪曙,老刑警劉巖奕污,帶你破解...
    沈念sama閱讀 212,332評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異液走,居然都是意外死亡碳默,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,508評論 3 385
  • 文/潘曉璐 我一進(jìn)店門育灸,熙熙樓的掌柜王于貴愁眉苦臉地迎上來腻窒,“玉大人,你說我怎么就攤上這事磅崭《樱” “怎么了?”我有些...
    開封第一講書人閱讀 157,812評論 0 348
  • 文/不壞的土叔 我叫張陵砸喻,是天一觀的道長柔逼。 經(jīng)常有香客問我,道長割岛,這世上最難降的妖魔是什么愉适? 我笑而不...
    開封第一講書人閱讀 56,607評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮癣漆,結(jié)果婚禮上维咸,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好癌蓖,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,728評論 6 386
  • 文/花漫 我一把揭開白布瞬哼。 她就那樣靜靜地躺著,像睡著了一般租副。 火紅的嫁衣襯著肌膚如雪坐慰。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,919評論 1 290
  • 那天用僧,我揣著相機(jī)與錄音结胀,去河邊找鬼。 笑死责循,一個(gè)胖子當(dāng)著我的面吹牛糟港,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播沼死,決...
    沈念sama閱讀 39,071評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼着逐,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了意蛀?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,802評論 0 268
  • 序言:老撾萬榮一對情侶失蹤健芭,失蹤者是張志新(化名)和其女友劉穎县钥,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體慈迈,經(jīng)...
    沈念sama閱讀 44,256評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡若贮,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,576評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了痒留。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片谴麦。...
    茶點(diǎn)故事閱讀 38,712評論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖伸头,靈堂內(nèi)的尸體忽然破棺而出匾效,到底是詐尸還是另有隱情,我是刑警寧澤恤磷,帶...
    沈念sama閱讀 34,389評論 4 332
  • 正文 年R本政府宣布面哼,位于F島的核電站,受9級特大地震影響扫步,放射性物質(zhì)發(fā)生泄漏魔策。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,032評論 3 316
  • 文/蒙蒙 一河胎、第九天 我趴在偏房一處隱蔽的房頂上張望闯袒。 院中可真熱鬧,春花似錦、人聲如沸政敢。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,798評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽堕仔。三九已至擂橘,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間摩骨,已是汗流浹背通贞。 一陣腳步聲響...
    開封第一講書人閱讀 32,026評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留恼五,地道東北人昌罩。 一個(gè)月前我還...
    沈念sama閱讀 46,473評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像灾馒,于是被迫代替她去往敵國和親茎用。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,606評論 2 350

推薦閱讀更多精彩內(nèi)容

  • 終極算法 關(guān)注微信號每天收聽我們的消息終極算法為您推送精品閱讀 前言 Hadoop 在大數(shù)據(jù)技術(shù)體系中的地位至關(guān)...
    Yespon閱讀 129,766評論 12 168
  • 前言 Hadoop在大數(shù)據(jù)技術(shù)體系中的地位至關(guān)重要睬罗,Hadoop是大數(shù)據(jù)技術(shù)的基礎(chǔ)轨功,對Hadoop基礎(chǔ)知識的掌握的...
    __豆約翰__閱讀 1,598評論 2 3
  • 前言 Hadoop在大數(shù)據(jù)技術(shù)體系中的地位至關(guān)重要,Hadoop是大數(shù)據(jù)技術(shù)的基礎(chǔ)容达,對Hadoop基礎(chǔ)知識的掌握的...
    數(shù)據(jù)萌新閱讀 1,455評論 1 1
  • 兒子很早就對毛桃過敏古涧,饞的掉眼淚也不敢吃一口,當(dāng)媽的心里真是難受花盐,但不敢表現(xiàn)出來羡滑,我心里怕著呢!昨天馬上吃中午飯了...
    直溜媽閱讀 255評論 1 0
  • 胡歌90秒快問快答 1.如果一切能夠重來,你會(huì)選擇靈兒還是月如? 胡:誰能活下來我選誰,因?yàn)槲已萘颂嗟慕巧?都是...
    馬戶君閱讀 1,731評論 0 0