大數(shù)據(jù)學習之Hadoop環(huán)境搭建

一专缠、Hadoop的優(yōu)勢

1)高可靠性:因為Hadoop假設(shè)計算元素和存儲會出現(xiàn)故障弦追,因為它維護多個工作數(shù)據(jù)副本毕骡,在出現(xiàn)故障時可以對失敗的節(jié)點重新分布處理驴娃。

2)高擴展性:在集群間分配任務數(shù)據(jù)奏候,可方便的擴展數(shù)以千計的節(jié)點。

3) 高效性:在MapReduce的思想下唇敞,Hadoop是并行工作的蔗草,以加快任務處理速度。

4)高容錯性:自動保存多份副本數(shù)據(jù)疆柔,并且能夠自動將失敗的任務重新分配咒精。

二、Hadoop組成

1)Hadoop HDFS:一個高可靠旷档、高吞吐量的分布式文件系統(tǒng)模叙。

2)Hadoop MapReduce:一個分布式的離線并行計算框架。

3)Hadoop YARN:作業(yè)調(diào)度與集群資源管理的框架鞋屈。

4)Hadoop Common:支持其他模塊的工具模塊范咨。

2.1 HDFS(Hadoop Distributed File System)架構(gòu)概述

1)NameNode(nn):存儲文件的元數(shù)據(jù)故觅,如文件名,文件目錄結(jié)構(gòu)渠啊,文件屬性(生成時間逻卖、副本數(shù)、文件權(quán)限)昭抒,以及每個文件的塊列表和塊所在的DataNode等评也。

2)DataNode(dn):在本地文件系統(tǒng)存儲文件塊數(shù)據(jù),以及塊數(shù)據(jù)的校驗和灭返。

3)Secondary NameNode(2nn):用來監(jiān)控HDFS狀態(tài)的輔助后臺程序盗迟,每隔一段時間獲取HDFS元數(shù)據(jù)的快照。

2.2 YARN架構(gòu)概述

1)ResourceManager(rm):處理客戶端請求熙含、啟動/監(jiān)控ApplicationMaster罚缕、監(jiān)控NodeManager、資源分配與調(diào)度怎静;

2)NodeManager(nm):單個節(jié)點上的資源管理邮弹、處理來自ResourceManager的命令、處理來自ApplicationMaster的命令蚓聘;

3)ApplicationMaster:數(shù)據(jù)切分腌乡、為應用程序申請資源,并分配給內(nèi)部任務夜牡、任務監(jiān)控與容錯与纽。

4)Container:對任務運行環(huán)境的抽象,封裝了CPU塘装、內(nèi)存等多維資源以及環(huán)境變量急迂、啟動命令等任務運行相關(guān)的信息。

2.3 MapReduce架構(gòu)概述

MapReduce將計算過程分為兩個階段:Map和Reduce

1)Map階段并行處理輸入數(shù)據(jù)

2)Reduce階段對Map結(jié)果進行匯總

三蹦肴、Hadoop環(huán)境搭建

1 虛擬機網(wǎng)絡(luò)模式設(shè)置為NAT


最后僚碎,重新啟動系統(tǒng)。

2.修改為靜態(tài)ip

1)使用命令 vim /etc/sysconfig/network-scripts/ifcfg-eth0

2)修改選項有五項:

IPADDR=192.168.110.61

GATEWAY=192.168.110.2

ONBOOT=yes

BOOTPROTO=static

DNS1=192.168.110.2


修改完成后保存退出(:wq )

3)執(zhí)行service network restart

4)如果報錯阴幌,reboot勺阐,重啟虛擬機

3.修改主機名

1)修改linux的hosts文件

(1)進入Linux系統(tǒng)查看本機的主機名。通過hostname命令查看

(2)如果感覺此主機名不合適裂七,我們可以進行修改皆看。通過編輯/etc/sysconfig/network文件

(3)修改后保存退出

(4)編輯

vim /etc/hosts

(5)并重啟設(shè)備,重啟后背零,查看主機名腰吟,已經(jīng)修改成功

4.關(guān)閉防火墻

1)查看防火墻開機啟動狀態(tài)

chkconfig iptables --list

2)關(guān)閉防火墻

chkconfig iptables off

5.安裝jdk

1)卸載現(xiàn)有jdk

(1)查詢安裝jdk的版本:

java -version

(2)查詢是否安裝java軟件:

rpm -qa|grep java

(3)如果安裝的版本低于1.7,卸載該jdk:

rpm -e 軟件包

2)用filezilla工具將jdk導入到usr目錄下面的java文件夾下面

3)在linux系統(tǒng)下的usr目錄中查看軟件包是否導入成功(使用.gz包或者.rpm包,本處使用.rpm包)毛雇。


4).gz包使用命令 tar -zxf jdk***.gz 解壓到當前目錄; .rpm包使用命令 rpm -ivh jdk***.rpm 進行安裝.

5)配置jdk環(huán)境變量

(1) 先獲取jdk路徑:使用命令pwd


(2)打開/etc/profile文件:

vi /etc/profile

在profie文件末尾添加jdk路徑:

#set java environment

JAVA_HOME=/usr/java/jdk1.8.0_171-amd64

JRE_HOME=/usr/java/jdk1.8.0_171-amd64/jre

CLASS_PATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib

PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin

export JAVA_HOME JRE_HOME CLASS_PATH PATH

(3)保存后退出:

:wq

(4)讓修改后的文件生效:


6)重啟(如果java –version可以用就不用重啟):

7) 測試jdk安裝成功


四嫉称、安裝Hadoop

1)通過用filezilla工具將Hadoop導入/usr/local/src/中,官方下載地址:http://mirrors.shu.edu.cn/apache/hadoop/common/


2)解壓安裝文件 tar -zxf hadoop-2.7.6.tar.gz

3)配置hadoop中的hadoop-env.sh

(1)Linux系統(tǒng)中獲取jdk的安裝路徑:


(2)進入 hadoop-2.7.6/etc/hadoop/中 灵疮,修改hadoop-env.sh文件中JAVA_HOME 路徑:

export JAVA_HOME=/opt/module/jdk1.7.0_79

4)將hadoop添加到環(huán)境變量

(1)獲取hadoop安裝路徑:


(2)打開/etc/profile文件:

在profie文件末尾添加hadoop路徑:

#HADOOP_HOME

export HADOOP_HOME=/usr/local/src/hadoop-2.7.6

export PATH=$PATH:$HADOOP_HOME/bin

export PATH=$PATH:$HADOOP_HOME/sbin

(3)保存后退出:

:wq

(4)讓修改后的文件生效:


(5)使用hadoop查看是否安裝成功织阅,如果hadoop命令不能使用則重啟再查看。





需要大數(shù)據(jù)學基礎(chǔ)到項目實戰(zhàn)學習資料的可以加群:615997810震捣,群里有小伙伴整理好了學習資料荔棉,有大數(shù)據(jù),java蒿赢,java面試润樱,Python的學習資料哦,找群主免費領(lǐng)取哦羡棵。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末壹若,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子皂冰,更是在濱河造成了極大的恐慌店展,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,214評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件秃流,死亡現(xiàn)場離奇詭異赂蕴,居然都是意外死亡,警方通過查閱死者的電腦和手機剔应,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,307評論 2 382
  • 文/潘曉璐 我一進店門睡腿,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人峻贮,你說我怎么就攤上這事∮Υ常” “怎么了纤控?”我有些...
    開封第一講書人閱讀 152,543評論 0 341
  • 文/不壞的土叔 我叫張陵,是天一觀的道長碉纺。 經(jīng)常有香客問我船万,道長,這世上最難降的妖魔是什么骨田? 我笑而不...
    開封第一講書人閱讀 55,221評論 1 279
  • 正文 為了忘掉前任耿导,我火速辦了婚禮,結(jié)果婚禮上态贤,老公的妹妹穿的比我還像新娘舱呻。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 64,224評論 5 371
  • 文/花漫 我一把揭開白布箱吕。 她就那樣靜靜地躺著芥驳,像睡著了一般。 火紅的嫁衣襯著肌膚如雪茬高。 梳的紋絲不亂的頭發(fā)上兆旬,一...
    開封第一講書人閱讀 49,007評論 1 284
  • 那天,我揣著相機與錄音怎栽,去河邊找鬼丽猬。 笑死,一個胖子當著我的面吹牛熏瞄,可吹牛的內(nèi)容都是我干的宝鼓。 我是一名探鬼主播,決...
    沈念sama閱讀 38,313評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼巴刻,長吁一口氣:“原來是場噩夢啊……” “哼愚铡!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起胡陪,我...
    開封第一講書人閱讀 36,956評論 0 259
  • 序言:老撾萬榮一對情侶失蹤沥寥,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后柠座,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體邑雅,經(jīng)...
    沈念sama閱讀 43,441評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,925評論 2 323
  • 正文 我和宋清朗相戀三年妈经,在試婚紗的時候發(fā)現(xiàn)自己被綠了淮野。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,018評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡吹泡,死狀恐怖骤星,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情爆哑,我是刑警寧澤洞难,帶...
    沈念sama閱讀 33,685評論 4 322
  • 正文 年R本政府宣布,位于F島的核電站揭朝,受9級特大地震影響队贱,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜潭袱,卻給世界環(huán)境...
    茶點故事閱讀 39,234評論 3 307
  • 文/蒙蒙 一柱嫌、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧屯换,春花似錦编丘、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,240評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽癣防。三九已至,卻和暖如春掌眠,著一層夾襖步出監(jiān)牢的瞬間蕾盯,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,464評論 1 261
  • 我被黑心中介騙來泰國打工蓝丙, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留级遭,地道東北人。 一個月前我還...
    沈念sama閱讀 45,467評論 2 352
  • 正文 我出身青樓渺尘,卻偏偏與公主長得像挫鸽,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子鸥跟,可洞房花燭夜當晚...
    茶點故事閱讀 42,762評論 2 345

推薦閱讀更多精彩內(nèi)容