大數(shù)據(jù)學習之Hadoop環(huán)境搭建

一专缠、Hadoop的優(yōu)勢

1）高可靠性：因為Hadoop假設(shè)計算元素和存儲會出現(xiàn)故障弦追，因為它維護多個工作數(shù)據(jù)副本毕骡，在出現(xiàn)故障時可以對失敗的節(jié)點重新分布處理驴娃。

2）高擴展性：在集群間分配任務數(shù)據(jù)奏候，可方便的擴展數(shù)以千計的節(jié)點。

3）高效性：在MapReduce的思想下唇敞，Hadoop是并行工作的蔗草，以加快任務處理速度。

4）高容錯性：自動保存多份副本數(shù)據(jù)疆柔，并且能夠自動將失敗的任務重新分配咒精。

二、Hadoop組成

1）Hadoop HDFS：一個高可靠旷档、高吞吐量的分布式文件系統(tǒng)模叙。

2）Hadoop MapReduce：一個分布式的離線并行計算框架。

3）Hadoop YARN：作業(yè)調(diào)度與集群資源管理的框架鞋屈。

4）Hadoop Common：支持其他模塊的工具模塊范咨。

2.1 HDFS（Hadoop Distributed File System）架構(gòu)概述

1）NameNode（nn）：存儲文件的元數(shù)據(jù)故觅，如文件名，文件目錄結(jié)構(gòu)渠啊，文件屬性（生成時間逻卖、副本數(shù)、文件權(quán)限）昭抒，以及每個文件的塊列表和塊所在的DataNode等评也。

2）DataNode(dn)：在本地文件系統(tǒng)存儲文件塊數(shù)據(jù)，以及塊數(shù)據(jù)的校驗和灭返。

3）Secondary NameNode(2nn)：用來監(jiān)控HDFS狀態(tài)的輔助后臺程序盗迟，每隔一段時間獲取HDFS元數(shù)據(jù)的快照。

2.2 YARN架構(gòu)概述

1）ResourceManager(rm)：處理客戶端請求熙含、啟動/監(jiān)控ApplicationMaster罚缕、監(jiān)控NodeManager、資源分配與調(diào)度怎静；

2）NodeManager(nm)：單個節(jié)點上的資源管理邮弹、處理來自ResourceManager的命令、處理來自ApplicationMaster的命令蚓聘；

3）ApplicationMaster：數(shù)據(jù)切分腌乡、為應用程序申請資源，并分配給內(nèi)部任務夜牡、任務監(jiān)控與容錯与纽。

4）Container：對任務運行環(huán)境的抽象，封裝了CPU塘装、內(nèi)存等多維資源以及環(huán)境變量急迂、啟動命令等任務運行相關(guān)的信息。

2.3 MapReduce架構(gòu)概述

MapReduce將計算過程分為兩個階段：Map和Reduce

1）Map階段并行處理輸入數(shù)據(jù)

2）Reduce階段對Map結(jié)果進行匯總

三蹦肴、Hadoop環(huán)境搭建

1 虛擬機網(wǎng)絡(luò)模式設(shè)置為NAT

最后僚碎，重新啟動系統(tǒng)。

2.修改為靜態(tài)ip

1）使用命令 vim /etc/sysconfig/network-scripts/ifcfg-eth0

2）修改選項有五項：

IPADDR=192.168.110.61

GATEWAY=192.168.110.2

ONBOOT=yes

BOOTPROTO=static

DNS1=192.168.110.2

修改完成后保存退出（：wq ）

3）執(zhí)行service network restart

4）如果報錯阴幌，reboot勺阐，重啟虛擬機

3.修改主機名

1）修改linux的hosts文件

（1）進入Linux系統(tǒng)查看本機的主機名。通過hostname命令查看

（2）如果感覺此主機名不合適裂七，我們可以進行修改皆看。通過編輯/etc/sysconfig/network文件

（3）修改后保存退出

（4）編輯

vim /etc/hosts

（5）并重啟設(shè)備，重啟后背零，查看主機名腰吟，已經(jīng)修改成功

4.關(guān)閉防火墻

1）查看防火墻開機啟動狀態(tài)

chkconfig iptables --list

2）關(guān)閉防火墻

chkconfig iptables off

5.安裝jdk

1）卸載現(xiàn)有jdk

（1）查詢安裝jdk的版本：

java -version

（2）查詢是否安裝java軟件：

rpm -qa|grep java

（3）如果安裝的版本低于1.7，卸載該jdk：

rpm -e 軟件包

2）用filezilla工具將jdk導入到usr目錄下面的java文件夾下面

3）在linux系統(tǒng)下的usr目錄中查看軟件包是否導入成功（使用.gz包或者.rpm包，本處使用.rpm包）毛雇。

4).gz包使用命令 tar -zxf jdk***.gz 解壓到當前目錄; .rpm包使用命令 rpm -ivh jdk***.rpm 進行安裝.

5）配置jdk環(huán)境變量

（1）先獲取jdk路徑：使用命令pwd

（2）打開/etc/profile文件：

vi /etc/profile

在profie文件末尾添加jdk路徑：

#set java environment

JAVA_HOME=/usr/java/jdk1.8.0_171-amd64

JRE_HOME=/usr/java/jdk1.8.0_171-amd64/jre

CLASS_PATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib

PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin

export JAVA_HOME JRE_HOME CLASS_PATH PATH

（3）保存后退出：

:wq

（4）讓修改后的文件生效：

6）重啟（如果java –version可以用就不用重啟）：

7) 測試jdk安裝成功

四嫉称、安裝Hadoop

1）通過用filezilla工具將Hadoop導入/usr/local/src/中，官方下載地址：http://mirrors.shu.edu.cn/apache/hadoop/common/

2）解壓安裝文件 tar -zxf hadoop-2.7.6.tar.gz

3）配置hadoop中的hadoop-env.sh

（1）Linux系統(tǒng)中獲取jdk的安裝路徑：

(2）進入 hadoop-2.7.6/etc/hadoop/中灵疮，修改hadoop-env.sh文件中JAVA_HOME 路徑：

export JAVA_HOME=/opt/module/jdk1.7.0_79

4）將hadoop添加到環(huán)境變量

（1）獲取hadoop安裝路徑：

（2）打開/etc/profile文件：

在profie文件末尾添加hadoop路徑：

#HADOOP_HOME

export HADOOP_HOME=/usr/local/src/hadoop-2.7.6

export PATH=$PATH:$HADOOP_HOME/bin

export PATH=$PATH:$HADOOP_HOME/sbin

（3）保存后退出：

:wq

（4）讓修改后的文件生效：

（5）使用hadoop查看是否安裝成功织阅，如果hadoop命令不能使用則重啟再查看。

需要大數(shù)據(jù)學基礎(chǔ)到項目實戰(zhàn)學習資料的可以加群：615997810震捣，群里有小伙伴整理好了學習資料荔棉，有大數(shù)據(jù)，java蒿赢，java面試润樱，Python的學習資料哦，找群主免費領(lǐng)取哦羡棵。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末壹若，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子皂冰，更是在濱河造成了極大的恐慌店展，老刑警劉巖，帶你破解...
沈念sama閱讀 206,214評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件秃流，死亡現(xiàn)場離奇詭異赂蕴，居然都是意外死亡，警方通過查閱死者的電腦和手機剔应，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,307評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門睡腿，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人峻贮，你說我怎么就攤上這事∮Υ常” “怎么了纤控？”我有些...
開封第一講書人閱讀 152,543評論 0贊 341
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長碉纺。經(jīng)常有香客問我船万，道長，這世上最難降的妖魔是什么骨田？我笑而不...
開封第一講書人閱讀 55,221評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任耿导，我火速辦了婚禮，結(jié)果婚禮上态贤，老公的妹妹穿的比我還像新娘舱呻。我一直安慰自己，他們只是感情好，可當我...
茶點故事閱讀 64,224評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布箱吕。她就那樣靜靜地躺著芥驳，像睡著了一般。火紅的嫁衣襯著肌膚如雪茬高。梳的紋絲不亂的頭發(fā)上兆旬，一...
開封第一講書人閱讀 49,007評論 1贊 284
城市分裂傳說
那天，我揣著相機與錄音怎栽，去河邊找鬼丽猬。笑死，一個胖子當著我的面吹牛熏瞄，可吹牛的內(nèi)容都是我干的宝鼓。我是一名探鬼主播，決...
沈念sama閱讀 38,313評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼巴刻，長吁一口氣：“原來是場噩夢啊……” “哼愚铡！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起胡陪，我...
開封第一講書人閱讀 36,956評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤沥寥，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后柠座，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體邑雅，經(jīng)...
沈念sama閱讀 43,441評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 35,925評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年妈经，在試婚紗的時候發(fā)現(xiàn)自己被綠了淮野。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 38,018評論 1贊 333
活死人
序言：一個原本活蹦亂跳的男人離奇死亡吹泡，死狀恐怖骤星，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情爆哑，我是刑警寧澤洞难，帶...
沈念sama閱讀 33,685評論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站揭朝，受9級特大地震影響队贱，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜潭袱，卻給世界環(huán)境...
茶點故事閱讀 39,234評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一柱嫌、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧屯换，春花似錦编丘、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,240評論 0贊 19
一樁弒父案瘪吏，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽癣防。三九已至，卻和暖如春掌眠，著一層夾襖步出監(jiān)牢的瞬間蕾盯，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,464評論 1贊 261
情欲美人皮
我被黑心中介騙來泰國打工蓝丙，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留级遭，地道東北人。一個月前我還...
沈念sama閱讀 45,467評論 2贊 352
代替公主和親
正文我出身青樓渺尘，卻偏偏與公主長得像挫鸽，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子鸥跟，可洞房花燭夜當晚...
茶點故事閱讀 42,762評論 2贊 345

大數(shù)據(jù)學習之Hadoop環(huán)境搭建

推薦閱讀更多精彩內(nèi)容