hadoop+spark 偽分布式安裝

基本環(huán)境及軟件:

軟件版本 軟件包
centos-6.x
JDK-1.8 jdk-8u112-linux-x64.tar.gz
scala-2.11.8 jdk-8u112-linux-x64.tar.gz
hadoop-2.7 hadoop-2.7.4.tar.gz
spark-2.1.2 spark-2.1.2-bin-hadoop2.7.tgz

鍵入命令如下,安裝hadoop所需的基礎(chǔ)軟件:

    yum install -y ssh pdsh

jdk和scala安裝

1漾根、鍵入如下命令將jdk軟件包解壓至指定目錄:

tar -zxvf jdk-8u112-linux-x64.tar.gz -C /usr/local/

2荚板、鍵入如下命令將scala軟件包解壓至指定目錄:

 tar -zxvf scala-2.11.8.tgz -C /usr/local/

3窍蓝、鍵入如下命令編輯profile文件:

vim /etc/profile

4穿肄、設(shè)置jdk和scala環(huán)境變量狡逢,在profile文件的末尾添加如下內(nèi)容:

export JAVA_HOME=/usr/local/jdk1.8.0_112
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export SCALA_HOME=/usr/local/scala-2.11.8
export PATH=$JAVA_HOME/bin:$SCALA_HOME/bin:$PATH

5级及、鍵入如下命令讓颠锉,環(huán)境變量立即生效:

source /etc/profile

6法牲、檢查jdk

[root@localhost ~]# java -version
java version "1.8.0_112"
Java(TM) SE Runtime Environment (build 1.8.0_112-b15)
Java HotSpot(TM) 64-Bit Server VM (build 25.112-b15, mixed mode)

7、檢查scala

[root@localhost ~]# scala -version
Scala code runner version 2.11.8 -- Copyright 2002-2016, LAMP/EPFL

解壓&安裝hadoop

1琼掠、鍵入如下命令將hadoop軟件包解壓至指定目錄:

tar -zxvf hadoop-2.7.4.tar.gz -C /usr/local/

2拒垃、鍵入如下命令,給hadoop添加java環(huán)境變量:

vim /usr/local/hadoop-2.7.4/etc/hadoop/hadoop-env.sh

hadoop-env.sh文件中添加如下內(nèi)容:

export JAVA_HOME=/usr/local/jdk1.8.0_112

3瓷蛙、修改hadoop配置文件:

1)鍵入如下命令悼瓮,切換至hadoop配置文件目錄:

/usr/local/hadoop-2.7.4/etc/hadoop

2)編輯core-site.xml配置文件,添加如下內(nèi)容:

<configuration>
    <!--指定NamNode通信地址-->
    <property>
        <name>fs.defaultFS</name>
        <value>hdfs://localhost:9000</value>
    </property>
   <!--指定Hadoop運(yùn)行時(shí)產(chǎn)生文件的存儲(chǔ)路徑-->
    <property>
        <name>hadoop.tmp.dir</name>
        <value>/opt/hadoop/tmp</value>
    </property>
</configuration>

3)編輯hdfs-site.xml配置文件,添加如下內(nèi)容:

<configuration>
    <property>
        <name>dfs.name.dir</name>
        <value>/opt/hadoop/hdfs/name</value>
        <description>namenode上存儲(chǔ)hdfs名字空間元數(shù)據(jù) </description>
    </property>

    <property>
        <name>dfs.data.dir</name>
        <value>/opt/hadoop/hdfs/data</value>
        <description>datanode上數(shù)據(jù)塊的物理存儲(chǔ)位置</description>
    </property>

    <!-- 設(shè)置hdfs副本數(shù)量 -->
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

4)編輯mapred-site.xml配置文件艰猬,配置mapreducer框架運(yùn)行在yarn上:

鍵入如下命令復(fù)制mapred-site.xml配置文件:

cp mapred-site.xml.template mapred-site.xml

mapred-site.xml配置文件內(nèi)容如下:

<configuration>
<!-- 通知框架MR使用YARN -->
    <property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
</configuration>

4)編輯yarn配置yarn-site.xml横堡,添加如下內(nèi)容:

<configuration>
<!--reducer取數(shù)據(jù)的方式是mapreduce_shuffle-->
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

4、鍵入如下命令冠桃,創(chuàng)建hadoop數(shù)據(jù)目錄:

mkdir -p /opt/hadoop/{tmp,hdfs/{data,name}}

5命贴、鍵入如下命令,配置免密鑰登錄:

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 0600 ~/.ssh/authorized_keys

6食听、開啟防火墻端口:

鍵入如下命令胸蛛,編輯防火墻配置文件:

vim /etc/sysconfig/iptables

添加如下內(nèi)容:

-A INPUT -m state --state NEW -m tcp -p tcp --dport 8088 -j ACCEPT
-A INPUT -m state --state NEW -m tcp -p tcp --dport 50070 -j ACCEPT

重啟防火墻:

service iptables restart

7、格式化hdfs樱报,只需要在第一次安裝的時(shí)候格式化hdfs,命令如下:

/usr/local/hadoop-2.7.4/bin/hdfs namenode -format

8胚泌、鍵入如下命令,啟動(dòng)hdfs和yarn:

/usr/local/hadoop-2.7.4/sbin/start-all.sh

9肃弟、在瀏覽器中分別輸入如下地址校驗(yàn),hadoop是否安裝成功:
1)hadoop管理界面:http://{your_ip_address}:50070/
2)hadoop集群狀態(tài)界面:http://{your_ip_address}:8088/

解壓&安裝spark

1零蓉、鍵入如下命令將spark軟件包解壓至指定目錄:

tar -zxvf spark-2.1.2-bin-hadoop2.7.tgz -C /usr/local/

2笤受、編輯spark環(huán)境變量配置文件:
鍵入如下命令復(fù)制spark-env.sh配置文件

cp spark-env.sh.tamplate spark-env.sh

spark-env.sh配置文件中添加如下內(nèi)容:

export SCALA_HOME=/usr/local/scala-2.11.8
export JAVA_HOME=/usr/local/jdk1.8.0_112
export HADOOP_HOME=/usr/local/hadoop-2.7.4
export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop
export SPARK_MASTER_IP=localhost
export SPARK_LOCAL_IP=localhost
export SPAPK_LOCAL_DIRS=/usr/local/spark-2.1.2-bin-hadoop2.7
export SPARK_DRIVER_MEMORY=1G

3、在slave配置文件中添加如下內(nèi)容:

localhost

4敌蜂、鍵入如下命令箩兽,啟動(dòng)spark:

/usr/local/spark-2.1.2-bin-hadoop2.7/sbin/start-all.sh

mapreduce 和 spark wordcount測試

1、創(chuàng)建WordCount.txt文件,內(nèi)容如下:

Hello hadoop
hello spark

2章喉、在hdfs中創(chuàng)建一個(gè)目錄wordcount汗贫,并上傳WordCount.txt文件身坐,命令如下:
創(chuàng)建目錄:

hadoop fs -mkdir /wordcount

上傳文件:

hadoop fs -put -f WordCount.txt /wordcount

3、編寫wordcount程序并執(zhí)行:
1)mapreduce 版本示例代碼落包,跳轉(zhuǎn)至github地址

將git上的程序編譯之后上傳至hadoop服務(wù)器部蛇,鍵入如下命令運(yùn)行mapreduce:

hadoop jar mapreduce-wordcount.jar org.cooze.hadoop.mapreduce.wordcount.WordCount /wordcount /output

  1. spark java版本示例代碼,跳轉(zhuǎn)至github地址

    將git上的程序編譯之后上傳至hadoop服務(wù)器咐蝇,鍵入如下命令將spark程序提交到spark中運(yùn)行:
spark-submit --master spark://localhost:7077 \
 --name WordCount --class org.cooze.hadoop.spark.wordcount.java.WordCount \
  --executor-memory 512M --total-executor-cores 2 \
  ./spark-wordcount-java.jar /wordcount

  1. spark scala版本示例代碼涯鲁,跳轉(zhuǎn)至github地址

    將git上的程序編譯之后上傳至hadoop服務(wù)器,鍵入如下命令將spark程序提交到spark中運(yùn)行:
spark-submit --master spark://localhost:7077 \
 --name WordCount --class org.cooze.hadoop.spark.wordcount.scala.WordCount \
  --executor-memory 512M --total-executor-cores 2 \
  ./spark-wordcount-scala.jar /wordcount

  1. spark python版本示例代碼有序,跳轉(zhuǎn)至github地址

    鍵入如下命令將spark程序提交到spark中運(yùn)行:
spark-submit --executor-memory 512M --total-executor-cores 2 \
spark-wordcount-python.py 
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末抹腿,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子旭寿,更是在濱河造成了極大的恐慌警绩,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,839評(píng)論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件盅称,死亡現(xiàn)場離奇詭異肩祥,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)微渠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門搭幻,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人逞盆,你說我怎么就攤上這事檀蹋。” “怎么了云芦?”我有些...
    開封第一講書人閱讀 153,116評(píng)論 0 344
  • 文/不壞的土叔 我叫張陵俯逾,是天一觀的道長。 經(jīng)常有香客問我舅逸,道長桌肴,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,371評(píng)論 1 279
  • 正文 為了忘掉前任琉历,我火速辦了婚禮坠七,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘旗笔。我一直安慰自己彪置,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,384評(píng)論 5 374
  • 文/花漫 我一把揭開白布蝇恶。 她就那樣靜靜地躺著拳魁,像睡著了一般。 火紅的嫁衣襯著肌膚如雪撮弧。 梳的紋絲不亂的頭發(fā)上潘懊,一...
    開封第一講書人閱讀 49,111評(píng)論 1 285
  • 那天姚糊,我揣著相機(jī)與錄音,去河邊找鬼授舟。 笑死救恨,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的岂却。 我是一名探鬼主播忿薇,決...
    沈念sama閱讀 38,416評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢(mèng)啊……” “哼躏哩!你這毒婦竟也來了署浩?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,053評(píng)論 0 259
  • 序言:老撾萬榮一對(duì)情侶失蹤扫尺,失蹤者是張志新(化名)和其女友劉穎筋栋,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體正驻,經(jīng)...
    沈念sama閱讀 43,558評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡弊攘,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,007評(píng)論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了姑曙。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片襟交。...
    茶點(diǎn)故事閱讀 38,117評(píng)論 1 334
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖伤靠,靈堂內(nèi)的尸體忽然破棺而出捣域,到底是詐尸還是另有隱情,我是刑警寧澤宴合,帶...
    沈念sama閱讀 33,756評(píng)論 4 324
  • 正文 年R本政府宣布焕梅,位于F島的核電站,受9級(jí)特大地震影響卦洽,放射性物質(zhì)發(fā)生泄漏贞言。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,324評(píng)論 3 307
  • 文/蒙蒙 一阀蒂、第九天 我趴在偏房一處隱蔽的房頂上張望该窗。 院中可真熱鬧,春花似錦蚤霞、人聲如沸酗失。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至断医,卻和暖如春滞乙,著一層夾襖步出監(jiān)牢的瞬間奏纪,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評(píng)論 1 262
  • 我被黑心中介騙來泰國打工斩启, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留序调,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 45,578評(píng)論 2 355
  • 正文 我出身青樓兔簇,卻偏偏與公主長得像发绢,于是被迫代替她去往敵國和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子垄琐,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,877評(píng)論 2 345

推薦閱讀更多精彩內(nèi)容