Spark的安裝

以前看過Hadoop沮稚,熟悉Hadoop的具體流程衡怀,也看了部分源碼,由于Spark比Hadoop高效蓝纲,想一直看也沒來得及抄邀,今天準(zhǔn)備玩玩Spark耘眨,先從安裝開始。

版本

Java:1.8
Hadoop:2.7.0
Spark:2.1.0

安裝Java與Hadoop主要步驟

  • 配置jdk境肾、Hadoop環(huán)境變量
  • 更改hosts文件
  • 配置SSH免密碼登錄
  • 修改Hadoop配置文件
  • 將配置好的jdk剔难、Hadoop分發(fā)到各個節(jié)點
  • 格式化Hadoop

Hadoop-2.7.0/etc/hadoop 目錄里面

本人將Java,Hadoop分別安裝在奥喻,
/home/my105/jdk1.9
/home/my105/hadoop-2.7.0

hadoop-env.sh

export JAVA_HOME=/home/my105/jdk1.8

配置core-site.xml

<configuration>
        <property>
                <name>fs.defaultFS</name>
                <value>hdfs://master:9000</value>
        </property>
        <property>
                <name>io.file.buffer.size</name>
                <value>131072</value>
        </property>
        <property>
                <name>hadoop.tmp.dir</name>
                <value>file:/home/my105/tmp</value>
        </property>
        <property>
                <name>hadoop.proxyuser.hduser.hosts</name>
                <value>*</value>
        </property>
        <property>
                <name>hadoop.proxyuser.hduser.groups</name>
                <value>*</value>
        </property>
</configuration>

配置YARN偶宫,yarn-site.xml

<configuration>
        <property>
                <name>yarn.nodemanager.aux-services</name>
                <value>mapreduce_shuffle</value>
        </property>
        <property>
                <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
                <value>org.apache.hadoop.mapred.ShuffleHandle</value>
        </property>
        <property>
                <name>yarn.resourcemanager.address</name>
                <value>master:8032</value>
        </property>
        <property>
                <name>yarn.resouremanager.scheduler.address</name>
                <value>master:8030</value>
        </property>
        <property>
                <name>yarn.resourcemanager.resource-tracker.address</name>
                <value>master:8031</value>
        </property>
        <property>
                <name>yarn.resourcemanager.admin.address</name>
                <value>master:8033</value>
        </property>
        <property>
                <name>yarn.resourcemanager.webapp.address</name>
                <value>master:8088</value>
        </property>
</configuration>

配置mapred-site.xml

<configuration>
        <property>
                <name>mapreduce.framwork.name</name>
                <value>yarn</value>
        </property>
        <property>
                <name>mapreduce.jobhistory.address</name>
                <value>master:10020</value>
        </property>
        <property>
                <name>mapreduce.jobhistory.webapp.address</name>
                <value>master:19888</value>
        </property>
</configuration>

配置hdfs-site.xml

此處我將NameNode和DataNode目錄放:/home/my105/hadoop-2.7.0/nodetemp 中的兩個文件,安裝完成后執(zhí)行:
sudo chmod 777 hadoop-2.7.0 -R
以上便于hadoop文件有權(quán)限創(chuàng)建上面的文件

<configuration>
        <property>
                <name>dfs.namenode.secondary.http-address</name>
                <value>master:9001</value>
        </property>
        <property>
                <name>dfs.namenode.name.dir</name>
                <value>file:/home/my105/hadoop-2.7.0/nodetemp/namenode</value>
        </property>
        <property>
                <name>dfs.datanode.data.dir</name>
                <value>file:/home/my105/hadoop-2.7.0/nodetemp/datanode</value>
        </property>
        <property>
                <name>dfs.replication</name>
                <value>3</value>
        </property>
        <property>
                <name>dfs.webhdfs.enabled</name>
                <value>true</value>
        </property>
</configuration>

配置master與slave文件

如果沒有發(fā)現(xiàn)master文件环鲤,自己創(chuàng)建一個

master文件:
  master
slaves文件:
  slave1 
  slave2
  slave3

格式化 與啟動

將配置好的Hadoop與JDK分別scp到各個Slave中纯趋,然后格式化,啟動,進(jìn)入Hadoop-2.7.0/ 目錄

./bin/hadoop namenode - format
./sbin/start-all.sh

最后輸入:jps吵冒,查看啟動進(jìn)程

master主機:
10648 ResourceManager
10265 NameNode
12939 Jps
10494 SecondaryNameNode
slave主機:
6977 NodeManager
7202 DataNode
7821 Jps

錯誤分析

如果沒有出現(xiàn)上面的纯命,或者出現(xiàn)錯誤,進(jìn)入hadoop-2.7.0/logs
我一開始格式化后再重新格式化后痹栖,發(fā)現(xiàn)slave主機的DataNode啟動不了亿汞,直接進(jìn)入logs
vi hadoop-my105-datanode-slave1.log
發(fā)現(xiàn)了如下錯誤
org.apache.hadoop.hdfs.server.datanode.DataNode: Initialization failed for Block pool <registering> (Datanode Uuid unassigned) service to master
就是master和slave主機生成的NameNode和DataNode目錄文件不一樣,所以先把生成的文件刪除揪阿,然后再格式化留夜,或者將Uuid 拷貝過去

Paste_Image.png

Spark 安裝

先進(jìn)入官網(wǎng)下載一個
版本:Spark-2.1.0

Paste_Image.png

安裝流程

  • 配置文件
  • 分發(fā)到各個節(jié)點
  • 啟動
    由于是預(yù)先安裝得Hadoop,所以在此處選擇without hadoop
    配置文件图甜,可能沒有碍粥,將spark-2.1.0/conf 下的部分帶template的改為如下名字,并添加

配置spark-env.sh

export JAVA_HOME=/home/my105/jdk1.8
export HADOOP_HOME=/home/my105/hadoop-2.7.0
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
SPARK_MASTER_IP=master
SPARK_LOCAL_DIRS=/home/my105/spark-2.1.0
SPARK_DRIVER_MEMORY=1G

配置slvaes

slave1
slave2
slave3

啟動集群

./sbin/start-all.sh 啟動黑毅,然后jps會發(fā)現(xiàn)如下內(nèi)容
master主機:Maser

10648 ResourceManager
10265 NameNode
13018 Jps
10494 SecondaryNameNode
11855 Master

slave主機:Worker

6977 NodeManager
7202 DataNode
7895 Jps
7498 Worker
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末嚼摩,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子矿瘦,更是在濱河造成了極大的恐慌枕面,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,042評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件缚去,死亡現(xiàn)場離奇詭異潮秘,居然都是意外死亡,警方通過查閱死者的電腦和手機易结,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 89,996評論 2 384
  • 文/潘曉璐 我一進(jìn)店門枕荞,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人搞动,你說我怎么就攤上這事躏精。” “怎么了鹦肿?”我有些...
    開封第一講書人閱讀 156,674評論 0 345
  • 文/不壞的土叔 我叫張陵矗烛,是天一觀的道長。 經(jīng)常有香客問我箩溃,道長瞭吃,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,340評論 1 283
  • 正文 為了忘掉前任涣旨,我火速辦了婚禮歪架,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘开泽。我一直安慰自己牡拇,他們只是感情好魁瞪,可當(dāng)我...
    茶點故事閱讀 65,404評論 5 384
  • 文/花漫 我一把揭開白布穆律。 她就那樣靜靜地躺著惠呼,像睡著了一般。 火紅的嫁衣襯著肌膚如雪峦耘。 梳的紋絲不亂的頭發(fā)上剔蹋,一...
    開封第一講書人閱讀 49,749評論 1 289
  • 那天,我揣著相機與錄音辅髓,去河邊找鬼泣崩。 笑死,一個胖子當(dāng)著我的面吹牛洛口,可吹牛的內(nèi)容都是我干的矫付。 我是一名探鬼主播,決...
    沈念sama閱讀 38,902評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼第焰,長吁一口氣:“原來是場噩夢啊……” “哼买优!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起挺举,我...
    開封第一講書人閱讀 37,662評論 0 266
  • 序言:老撾萬榮一對情侶失蹤杀赢,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后湘纵,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體脂崔,經(jīng)...
    沈念sama閱讀 44,110評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,451評論 2 325
  • 正文 我和宋清朗相戀三年梧喷,在試婚紗的時候發(fā)現(xiàn)自己被綠了砌左。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 38,577評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡铺敌,死狀恐怖绊困,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情适刀,我是刑警寧澤秤朗,帶...
    沈念sama閱讀 34,258評論 4 328
  • 正文 年R本政府宣布,位于F島的核電站笔喉,受9級特大地震影響取视,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜常挚,卻給世界環(huán)境...
    茶點故事閱讀 39,848評論 3 312
  • 文/蒙蒙 一作谭、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧奄毡,春花似錦折欠、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,726評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽咪奖。三九已至,卻和暖如春酱床,著一層夾襖步出監(jiān)牢的瞬間羊赵,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,952評論 1 264
  • 我被黑心中介騙來泰國打工扇谣, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留昧捷,地道東北人。 一個月前我還...
    沈念sama閱讀 46,271評論 2 360
  • 正文 我出身青樓罐寨,卻偏偏與公主長得像靡挥,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子鸯绿,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,452評論 2 348

推薦閱讀更多精彩內(nèi)容

  • --------"道路是曲折的,前途是光明的芹血。"最近又涉及到了hadoop以及spark的安裝,之前課題設(shè)計中有要...
    九七學(xué)姐閱讀 3,028評論 3 5
  • 之前的有點忘記了,這里在云筆記拿出來再玩玩.看不懂的可以留言 大家可以嘗試下Ambari來配置Hadoop的相關(guān)環(huán)...
    HT_Jonson閱讀 2,947評論 0 50
  • 最近在學(xué)習(xí)大數(shù)據(jù)技術(shù)楞慈,朋友叫我直接學(xué)習(xí)Spark幔烛,英雄不問出處,菜鳥不問對錯囊蓝,于是我就開始了Spark學(xué)習(xí)饿悬。 為什...
    Plokmijn閱讀 26,503評論 6 26
  • 簡述 hadoop 集群一共有4種部署模式,詳見《hadoop 生態(tài)圈介紹》聚霜。HA聯(lián)邦模式解決了單純HA模式的性能...
    mtide閱讀 12,793評論 8 20
  • 近來思無緒狡恬,心亂幾多悵; 罷筆邀親友蝎宇,驅(qū)車到九襄弟劲; 石橋柳深綠,驛道菊澄黃姥芥; 青水漫秋池兔乞,盈盈勝春江; 閑臥草聽風(fēng)...
    卿公子的小酒館閱讀 552評論 5 8