Spark的安裝和配置

Spark簡介

Apache Spark 是專為大規(guī)模數(shù)據(jù)處理而設(shè)計的快速通用的計算引擎。
Spark最初作為一個研究項目峦剔,誕生于加州大學伯克利分校AMP實驗室,主要原因是AMP實驗室的研究人員發(fā)現(xiàn)在機器學習迭代算法場景下,Hadoop MapReduce的效率很低。為了迭代算法和交互式查詢兩種典型的場景昂羡,于是Spark應運而生。
Spark剛誕生時摔踱,常常被稱為內(nèi)存計算虐先,主要原因是在典型應用中,Spark讀取HDFS中的文件派敷,加載到內(nèi)存蛹批,在內(nèi)存中使用彈性分布式數(shù)據(jù)集(Resilient Distributed Dataset,RDD)來組織數(shù)據(jù)篮愉。RDD可以重用腐芍,支持重復訪問,在機器學習的各個迭代中它都會駐留在內(nèi)存试躏,這樣可以顯著的提升性能猪勇。即便是必須使用磁盤進行復雜計算的場景,Spark也常常比Hadoop MapReduce更加高效颠蕴。
Saprk是一個通用計算框架埠对,包含了特定場景下的計算庫:Streaming络断、SQL、MLlib项玛、Graphx等貌笨,除了支持常見的MapReduce范式,還能夠支持圖計算襟沮、流式計算等復雜計算場景锥惋,在很大程度上彌補了Hadoop的不足。

Spark分布式安裝部署

安裝Scala

首先在集群中的主節(jié)點服務器hadoop-1中進行安裝配置开伏,Scala安裝包可以到官方網(wǎng)站https://www.scala-lang.org/進行下載膀跌。
使用Xftp將Scala和Spark安裝包上傳到hadoop-1的/usr目錄下:

Spark安裝01.png

安裝Scala,進入/user目錄固灵,使用tar命令將壓縮包進行解壓捅伤,執(zhí)行命令:

# tar zxvf scala-2.12.2.tgz
Spark安裝02.png

解壓完成后會在/usr目錄下生成scala-2.12.2目錄:


Spark安裝03.png

使用vim編輯環(huán)境變量:

# vim /etc/profile

新增內(nèi)容如下:

export SCALA_HOME=/usr/scala-2.12.2
export PATH=$SCALA_HOME/bin:$PATH
Spark安裝04.png

保存退出,巫玻,執(zhí)行命令使修改生效:

# source /etc/profile

執(zhí)行以下命令查看安裝是否成功:

# scala -version
Spark安裝05.png

顯示版本信息則安裝成功丛忆,hadoop-2和hadoop-3節(jié)點主機環(huán)境變量做相同配置。

安裝Spark

Spark安裝包可以到官方網(wǎng)站http://spark.apache.org/進行下載仍秤。
安裝Spark熄诡,進入/user目錄,使用tar命令將壓縮包進行解壓诗力,執(zhí)行命令:

# tar zxvf spark-2.4.4-bin-hadoop2.7.tgz
Spark安裝06.png

解壓完成后會在/usr目錄下生成spark-2.4.4-bin-hadoop2.7目錄:


Spark安裝07.png

使用vim編輯環(huán)境變量:

# vim /etc/profile

新增內(nèi)容如下:

export SPARK_HOME=/usr/spark-2.4.4-bin-hadoop2.7
export PATH=$SPARK_HOME/bin:$PATH
Spark安裝08.png

保存退出凰浮,,執(zhí)行命令使修改生效:

# source /etc/profile

Spark配置

進入Spark的配置文件目錄苇本,并查看該目錄下的文件:

# cd /usr/spark-2.4.4-bin-hadoop2.7/conf/
# ll
Spark安裝09.png

執(zhí)行以下命令袜茧,創(chuàng)建spark-env.sh文件和slaves文件:

# cp spark-env.sh.template spark-env.sh
# cp slaves.template slaves
Spark安裝10.png

使用vim編輯配置文件spark-env.sh:

# vim spark-env.sh

新增以下內(nèi)容:

export JAVA_HOME=/usr/java/jdk1.8.0_201-amd64
export HADOOP_HOME=/usr/hadoop-2.7.7
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export SCALA_HOME=/usr/scala-2.12.2
export SPARK_HOME=/usr/spark-2.4.4-bin-hadoop2.7
export SPARK_MASTER_IP=hadoop-1
export SPARK_EXECUTOR_MEMORY=1G
Spark安裝11.png

保存退出,使用vim編輯配置文件slaves文件:

# vim slaves

新增以下內(nèi)容:

hadoop-2
hadoop-3
Spark安裝12.png

保存退出瓣窄。

部署

使用scp命令將Scala和Spark分別遠程拷貝到hadoop-2和hadoop-3節(jié)點主機中:

# scp -r /usr/scala-2.12.2 hadoop-2:/usr/
# scp -r /usr/scala-2.12.2 hadoop-3:/usr/
# scp -r /usr/spark-2.4.4-bin-hadoop2.7 hadoop-2:/usr/
# scp -r /usr/spark-2.4.4-bin-hadoop2.7 hadoop-3:/usr/

在hadoop-2和hadoop-3兩臺主機的/usr目錄下可以看到已經(jīng)拷貝成功:


Spark安裝15.png

啟動Spark

啟動Spark首先要保證Hadoop集群在運行中笛厦。
在hadoop-1主節(jié)點中進行啟動,進入Spark的sbin目錄下康栈,執(zhí)行啟動命令:

# cd /usr/spark-2.4.4-bin-hadoop2.7/sbin/
# ./start-all.sh

啟動完成后递递,使用jps命令可以查看啟動的進程。
hadoop-1主節(jié)點為Master進程:

Spark安裝17.png

hadoop-2和hadoop-3節(jié)點為Work進程:
Spark安裝18.png

Spark安裝19.png

瀏覽器訪問:http://192.168.44.128:8080/
Spark安裝16.png


此處若在啟動Spark前啥么,已經(jīng)事先將Hadoop登舞、ZooKeeper、Hbase等啟動完成悬荣,則8080端口會被ZooKeeper占用菠秒,這是由于ZooKeeper 3.5版本新特性決定的,此時Spark啟動端口會被換成8081,查看Spark Master日志文件內(nèi)容践叠,可以看到該端口變換信息言缤。
使用spark-shell命令,可以與Spark進行交互:
Spark安裝20.png

瀏覽器訪問:http://192.168.44.128:4040/jobs/禁灼,可以在Web頁面找那個查看Job情況:
Spark安裝21.png

至此Spark的安裝配置完成管挟。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市弄捕,隨后出現(xiàn)的幾起案子僻孝,更是在濱河造成了極大的恐慌,老刑警劉巖守谓,帶你破解...
    沈念sama閱讀 206,482評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件穿铆,死亡現(xiàn)場離奇詭異,居然都是意外死亡斋荞,警方通過查閱死者的電腦和手機荞雏,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,377評論 2 382
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來平酿,“玉大人凤优,你說我怎么就攤上這事∪痉” “怎么了别洪?”我有些...
    開封第一講書人閱讀 152,762評論 0 342
  • 文/不壞的土叔 我叫張陵叨恨,是天一觀的道長柳刮。 經(jīng)常有香客問我,道長痒钝,這世上最難降的妖魔是什么秉颗? 我笑而不...
    開封第一講書人閱讀 55,273評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮送矩,結(jié)果婚禮上蚕甥,老公的妹妹穿的比我還像新娘。我一直安慰自己栋荸,他們只是感情好菇怀,可當我...
    茶點故事閱讀 64,289評論 5 373
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著晌块,像睡著了一般爱沟。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上匆背,一...
    開封第一講書人閱讀 49,046評論 1 285
  • 那天呼伸,我揣著相機與錄音,去河邊找鬼钝尸。 笑死括享,一個胖子當著我的面吹牛搂根,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播铃辖,決...
    沈念sama閱讀 38,351評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼剩愧,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了娇斩?” 一聲冷哼從身側(cè)響起隙咸,我...
    開封第一講書人閱讀 36,988評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎成洗,沒想到半個月后五督,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,476評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡瓶殃,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 35,948評論 2 324
  • 正文 我和宋清朗相戀三年充包,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片遥椿。...
    茶點故事閱讀 38,064評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡基矮,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出冠场,到底是詐尸還是另有隱情家浇,我是刑警寧澤,帶...
    沈念sama閱讀 33,712評論 4 323
  • 正文 年R本政府宣布碴裙,位于F島的核電站钢悲,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏舔株。R本人自食惡果不足惜莺琳,卻給世界環(huán)境...
    茶點故事閱讀 39,261評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望载慈。 院中可真熱鬧惭等,春花似錦、人聲如沸办铡。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,264評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽寡具。三九已至秤茅,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間晒杈,已是汗流浹背嫂伞。 一陣腳步聲響...
    開封第一講書人閱讀 31,486評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人帖努。 一個月前我還...
    沈念sama閱讀 45,511評論 2 354
  • 正文 我出身青樓撰豺,卻偏偏與公主長得像,于是被迫代替她去往敵國和親拼余。 傳聞我的和親對象是個殘疾皇子污桦,可洞房花燭夜當晚...
    茶點故事閱讀 42,802評論 2 345

推薦閱讀更多精彩內(nèi)容

  • 摘要:大數(shù)據(jù)門檻較高,僅僅環(huán)境的搭建可能就要耗費我們大量的精力匙监,本文總結(jié)了作者是如何搭建大數(shù)據(jù)環(huán)境的(單機版和集群...
    楊赟快跑閱讀 15,010評論 3 65
  • --------"道路是曲折的,前途是光明的凡橱。"最近又涉及到了hadoop以及spark的安裝,之前課題設(shè)計中有要...
    九七學姐閱讀 3,018評論 3 5
  • Scala語法 至于scala語法而言亭姥,大致上和Java的語法類似稼钩,增加了一些函數(shù)式編程,具體語法可以參考Scal...
    卡卡xx閱讀 2,775評論 0 1
  • 每天日更达罗,會消除我的焦慮和孤獨感嗎坝撑?跟他見面確實是把達利摩斯劍,說不定什么時候他的觀點就可以讓我自卑乃至無地自容粮揉,...
    谷氣質(zhì)閱讀 153評論 0 0
  • 這是一條沒有同伴的路 它注定孤單 追逐著夢的少年 不要害怕孤單 至少你還有 這遍地的月光陪伴
    南邊的鯨閱讀 164評論 0 0