Spark的安裝和配置

Spark簡介

Apache Spark 是專為大規(guī)模數(shù)據(jù)處理而設(shè)計的快速通用的計算引擎。
Spark最初作為一個研究項目峦剔，誕生于加州大學伯克利分校AMP實驗室，主要原因是AMP實驗室的研究人員發(fā)現(xiàn)在機器學習迭代算法場景下，Hadoop MapReduce的效率很低。為了迭代算法和交互式查詢兩種典型的場景昂羡，于是Spark應運而生。
Spark剛誕生時摔踱，常常被稱為內(nèi)存計算虐先，主要原因是在典型應用中，Spark讀取HDFS中的文件派敷，加載到內(nèi)存蛹批，在內(nèi)存中使用彈性分布式數(shù)據(jù)集（Resilient Distributed Dataset，RDD）來組織數(shù)據(jù)篮愉。RDD可以重用腐芍，支持重復訪問，在機器學習的各個迭代中它都會駐留在內(nèi)存试躏，這樣可以顯著的提升性能猪勇。即便是必須使用磁盤進行復雜計算的場景，Spark也常常比Hadoop MapReduce更加高效颠蕴。
Saprk是一個通用計算框架埠对，包含了特定場景下的計算庫：Streaming络断、SQL、MLlib项玛、Graphx等貌笨，除了支持常見的MapReduce范式，還能夠支持圖計算襟沮、流式計算等復雜計算場景锥惋，在很大程度上彌補了Hadoop的不足。

Spark分布式安裝部署

安裝Scala

首先在集群中的主節(jié)點服務器hadoop-1中進行安裝配置开伏，Scala安裝包可以到官方網(wǎng)站https://www.scala-lang.org/進行下載膀跌。
使用Xftp將Scala和Spark安裝包上傳到hadoop-1的/usr目錄下：

Spark安裝01.png

安裝Scala，進入/user目錄固灵，使用tar命令將壓縮包進行解壓捅伤，執(zhí)行命令：

# tar zxvf scala-2.12.2.tgz

Spark安裝02.png

解壓完成后會在/usr目錄下生成scala-2.12.2目錄：

Spark安裝03.png

使用vim編輯環(huán)境變量：

# vim /etc/profile

新增內(nèi)容如下：

export SCALA_HOME=/usr/scala-2.12.2
export PATH=$SCALA_HOME/bin:$PATH

Spark安裝04.png

保存退出，巫玻，執(zhí)行命令使修改生效：

# source /etc/profile

執(zhí)行以下命令查看安裝是否成功：

# scala -version

Spark安裝05.png

顯示版本信息則安裝成功丛忆，hadoop-2和hadoop-3節(jié)點主機環(huán)境變量做相同配置。

安裝Spark

Spark安裝包可以到官方網(wǎng)站http://spark.apache.org/進行下載仍秤。
安裝Spark熄诡，進入/user目錄，使用tar命令將壓縮包進行解壓诗力，執(zhí)行命令：

# tar zxvf spark-2.4.4-bin-hadoop2.7.tgz

Spark安裝06.png

解壓完成后會在/usr目錄下生成spark-2.4.4-bin-hadoop2.7目錄：

Spark安裝07.png

使用vim編輯環(huán)境變量：

# vim /etc/profile

新增內(nèi)容如下：

export SPARK_HOME=/usr/spark-2.4.4-bin-hadoop2.7
export PATH=$SPARK_HOME/bin:$PATH

Spark安裝08.png

保存退出凰浮，，執(zhí)行命令使修改生效：

# source /etc/profile

Spark配置

進入Spark的配置文件目錄苇本，并查看該目錄下的文件：

# cd /usr/spark-2.4.4-bin-hadoop2.7/conf/
# ll

Spark安裝09.png

執(zhí)行以下命令袜茧，創(chuàng)建spark-env.sh文件和slaves文件：

# cp spark-env.sh.template spark-env.sh
# cp slaves.template slaves

Spark安裝10.png

使用vim編輯配置文件spark-env.sh：

# vim spark-env.sh

新增以下內(nèi)容：

export JAVA_HOME=/usr/java/jdk1.8.0_201-amd64
export HADOOP_HOME=/usr/hadoop-2.7.7
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export SCALA_HOME=/usr/scala-2.12.2
export SPARK_HOME=/usr/spark-2.4.4-bin-hadoop2.7
export SPARK_MASTER_IP=hadoop-1
export SPARK_EXECUTOR_MEMORY=1G

Spark安裝11.png

保存退出，使用vim編輯配置文件slaves文件：

# vim slaves

新增以下內(nèi)容：

hadoop-2
hadoop-3

Spark安裝12.png

保存退出瓣窄。

部署

使用scp命令將Scala和Spark分別遠程拷貝到hadoop-2和hadoop-3節(jié)點主機中：

# scp -r /usr/scala-2.12.2 hadoop-2:/usr/
# scp -r /usr/scala-2.12.2 hadoop-3:/usr/
# scp -r /usr/spark-2.4.4-bin-hadoop2.7 hadoop-2:/usr/
# scp -r /usr/spark-2.4.4-bin-hadoop2.7 hadoop-3:/usr/

在hadoop-2和hadoop-3兩臺主機的/usr目錄下可以看到已經(jīng)拷貝成功：

Spark安裝15.png

啟動Spark

啟動Spark首先要保證Hadoop集群在運行中笛厦。
在hadoop-1主節(jié)點中進行啟動，進入Spark的sbin目錄下康栈，執(zhí)行啟動命令：

# cd /usr/spark-2.4.4-bin-hadoop2.7/sbin/
# ./start-all.sh

啟動完成后递递，使用jps命令可以查看啟動的進程。
hadoop-1主節(jié)點為Master進程：

Spark安裝17.png

hadoop-2和hadoop-3節(jié)點為Work進程：

Spark安裝18.png

Spark安裝19.png

瀏覽器訪問：http://192.168.44.128:8080/：

Spark安裝16.png

此處若在啟動Spark前啥么，已經(jīng)事先將Hadoop登舞、ZooKeeper、Hbase等啟動完成悬荣，則8080端口會被ZooKeeper占用菠秒，這是由于ZooKeeper 3.5版本新特性決定的，此時Spark啟動端口會被換成8081，查看Spark Master日志文件內(nèi)容践叠，可以看到該端口變換信息言缤。
使用spark-shell命令，可以與Spark進行交互：

Spark安裝20.png

瀏覽器訪問：http://192.168.44.128:4040/jobs/禁灼，可以在Web頁面找那個查看Job情況：

Spark安裝21.png

至此Spark的安裝配置完成管挟。

最后編輯于：2019.12.10 13:27:19

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市弄捕，隨后出現(xiàn)的幾起案子僻孝，更是在濱河造成了極大的恐慌，老刑警劉巖守谓，帶你破解...
沈念sama閱讀 206,482評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件穿铆，死亡現(xiàn)場離奇詭異，居然都是意外死亡斋荞，警方通過查閱死者的電腦和手機荞雏，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,377評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來平酿，“玉大人凤优，你說我怎么就攤上這事∪痉” “怎么了别洪？”我有些...
開封第一講書人閱讀 152,762評論 0贊 342
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵叨恨，是天一觀的道長柳刮。經(jīng)常有香客問我，道長痒钝，這世上最難降的妖魔是什么秉颗？我笑而不...
開封第一講書人閱讀 55,273評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮送矩，結(jié)果婚禮上蚕甥，老公的妹妹穿的比我還像新娘。我一直安慰自己栋荸，他們只是感情好菇怀，可當我...
茶點故事閱讀 64,289評論 5贊 373
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著晌块，像睡著了一般爱沟。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上匆背，一...
開封第一講書人閱讀 49,046評論 1贊 285
城市分裂傳說
那天呼伸，我揣著相機與錄音，去河邊找鬼钝尸。笑死括享，一個胖子當著我的面吹牛搂根，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播铃辖，決...
沈念sama閱讀 38,351評論 3贊 400
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼剩愧，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了娇斩？” 一聲冷哼從身側(cè)響起隙咸，我...
開封第一講書人閱讀 36,988評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎成洗，沒想到半個月后五督，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 43,476評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡瓶殃，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 35,948評論 2贊 324
?白月光啟示錄
正文我和宋清朗相戀三年充包，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片遥椿。...
茶點故事閱讀 38,064評論 1贊 333
活死人
序言：一個原本活蹦亂跳的男人離奇死亡基矮，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出冠场，到底是詐尸還是另有隱情家浇，我是刑警寧澤，帶...
沈念sama閱讀 33,712評論 4贊 323
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布碴裙，位于F島的核電站钢悲，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏舔株。R本人自食惡果不足惜莺琳，卻給世界環(huán)境...
茶點故事閱讀 39,261評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望载慈。院中可真熱鬧惭等，春花似錦、人聲如沸办铡。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,264評論 0贊 19
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽寡具。三九已至秤茅，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間晒杈，已是汗流浹背嫂伞。一陣腳步聲響...
開封第一講書人閱讀 31,486評論 1贊 262
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人帖努。一個月前我還...
沈念sama閱讀 45,511評論 2贊 354
代替公主和親
正文我出身青樓撰豺，卻偏偏與公主長得像，于是被迫代替她去往敵國和親拼余。傳聞我的和親對象是個殘疾皇子污桦，可洞房花燭夜當晚...
茶點故事閱讀 42,802評論 2贊 345