Spark完全分布式集群搭建

環(huán)境準備

  • 服務器集群
    我用的CentOS-6.6版本的4個虛擬機文搂,主機名為hadoop01炕桨、hadoop02丧凤、hadoop03捌锭、hadoop04俘陷,另外我會使用hadoop用戶搭建集群(生產環(huán)境中root用戶不是可以任意使用的)

  • spark安裝包
    下載地址:https://mirrors.aliyun.com/apache/spark/
    我用的spark-2.2.0-bin-hadoop2.7.tgz
    要根據(jù)自己機器中的hadoop版本選擇對應的spark版本


1. 集群規(guī)劃

image.png

1、安裝Scala

下載路徑:http://www.scala-lang.org/download/

拷貝文件到對應主機

(1)cp or SSH Secure File Transfer Client

(2)解壓縮 tar -zvxf scala-2.12.2.tgz

(3)mv *** /opt/scala

(4)配置環(huán)境變量 /etc/profile

export SCALA_HOME=/home/hadoop3/scala-2.11.7
export PATH=$PATH:$SCALA_HOME/bin

(5)source /etc/profile

(6)驗證 scala -version

2. 詳細步驟

(1) 把安裝包上傳到hadoop01服務器并解壓

[hadoop@hadoop01 soft]$ tar zxvf spark-2.2.0-bin-hadoop2.7.tgz -C /home/hadoop/apps/

# 解壓后如果感覺安裝目錄的名稱太長可以修改一下
[hadoop@hadoop01 soft]$ cd /home/hadoop/apps/
[hadoop@hadoop01 apps]$ mv spark-2.2.0-bin-hadoop2.7 spark-2.2.0

(2) 修改spark-env.sh配置文件

# 把SPARK_HOME/conf/下的spark-env.sh.template文件復制為spark-env.sh
[hadoop@hadoop01 apps]$ cd spark-2.2.0/conf
[hadoop@hadoop01 conf]$ mv spark-env.sh.template spark-env.sh

# 修改spark-env.sh配置文件观谦,添加如下內容
[hadoop@hadoop01 conf]$ vim spark-env.sh 

# 配置JAVA_HOME拉盾,一般來說,不配置也可以豁状,但是可能會出現(xiàn)問題捉偏,還是配上吧
export JAVA_HOME=/usr/local/java/jdk1.8.0_73
# 一般來說,spark任務有很大可能性需要去HDFS上讀取文件泻红,所以配置上
# 如果說你的spark就讀取本地文件夭禽,也不需要yarn管理,不用配
export HADOOP_CONF_DIR=/home/hadoop/apps/hadoop-2.7.4/etc/hadoop

# 設置Master的主機名
export SPARK_MASTER_HOST=hadoop01
# 提交Application的端口谊路,默認就是這個讹躯,萬一要改呢,改這里
export SPARK_MASTER_PORT=7077
# 每一個Worker最多可以使用的cpu core的個數(shù)缠劝,我虛擬機就一個...
# 真實服務器如果有32個潮梯,你可以設置為32個
export SPARK_WORKER_CORES=1
# 每一個Worker最多可以使用的內存,我的虛擬機就2g
# 真實服務器如果有128G惨恭,你可以設置為100G
export SPARK_WORKER_MEMORY=1g

(3) 修改slaves配置文件酷麦,添加Worker的主機列表

[hadoop@hadoop01 conf]$ mv slaves.template slaves
[hadoop@hadoop01 conf]$ vim slaves

# 里面的內容原來為localhost
hadoop01
hadoop02
hadoop03
hadoop04

(4) 把SPARK_HOME/sbin下的start-all.sh和stop-all.sh這兩個文件重命名

比如分別把這兩個文件重命名為start-spark-all.sh和stop-spark-all.sh
原因:
如果集群中也配置HADOOP_HOME,那么在HADOOP_HOME/sbin目錄下也有start-all.sh和stop-all.sh這兩個文件喉恋,當你執(zhí)行這兩個文件沃饶,系統(tǒng)不知道是操作hadoop集群還是spark集群母廷。修改后就不會沖突了,當然糊肤,不修改的話琴昆,你需要進入它們的sbin目錄下執(zhí)行這些文件,這肯定就不會發(fā)生沖突了馆揉。我們配置SPARK_HOME主要也是為了執(zhí)行其他spark命令方便业舍。

[hadoop@hadoop01 conf]$ cd ../sbin
[hadoop@hadoop01 sbin]$ mv start-all.sh start-spark-all.sh
[hadoop@hadoop01 sbin]$ mv stop-all.sh stop-spark-all.sh

(5) 把spark安裝包分發(fā)給其他節(jié)點

[hadoop@hadoop01 apps]$ scp -r spark-2.2.0 hadoop02:`pwd`
[hadoop@hadoop01 apps]$ scp -r spark-2.2.0 hadoop03:`pwd`
[hadoop@hadoop01 apps]$ scp -r spark-2.2.0 hadoop04:`pwd`

(6) 在集群所有節(jié)點中配置SPARK_HOME環(huán)境變量

[hadoop@hadoop01 conf]$ vim ~/.bash_profile

export SPARK_HOME=/home/hadoop/apps/spark-2.2.0
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin

[hadoop@hadoop01 conf]$ source ~/.bash_profile

# 其他節(jié)點也都配置...

(7) 在spark master節(jié)點啟動spark集群

# 注意,如果你沒有執(zhí)行第4步升酣,一定要進入SPARK_HOME/sbin目錄下執(zhí)行這個命令
# 或者你在Master節(jié)點分別執(zhí)行start-master.sh和start-slaves.sh

[hadoop@hadoop01 conf]$ start-spark-all.sh

注意:

  • 如果你配置了HADOOP_CONF_DIR舷暮,在啟動spark集群之前,先啟動hadoop集群

(8) 驗證

image.png
image.png

spark完全分布式集群搭建成功噩茄!

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末下面,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子绩聘,更是在濱河造成了極大的恐慌沥割,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,204評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件凿菩,死亡現(xiàn)場離奇詭異机杜,居然都是意外死亡,警方通過查閱死者的電腦和手機衅谷,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,091評論 3 395
  • 文/潘曉璐 我一進店門椒拗,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人获黔,你說我怎么就攤上這事陡叠。” “怎么了肢执?”我有些...
    開封第一講書人閱讀 164,548評論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長译红。 經常有香客問我预茄,道長,這世上最難降的妖魔是什么侦厚? 我笑而不...
    開封第一講書人閱讀 58,657評論 1 293
  • 正文 為了忘掉前任耻陕,我火速辦了婚禮,結果婚禮上刨沦,老公的妹妹穿的比我還像新娘诗宣。我一直安慰自己,他們只是感情好想诅,可當我...
    茶點故事閱讀 67,689評論 6 392
  • 文/花漫 我一把揭開白布召庞。 她就那樣靜靜地躺著岛心,像睡著了一般。 火紅的嫁衣襯著肌膚如雪篮灼。 梳的紋絲不亂的頭發(fā)上忘古,一...
    開封第一講書人閱讀 51,554評論 1 305
  • 那天,我揣著相機與錄音诅诱,去河邊找鬼髓堪。 笑死,一個胖子當著我的面吹牛娘荡,可吹牛的內容都是我干的干旁。 我是一名探鬼主播,決...
    沈念sama閱讀 40,302評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼炮沐,長吁一口氣:“原來是場噩夢啊……” “哼争群!你這毒婦竟也來了?” 一聲冷哼從身側響起央拖,我...
    開封第一講書人閱讀 39,216評論 0 276
  • 序言:老撾萬榮一對情侶失蹤祭阀,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后鲜戒,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體专控,經...
    沈念sama閱讀 45,661評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 37,851評論 3 336
  • 正文 我和宋清朗相戀三年遏餐,在試婚紗的時候發(fā)現(xiàn)自己被綠了伦腐。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 39,977評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡失都,死狀恐怖柏蘑,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情粹庞,我是刑警寧澤咳焚,帶...
    沈念sama閱讀 35,697評論 5 347
  • 正文 年R本政府宣布,位于F島的核電站庞溜,受9級特大地震影響革半,放射性物質發(fā)生泄漏。R本人自食惡果不足惜流码,卻給世界環(huán)境...
    茶點故事閱讀 41,306評論 3 330
  • 文/蒙蒙 一又官、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧漫试,春花似錦六敬、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,898評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽普泡。三九已至,卻和暖如春典勇,著一層夾襖步出監(jiān)牢的瞬間劫哼,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,019評論 1 270
  • 我被黑心中介騙來泰國打工割笙, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留权烧,地道東北人。 一個月前我還...
    沈念sama閱讀 48,138評論 3 370
  • 正文 我出身青樓伤溉,卻偏偏與公主長得像般码,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子乱顾,可洞房花燭夜當晚...
    茶點故事閱讀 44,927評論 2 355

推薦閱讀更多精彩內容