spark

spark

spark的安裝

  • 安裝Scala

    • 下載頁面:http://www.scala-lang.org/files/archive/

    • 下載:

      wget http://www.scala-lang.org/files/archive/scala-docs-2.13.0-M3.tgz
      
    • 解壓:

      tar xvf package
      
    • 安裝:

      sudo mv scala-2.13.0 /usr/local/scala
      
    • 環(huán)境變量:

      ~/.bashrc

      #add
      #SCALA變量
      export SCALA_HOME=/usr/local/scala
      export PATH=$PATH:$SCALA_HOME/bin
      

      source .bashrc

    • 啟動Scala

      scala
      
  • 安裝Spark

    • 下載頁面:https://spark.apache.org/downloads.html

    • 下載:

      wget http://mirror.bit.edu.cn/apache/spark/spark-2.3.0/spark-2.3.0-bin-hadoop2.7.tgz
      
    • 解壓:

      tar zxf spark-2.3.0-bin-hadoop2.7.tgz
      
    • 安裝:

      sudo mv ./spark-2.3.0-bin-hadoop2.7 /usr/local/spark
      
    • 環(huán)境變量:

      #spark變量
      export PYSPARK_PYTHON=python3#pyspark版本
      export SPARK_HOME=/usr/local/spark
      export PATH=$PATH:$SPARK_HOME/bin
      
    • 啟動pyspark交互界面

      pyspark
      
    • 設(shè)置pyspark顯示信息

      cd /usr/local/spark/conf
      cp log4j.properties.template log4j.properties
      nano log4j.properties
      
      #修改成WARN
      log4j.rootCategory=WARN, console
      

本地運(yùn)行pyspark

pyspark --master local[*]

測試命令:

sc.master

textFile = sc.textFile("file:/usr/local/spark/README.md")
textFile.count()

Spark Standalone Cluster 運(yùn)行環(huán)境

  • 在master中設(shè)置spark-env.sh

復(fù)制模板文件

cp /usr/local/spark/conf/spark-env.sh.template /usr/local/spark/conf/spark-env.sh

編輯spark-env.sh文件

export SPARK_MASTER_IP=master#masterIP設(shè)置
export SPARK_WORKER_CORES=1#worker使用CPU核心數(shù)
export SPARK_WORKER_MEMORY=512m#每個worker使用內(nèi)存
export SPARK_WORKER_INSTANCES=1#實(shí)例數(shù)
  • 復(fù)制spark到data1偷线、data2辉懒、data3
ssh data1

sudo mkdir /usr/local/spark

sudo chown hduser:hduser /usr/local/spark

exit

sudo scp -r /usr/local/spark hduser@data1:/usr/local

data2拯啦、data3同樣配置

編輯slaves文件

sudo nano /usr/local/spark/conf/slaves

data1
data2
data3
  • 啟動Spark Standalone Cluster
/usr/local/spark/sbin/start-all/sh
  • 分別啟動master归敬、slaves
/usr/local/spark/sbin/start-master/sh
/usr/local/spark/sbin/start-slaves/sh
  • 運(yùn)行pyspark
pyspark --master spark://master:7077 --num-executors 1 --total-executor-cores 3 --executor-memory 512m
  • 測試命令
sc.master

textFile = sc.textFile("file:/usr/local/spark/README.md")
textFile.count()
  • spark web ui

http://master:8080/

IPython Notebook運(yùn)行python spark

安裝JUPYTER

sudo pip3 install jupyter

配置jupyter遠(yuǎn)程連接

  • 創(chuàng)建登錄密碼

    In [1]: from IPython.lib import passwd
    In [2]: passwd()
    Enter password:
    Verify password:
    Out[2]: 'sha1:................................' # 根據(jù)你的密碼生成sha1值
    
  • 創(chuàng)建jupyter notebook服務(wù)器

    ipython3 profile create myserver
    

    這里的myserver是自定義的服務(wù)器名字蒋失。

    執(zhí)行之后月匣,命令行會有輸出湖饱,告訴我們生成的文件在哪里遭殉。一般在/home/yourname/.ipython/profile_myserver/這個文件夾下。

    我們可以進(jìn)入到該文件夾下崔泵,并查看一下生成的文件:

    一般沒有問題的話秒赤,會生成ipython_config.pyipython_kernel_config.pyipython_notebook_config.py三個文件憎瘸。

    需要修改該ipython_notebook_config.py文件來配置服務(wù)器入篮。不過,我測試的時候這個文件不能生成幌甘,直接手動創(chuàng)建即可潮售。

  • 修改配置文件ipython_notebook_config.py

    c = get_config()
    c.IPKernelApp.pylab = 'inline'
    c.NotebookApp.ip='*'
    c.NotebookApp.open_browser = False
    c.NotebookApp.password = u'...........'  # 第2步生成的sha1值
    c.NotebookApp.port = 8888 # 端口號痊项,設(shè)置一個沒被占用的
    
  • 啟動jupyter notebook服務(wù)器

    jupyter notebook --config=/home/hduser/.ipython/profile_myserver/ipython_notebook_config.py
    

    此時可以遠(yuǎn)程瀏覽器訪問jupyter notebook

不同模式下pyspark 的jupyter notebook運(yùn)行

  • 本地模式:

    PYSPARK_DRIVER_PYTHON=jupyter PYSPARK_DRIVER_PYTHON_OPTS="notebook" pyspark --master local[*]
    
  • starnalone cluster 模式

    /usr/local/spark/sbin/start-all.sh
    
    PYSPARK_DRIVER_PYTHON=jupyter PYSPARK_DRIVER_PYTHON_OPTS="notebook" MASTER=spark://master:7077 pyspark --num-executors 1 --total-executor-cores 2 --executor-memory 512m
    
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市酥诽,隨后出現(xiàn)的幾起案子鞍泉,更是在濱河造成了極大的恐慌,老刑警劉巖肮帐,帶你破解...
    沈念sama閱讀 206,311評論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件咖驮,死亡現(xiàn)場離奇詭異,居然都是意外死亡训枢,警方通過查閱死者的電腦和手機(jī)托修,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,339評論 2 382
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來恒界,“玉大人诀黍,你說我怎么就攤上這事≌檀Γ” “怎么了眯勾?”我有些...
    開封第一講書人閱讀 152,671評論 0 342
  • 文/不壞的土叔 我叫張陵,是天一觀的道長婆誓。 經(jīng)常有香客問我吃环,道長,這世上最難降的妖魔是什么洋幻? 我笑而不...
    開封第一講書人閱讀 55,252評論 1 279
  • 正文 為了忘掉前任郁轻,我火速辦了婚禮,結(jié)果婚禮上文留,老公的妹妹穿的比我還像新娘好唯。我一直安慰自己,他們只是感情好燥翅,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,253評論 5 371
  • 文/花漫 我一把揭開白布骑篙。 她就那樣靜靜地躺著,像睡著了一般森书。 火紅的嫁衣襯著肌膚如雪靶端。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,031評論 1 285
  • 那天凛膏,我揣著相機(jī)與錄音杨名,去河邊找鬼。 笑死猖毫,一個胖子當(dāng)著我的面吹牛台谍,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播吁断,決...
    沈念sama閱讀 38,340評論 3 399
  • 文/蒼蘭香墨 我猛地睜開眼趁蕊,長吁一口氣:“原來是場噩夢啊……” “哼镊折!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起介衔,我...
    開封第一講書人閱讀 36,973評論 0 259
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎骂因,沒想到半個月后炎咖,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,466評論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡寒波,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,937評論 2 323
  • 正文 我和宋清朗相戀三年乘盼,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片俄烁。...
    茶點(diǎn)故事閱讀 38,039評論 1 333
  • 序言:一個原本活蹦亂跳的男人離奇死亡绸栅,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出页屠,到底是詐尸還是另有隱情粹胯,我是刑警寧澤,帶...
    沈念sama閱讀 33,701評論 4 323
  • 正文 年R本政府宣布辰企,位于F島的核電站风纠,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏牢贸。R本人自食惡果不足惜竹观,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,254評論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望潜索。 院中可真熱鬧臭增,春花似錦、人聲如沸竹习。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,259評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽整陌。三九已至芍锚,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間蔓榄,已是汗流浹背并炮。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評論 1 262
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留甥郑,地道東北人逃魄。 一個月前我還...
    沈念sama閱讀 45,497評論 2 354
  • 正文 我出身青樓,卻偏偏與公主長得像澜搅,于是被迫代替她去往敵國和親伍俘。 傳聞我的和親對象是個殘疾皇子邪锌,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,786評論 2 345

推薦閱讀更多精彩內(nèi)容