Python學(xué)習(xí)—PySpark環(huán)境搭建

PySpark是Python整合Spark的一個(gè)擴(kuò)展包,可以使用Python進(jìn)行Spark開發(fā)躲因。而PySpark需要依賴Spark環(huán)境棘伴,Spark需要依賴Hadoop環(huán)境,而且摩骨,本地環(huán)境需要安裝JDK和Scala通贞。

一、環(huán)境準(zhǔn)備

  • Scala環(huán)境搭建仿吞,本例環(huán)境為2.11.8
  • JDK環(huán)境搭建滑频,本例環(huán)境為jdk1.8
  • Python環(huán)境準(zhǔn)備,本例環(huán)境為Anaconda唤冈,版本為python 3.7

說明

  • 本例中假設(shè)上述環(huán)境已經(jīng)搭建成功
  • 本例中所有環(huán)境均搭建在本地峡迷,本例為windows10

二、環(huán)境搭建

方案一

在本地搭建Hadoop+Spark+Python環(huán)境

1)Hadoop環(huán)境搭建

  • 安裝包下載

官方下載地址:https://www.apache.org/dist/hadoop/common/選擇你需要的版本

本例為hadoop-2.8.5

  • 本地解壓

將下載好的包解壓到本地環(huán)境中你虹,比如/D:/Hadoop/hadoop-2.8.5/

  • 添加環(huán)境變量

    a.添加環(huán)境變量HADOOP_HOME=解壓后路徑绘搞,比如HADOOP_HOME=D:\Hadoop\hadoop-2.8.5

    b.向PATH中添加追加HADOOP_HOME\bin

  • 測試環(huán)境

命令行中輸入hadoop version出現(xiàn)版本信息,表示搭建成功

  • 本地bin目錄替換

因?yàn)閔adoop是搭建在linux集群上的傅物,搭建本地環(huán)境(windows)需要windows環(huán)境支持包夯辖,這里我們直接替換本地hadoop的bin文件夾。
下載地址:https://github.com/cdarlint/winutils董饰,下載對應(yīng)版本替換本地/bin目錄

2)Spark環(huán)境搭建

  • 安裝包下載

官方地址:https://archive.apache.org/dist/spark/蒿褂,選擇Spark版本以及對應(yīng)hadoop版本

本例為spark-2.2.0-bin-hadoop2.7

  • 本地解壓

解壓到本地環(huán)境中圆米,比如D:\Spark\spark-2.2.0-bin-hadoop2.7

  • 添加環(huán)境變量

    a. 添加環(huán)境變量SPARK_HOME=解壓后的目錄,比如SPARK_HOME=D:\Spark\spark-2.2.0-bin-hadoop2.7
    b. 向PATH追加SPARK_HOME\bin

  • 測試環(huán)境

命令行中輸入spark-shell出現(xiàn)


即表示搭建成功啄栓,

  • 說明
    如果出現(xiàn)類似缺少winutil或者hivesession等錯(cuò)誤娄帖,檢查hadoop\bin文件夾是否替換成功,或者替換的版本是否一致昙楚。

3) pyspark環(huán)境整合

  • 安裝包解壓

a. 復(fù)制spark安裝目錄\python\lib中的py4j-0.10.4-src.zippyspark.zip包近速,如:

b. 粘貼包并解壓至Anaconda安裝目錄\Lib\site-package下,如果沒有使用Anaconda堪旧,把Anaconda安裝目錄替換成Python安裝目錄削葱。如:

  • 本地測試

在命令行輸入python進(jìn)入python環(huán)境,輸入import pyspark as ps不報(bào)錯(cuò)即表示成功

方案二

該方案與上述Spark環(huán)境搭建基本一致

  • 直接從官網(wǎng)獲取完整的Pyspark包
  • 解壓到本地環(huán)境中
  • 配置環(huán)境變量PYSPARK_HOME淳梦,以及path追加PYSPARK_HOME\bin
  • 復(fù)制并解壓pyspark解壓目錄\python\lib中的py4jpyspark包到Anaconda安裝目錄\Lib\site-package

結(jié)語

對于Python和Spark的整合析砸,雖然官方提供了相關(guān)包Pyspark,Pyspark是依賴Py4j包的谭跨。除此之外干厚,還需要基于一些已有的環(huán)境,整體完整的環(huán)境為JDK+Scala+Hadoop+Spark+Python以及常用的IDE螃宙,筆者這里使用的是PyCharm蛮瞄。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市谆扎,隨后出現(xiàn)的幾起案子挂捅,更是在濱河造成了極大的恐慌,老刑警劉巖堂湖,帶你破解...
    沈念sama閱讀 212,222評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件闲先,死亡現(xiàn)場離奇詭異,居然都是意外死亡无蜂,警方通過查閱死者的電腦和手機(jī)伺糠,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,455評論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來斥季,“玉大人训桶,你說我怎么就攤上這事『ㄇ悖” “怎么了舵揭?”我有些...
    開封第一講書人閱讀 157,720評論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長躁锡。 經(jīng)常有香客問我午绳,道長,這世上最難降的妖魔是什么映之? 我笑而不...
    開封第一講書人閱讀 56,568評論 1 284
  • 正文 為了忘掉前任拦焚,我火速辦了婚禮蜡坊,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘耕漱。我一直安慰自己算色,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,696評論 6 386
  • 文/花漫 我一把揭開白布螟够。 她就那樣靜靜地躺著,像睡著了一般峡钓。 火紅的嫁衣襯著肌膚如雪妓笙。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,879評論 1 290
  • 那天能岩,我揣著相機(jī)與錄音寞宫,去河邊找鬼。 笑死拉鹃,一個(gè)胖子當(dāng)著我的面吹牛辈赋,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播膏燕,決...
    沈念sama閱讀 39,028評論 3 409
  • 文/蒼蘭香墨 我猛地睜開眼钥屈,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了坝辫?” 一聲冷哼從身側(cè)響起篷就,我...
    開封第一講書人閱讀 37,773評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎近忙,沒想到半個(gè)月后竭业,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,220評論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡及舍,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,550評論 2 327
  • 正文 我和宋清朗相戀三年未辆,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片锯玛。...
    茶點(diǎn)故事閱讀 38,697評論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡咐柜,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出更振,到底是詐尸還是另有隱情炕桨,我是刑警寧澤,帶...
    沈念sama閱讀 34,360評論 4 332
  • 正文 年R本政府宣布肯腕,位于F島的核電站献宫,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏实撒。R本人自食惡果不足惜姊途,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,002評論 3 315
  • 文/蒙蒙 一涉瘾、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧捷兰,春花似錦立叛、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,782評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至顶考,卻和暖如春赁还,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背驹沿。 一陣腳步聲響...
    開封第一講書人閱讀 32,010評論 1 266
  • 我被黑心中介騙來泰國打工艘策, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人渊季。 一個(gè)月前我還...
    沈念sama閱讀 46,433評論 2 360
  • 正文 我出身青樓朋蔫,卻偏偏與公主長得像,于是被迫代替她去往敵國和親却汉。 傳聞我的和親對象是個(gè)殘疾皇子驯妄,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,587評論 2 350