pyspark 使用virtualenv打包獨(dú)立運(yùn)行環(huán)境

背景:

pyspark 運(yùn)行時需要很多額外數(shù)據(jù)科學(xué)包,比如pandas,numpy, pyspark 等等 颗管。如果不使用virtualenv 獨(dú)立打包,你需要在每個nodemanager 節(jié)點(diǎn)上的python都要安裝這些包,而且還設(shè)計各種版本問題卵渴。

如果使用virtualenv獨(dú)立打包,每個用戶都將有一個獨(dú)立的python環(huán)境包鲤竹,每個用戶可以根據(jù)自己的需求安裝自己的版本浪读。
而且不需要在nodemanager 每個節(jié)點(diǎn)上安裝,也不影響系統(tǒng)的python環(huán)境辛藻。

1碘橘、找一個機(jī)器pip install virtualenv

2、創(chuàng)建一個虛擬環(huán)境virtualenv -p /usr/bin/python3.6 pyspark_env

-p 指定python版本吱肌,如果想用python2.7 就指定/usr/bin/python2.7

3痘拆、source pyspark_env/bin/activate 進(jìn)入創(chuàng)建的python虛擬環(huán)境

4、pyspark_env/bin/pip install pandas pyspark numpy

5氮墨、deactivate 推出虛擬環(huán)境

6纺蛆、zip -r pyspark_env.zip pyspark_env 打包成一個zip

7、hadoop fs -put pyspark_env.zip /tmp/pyspark_env.zip 把pyspark_env.zip 上傳到hdfs

8勇边、提交任務(wù) 加上--archives 以及指定spark driver python路徑

spark-submit \
--deploy-mode cluster \
--master yarn \
--driver-memory 2g \
--num-executors 6 \
--executor-memory 4g \
--executor-cores 2 \
--queue default \
--name test \
--archives hdfs:///tmp/pyspark_env.zip#pyspark_env \
--conf spark.pyspark.driver.python=./pyspark_env/pyspark_env/bin/python3 \
--conf spark.pyspark.python=./pyspark_env/pyspark_env/bin/python3 \
/home/hadoop/tmp/nibo/test.py

--archives hdfs:///tmp/pyspark_env.zip#pyspark_env
#號后面的pyspark_env 意思是解壓zip的目錄名字犹撒,如果不加#pyspark_env 解壓的目錄名就會變成pyspark_env.zip。

這樣提交pyspark任務(wù)粒褒,nodemanager就會到hdfs 先把python環(huán)境包下載下來识颊,然后解壓。執(zhí)行任務(wù) 奕坟。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末祥款,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子月杉,更是在濱河造成了極大的恐慌刃跛,老刑警劉巖,帶你破解...
    沈念sama閱讀 219,427評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件苛萎,死亡現(xiàn)場離奇詭異桨昙,居然都是意外死亡检号,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,551評論 3 395
  • 文/潘曉璐 我一進(jìn)店門蛙酪,熙熙樓的掌柜王于貴愁眉苦臉地迎上來齐苛,“玉大人,你說我怎么就攤上這事桂塞“挤洌” “怎么了?”我有些...
    開封第一講書人閱讀 165,747評論 0 356
  • 文/不壞的土叔 我叫張陵阁危,是天一觀的道長玛痊。 經(jīng)常有香客問我,道長狂打,這世上最難降的妖魔是什么擂煞? 我笑而不...
    開封第一講書人閱讀 58,939評論 1 295
  • 正文 為了忘掉前任,我火速辦了婚禮趴乡,結(jié)果婚禮上颈娜,老公的妹妹穿的比我還像新娘。我一直安慰自己浙宜,他們只是感情好官辽,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,955評論 6 392
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著粟瞬,像睡著了一般同仆。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上裙品,一...
    開封第一講書人閱讀 51,737評論 1 305
  • 那天俗批,我揣著相機(jī)與錄音,去河邊找鬼市怎。 笑死岁忘,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的区匠。 我是一名探鬼主播干像,決...
    沈念sama閱讀 40,448評論 3 420
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼驰弄!你這毒婦竟也來了麻汰?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,352評論 0 276
  • 序言:老撾萬榮一對情侶失蹤戚篙,失蹤者是張志新(化名)和其女友劉穎五鲫,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體岔擂,經(jīng)...
    沈念sama閱讀 45,834評論 1 317
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡位喂,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,992評論 3 338
  • 正文 我和宋清朗相戀三年浪耘,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片塑崖。...
    茶點(diǎn)故事閱讀 40,133評論 1 351
  • 序言:一個原本活蹦亂跳的男人離奇死亡点待,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出弃舒,到底是詐尸還是另有隱情,我是刑警寧澤状原,帶...
    沈念sama閱讀 35,815評論 5 346
  • 正文 年R本政府宣布聋呢,位于F島的核電站,受9級特大地震影響颠区,放射性物質(zhì)發(fā)生泄漏削锰。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,477評論 3 331
  • 文/蒙蒙 一毕莱、第九天 我趴在偏房一處隱蔽的房頂上張望器贩。 院中可真熱鬧,春花似錦朋截、人聲如沸蛹稍。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,022評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽唆姐。三九已至,卻和暖如春廓八,著一層夾襖步出監(jiān)牢的瞬間奉芦,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,147評論 1 272
  • 我被黑心中介騙來泰國打工剧蹂, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留声功,地道東北人。 一個月前我還...
    沈念sama閱讀 48,398評論 3 373
  • 正文 我出身青樓宠叼,卻偏偏與公主長得像先巴,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子冒冬,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,077評論 2 355

推薦閱讀更多精彩內(nèi)容