spark.jars.packages使用鏡像源加速

我們知道褒纲,通過指定spark.jars.packages參數(shù)准夷,可以添加依賴的包。而且相比于用spark.jars直接指定jar文件路徑莺掠,前者還可以自動下載所需依賴衫嵌,在有網(wǎng)絡的情況下非常方便。
然而默認情況下spark會到maven的中央倉庫進行下載彻秆,速度非常慢楔绞。我們可以使用國內的鏡像源進行加速。以華為云鏡像為例唇兑。

1. 指定ivy2配置文件路徑

spark是通過ivy2進行包下載的酒朵,而其配置文件默認打包在了$SPARK_HOME/jars/ivy-2.4.0.jar里,因此無法修改扎附。我們通過spark配置來修改其配置文件路徑蔫耽。在$SPARK_HOME/conf/spark-defaults.conf中添加:

spark.jars.ivySettings /home/mvpboss1004/.ivy2/ivysettings.xml
# add a package
spark.jars.packages org.apache.spark:spark-streaming-kafka-0-10-assembly_2.12:3.0.0

2. ivy2配置文件中添加鏡像源

修改之前指定的ivysettings.xml文件,如不存在則新建留夜。增加:

<ivysettings>
  <settings defaultResolver="chain"/>
  <resolvers>
    <chain name="chain">
      <ibiblio name="huaweicloud" root="https://mirrors.huaweicloud.com/repository/maven" m2compatible="true"/>
      <ibiblio name="central" m2compatible="true"/>
    </chain>
  </resolvers>
</ivysettings>

這里的華為云也可以換成阿里云匙铡、阿里云等鏡像源。

3. 測試

運行pyspark碍粥。如下所示鳖眼,最后一行"found *** in huaweicloud"可以確認下載源已經(jīng)換成了華為云。

Python 3.6.8 (default, Apr 2 2020, 13:34:55)
[GCC 4.8.5 20150623 (Red Hat 4.8.5-39)] on linux
Type "help", "copyright", "credits" or "license" for more information.
:: loading settings :: file = /home/mvpboss1004/.ivy2/ivysettings.xml
Ivy Default Cache set to: /home/mvpboss1004/.ivy2/cache
The jars for the packages stored in: /home/mvpboss1004/.ivy2/jars
:: loading settings :: url = jar:file:/usr/share/spark-3.0.0-bin-hadoop2.7/jars/ivy-2.4.0.jar!/org/apache/ivy/core/settings/ivysettings.xml
org.apache.spark#spark-streaming-kafka-0-10-assembly_2.12 added as a dependency
:: resolving dependencies :: org.apache.spark#spark-submit-parent-d8756840-be94-4d96-8c99-a4b319f7b26c;1.0
confs: [default]
found org.apache.spark#spark-streaming-kafka-0-10-assembly_2.12;3.0.0 in huaweicloud

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末嚼摩,一起剝皮案震驚了整個濱河市钦讳,隨后出現(xiàn)的幾起案子矿瘦,更是在濱河造成了極大的恐慌,老刑警劉巖蜂厅,帶你破解...
    沈念sama閱讀 221,635評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件匪凡,死亡現(xiàn)場離奇詭異膊畴,居然都是意外死亡掘猿,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,543評論 3 399
  • 文/潘曉璐 我一進店門唇跨,熙熙樓的掌柜王于貴愁眉苦臉地迎上來稠通,“玉大人,你說我怎么就攤上這事买猖「拈伲” “怎么了?”我有些...
    開封第一講書人閱讀 168,083評論 0 360
  • 文/不壞的土叔 我叫張陵玉控,是天一觀的道長飞主。 經(jīng)常有香客問我,道長高诺,這世上最難降的妖魔是什么碌识? 我笑而不...
    開封第一講書人閱讀 59,640評論 1 296
  • 正文 為了忘掉前任,我火速辦了婚禮虱而,結果婚禮上筏餐,老公的妹妹穿的比我還像新娘。我一直安慰自己牡拇,他們只是感情好魁瞪,可當我...
    茶點故事閱讀 68,640評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著惠呼,像睡著了一般导俘。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上剔蹋,一...
    開封第一講書人閱讀 52,262評論 1 308
  • 那天趟畏,我揣著相機與錄音,去河邊找鬼滩租。 笑死赋秀,一個胖子當著我的面吹牛,可吹牛的內容都是我干的律想。 我是一名探鬼主播猎莲,決...
    沈念sama閱讀 40,833評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼技即!你這毒婦竟也來了著洼?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,736評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎身笤,沒想到半個月后豹悬,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,280評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡液荸,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,369評論 3 340
  • 正文 我和宋清朗相戀三年瞻佛,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片娇钱。...
    茶點故事閱讀 40,503評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡伤柄,死狀恐怖,靈堂內的尸體忽然破棺而出文搂,到底是詐尸還是另有隱情适刀,我是刑警寧澤,帶...
    沈念sama閱讀 36,185評論 5 350
  • 正文 年R本政府宣布煤蹭,位于F島的核電站笔喉,受9級特大地震影響,放射性物質發(fā)生泄漏硝皂。R本人自食惡果不足惜常挚,卻給世界環(huán)境...
    茶點故事閱讀 41,870評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望吧彪。 院中可真熱鬧待侵,春花似錦、人聲如沸姨裸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,340評論 0 24
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽傀缩。三九已至那先,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間赡艰,已是汗流浹背售淡。 一陣腳步聲響...
    開封第一講書人閱讀 33,460評論 1 272
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留慷垮,地道東北人揖闸。 一個月前我還...
    沈念sama閱讀 48,909評論 3 376
  • 正文 我出身青樓,卻偏偏與公主長得像料身,于是被迫代替她去往敵國和親汤纸。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,512評論 2 359