Spark Sacla 程序打包與提交

程序打包

注意

1、打包前注意把本地模式配置去掉中符。
2、 Spark通過一系列的邏輯執(zhí)行計劃后編譯成物理執(zhí)行計劃,離線作業(yè)在Spark On yran 模式中 Spark 最終會編譯成MR作業(yè)妓美。
3、打包方式主要有兩種:

只打包編譯源文件:

優(yōu)點:打包后生成的jar包空間小鲤孵,只有幾K壶栋。缺點:如果在引用第三方jar包后在提交作業(yè)的時候需要通過--jars 來指定除了Spark 和scala 以及jdk 之外的jar包 比如JDBC 驅(qū)動,json解析工具等普监。

打包所有依賴文件:

優(yōu)點:不需要而外指定jar包贵试。缺點:生成的jar文件過大一般100M左右

maven插件

<plugin>
    <artifactId>maven-assembly-plugin</artifactId>
    <configuration>
        <archive>
            <manifest>
                <mainClass></mainClass>
            </manifest>
        </archive>
        <descriptorRefs>
            <descriptorRef>jar-with-dependencies</descriptorRef>
        </descriptorRefs>
    </configuration>
</plugin>

修改源碼(構建Session 不指定Local模式)

val session = SparkSession.builder().getOrCreate()

打包編譯命令

mvn assembly:assembly

把程序拷貝有服務器

原則上來說,一般服務器上的Spark 已經(jīng)配置好了HADOOP環(huán)境變量 以及HADOOP_CONF_DIR
官網(wǎng)Spark 提交應用

配置Spark環(huán)境 (這里主要講的是Spark OnYarn 需要的配置)

1凯正、配置HADOOP_CONF_DIR

cd {Spark環(huán)境變量}/conf 目錄如:cd /home/spark/spark-2.1.0-bin-2.6.0-cdh5.7.0/conf
ls 查看是否用 spark-env.sh 文件如果沒有 執(zhí)行命令拷貝模板
cp spark-env.sh.template spark-env.sh
所以我們需要配置HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop
vi spark-env.sh 并添加 HADOOP_CONF_DIR=/home/hadoop/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop

2毙玻、編寫shell 腳本來直接運行你的提交應用 (由于我已經(jīng)配置好spark 環(huán)境變量所有可以直接用 spark-submit,不需要指定目錄)

vi user_stat.sh 內(nèi)容如下

spark-submit \
--class cn.harsons.mbd.UserStatSaveApp \
--name UserStatSaveApp \
--master yarn \
--executor-memory 1G \
--num-executors 1 \
--files /home/lib/config/ipDatabase.csv,/home/lib/config/ipRegion.xlsx \
/home/lib/app.jar \
hdfs://hadoop001:8020/mbd/user/log/user_log.csv

vi user_stat_hdfs.sh 內(nèi)容如下

spark-submit \
--class cn.harsons.mbd.UserLogStatApp \
--name UserLogStatApp \
--master yarn \
--executor-memory 1G \
--num-executors 1 \
--files /home/lib/config/ipDatabase.csv,/home/lib/config/ipRegion.xlsx \
/home/lib/app.jar \
hdfs://hadoop001:8020/mbd/user/log/user_log.csv hdfs://hadoop001:8020/mbd/user/clean/log/

參數(shù)說明:
--class 指定main方法所在的class
--name 指定appName名稱將體現(xiàn)在yarn上面
--master yarn yarn模式提交spark
--executor-memory 1G 執(zhí)行內(nèi)存
--num-executors 1 執(zhí)行器個數(shù)
--files 指定程序加載的文件,這個類似于classPATH 下的配置文件指定
home/lib/app.jar 指定要運行的jar包
hdfs://hadoop001:8020/mbd/user/log/user_log.csv 程序入?yún)?這里是日志文件的目錄廊散。

測試數(shù)據(jù)說明

1桑滩、測試數(shù)據(jù)存放在hdfs 上面。
2允睹、hsfs 可能使用的命令:
創(chuàng)建目錄 : ./bin/hadoop fs -mkdir -p /mbd/user/log
加載文件到hdfs : ./bin/hadoop fs -appendToFile /home/lib/config/user_log.csv /mbd/user/log/user_log.csv

提交程序

授權 chmod u+x user_stat.sh | chmod u+x user_stat_hdfs.sh
提交 ./user_stat.sh 运准,./user_stat_hdfs.sh

查看結果

統(tǒng)計結果入庫
image.png
數(shù)據(jù)清洗后結果
image.png
Yarn 運行查看
image.png
輸出到HDFS 的結果
image.png
最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市缭受,隨后出現(xiàn)的幾起案子胁澳,更是在濱河造成了極大的恐慌,老刑警劉巖米者,帶你破解...
    沈念sama閱讀 218,386評論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件韭畸,死亡現(xiàn)場離奇詭異,居然都是意外死亡蔓搞,警方通過查閱死者的電腦和手機胰丁,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,142評論 3 394
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來喂分,“玉大人隘马,你說我怎么就攤上這事∑薅ィ” “怎么了酸员?”我有些...
    開封第一講書人閱讀 164,704評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長讳嘱。 經(jīng)常有香客問我幔嗦,道長,這世上最難降的妖魔是什么沥潭? 我笑而不...
    開封第一講書人閱讀 58,702評論 1 294
  • 正文 為了忘掉前任邀泉,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘汇恤。我一直安慰自己庞钢,他們只是感情好,可當我...
    茶點故事閱讀 67,716評論 6 392
  • 文/花漫 我一把揭開白布因谎。 她就那樣靜靜地躺著基括,像睡著了一般。 火紅的嫁衣襯著肌膚如雪财岔。 梳的紋絲不亂的頭發(fā)上风皿,一...
    開封第一講書人閱讀 51,573評論 1 305
  • 那天,我揣著相機與錄音匠璧,去河邊找鬼桐款。 笑死,一個胖子當著我的面吹牛夷恍,可吹牛的內(nèi)容都是我干的魔眨。 我是一名探鬼主播,決...
    沈念sama閱讀 40,314評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼酿雪,長吁一口氣:“原來是場噩夢啊……” “哼遏暴!你這毒婦竟也來了?” 一聲冷哼從身側響起执虹,我...
    開封第一講書人閱讀 39,230評論 0 276
  • 序言:老撾萬榮一對情侶失蹤拓挥,失蹤者是張志新(化名)和其女友劉穎唠梨,沒想到半個月后袋励,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,680評論 1 314
  • 正文 獨居荒郊野嶺守林人離奇死亡当叭,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,873評論 3 336
  • 正文 我和宋清朗相戀三年茬故,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片蚁鳖。...
    茶點故事閱讀 39,991評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡磺芭,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出醉箕,到底是詐尸還是另有隱情钾腺,我是刑警寧澤,帶...
    沈念sama閱讀 35,706評論 5 346
  • 正文 年R本政府宣布讥裤,位于F島的核電站放棒,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏己英。R本人自食惡果不足惜间螟,卻給世界環(huán)境...
    茶點故事閱讀 41,329評論 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧厢破,春花似錦荣瑟、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,910評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至加勤,卻和暖如春仙辟,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背鳄梅。 一陣腳步聲響...
    開封第一講書人閱讀 33,038評論 1 270
  • 我被黑心中介騙來泰國打工叠国, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人戴尸。 一個月前我還...
    沈念sama閱讀 48,158評論 3 370
  • 正文 我出身青樓粟焊,卻偏偏與公主長得像,于是被迫代替她去往敵國和親孙蒙。 傳聞我的和親對象是個殘疾皇子项棠,可洞房花燭夜當晚...
    茶點故事閱讀 44,941評論 2 355

推薦閱讀更多精彩內(nèi)容