Spark常見問題解決辦法

以下是在學習和使用spark過程中遇到的一些問題取试，記錄下來猿棉。

1、首先來說說spark任務運行完后查錯最常用的一個命令，那就是把任務運行日志down下來。程序存在錯誤元莫，將日志down下來查看具體原因苇侵！down日志命令：yarn logs -applicationId app_id

2、Spark性能優(yōu)化的9大問題及其解決方案<http://book.51cto.com/art/201409/453045.htm>
Spark程序優(yōu)化所需要關注的幾個關鍵點——最主要的是數(shù)據(jù)序列化和內(nèi)存優(yōu)化

問題1：reduce task數(shù)目不合適
解決方法：需根據(jù)實際情況調(diào)節(jié)默認配置猿推，調(diào)整方式是修改參數(shù)spark.default.parallelism。通常盲再，reduce數(shù)目設置為core數(shù)目的2到3倍蓖救。數(shù)量太大念赶，造成很多小任務阵漏，增加啟動任務的開銷柠硕；數(shù)目太少，任務運行緩慢厢钧。
問題2：shuffle磁盤IO時間長
解決方法：設置spark.local.dir為多個磁盤拾给，并設置磁盤為IO速度快的磁盤，通過增加IO來優(yōu)化shuffle性能；
問題3：map|reduce數(shù)量大谴返，造成shuffle小文件數(shù)目多
解決方法：默認情況下shuffle文件數(shù)目為map tasks * reduce tasks. 通過設置spark.shuffle.consolidateFiles為true渠抹，來合并shuffle中間文件为迈，此時文件數(shù)為reduce tasks數(shù)目焊傅；
問題4：序列化時間長松却、結(jié)果大
解決方法：Spark默認使.用JDK.自帶的ObjectOutputStream，這種方式產(chǎn)生的結(jié)果大、CPU處理時間長寸潦，可以通過設置spark.serializer為org.apache.spark.serializer.KryoSerializer。另外如果結(jié)果已經(jīng)很大匈织，可以使用廣播變量劲件；
問題5：單條記錄消耗大
解決方法：使用mapPartition替換map纬向，mapPartition是對每個Partition進行計算吃警，而map是對partition中的每條記錄進行計算；
問題6：collect輸出大量結(jié)果時速度慢
解決方式：collect源碼中是把所有的結(jié)果以一個Array的方式放在內(nèi)存中饰迹，可以直接輸出到分布式?文件系統(tǒng)钟些，然后查看文件系統(tǒng)中的內(nèi)容宗弯；
問題7：任務執(zhí)行速度傾斜
解決方式：如果是數(shù)據(jù)傾斜蒙保，一般是partition key取的不好，可以考慮其它的并行處理方式赚哗，并在中間加上aggregation操作渐逃；如果是Worker傾斜脊僚，例如在某些worker上的executor執(zhí)行緩慢，可以通過設置spark.speculation=true 把那些持續(xù)慢的節(jié)點去掉；
問題8：通過多步驟的RDD操作后有很多空任務或者小任務產(chǎn)生
解決方式：使用coalesce或repartition去減少RDD中partition數(shù)量柴梆；
問題9：Spark Streaming吞吐量不高
解決方式：可以設置spark.streaming.concurrentJobs

3、intellij idea直接編譯spark源碼及問題解決:

http://blog.csdn.net/tanglizhe1105/article/details/50530104
http://stackoverflow.com/questions/18920334/output-path-is-shared-between-the-same-module-error

Spark編譯：clean package -Dmaven.test.skip=true
參數(shù)：-Xmx2g -XX:MaxPermSize=512M -XX:ReservedCodeCacheSize=512m

4终惑、import Spark source code into intellj, build Error:
not found: type SparkFlumeProtocol and EventBatch

http://stackoverflow.com/questions/33311794/import-spark-source-code-into-intellj-build-error-not-found-type-sparkflumepr

spark_complie_config.png

5绍在、org.apache.spark.SparkException: Exception thrown in awaitResult
set "spark.sql.broadcastTimeout" to increase the timeout

6、Apache Zeppelin編譯安裝：<http://www.iteblog.com/archives/1573>
Apache Zeppelin installation grunt build error：
解決方案：進入web模塊npm install；
http://stackoverflow.com/questions/33352309/apache-zeppelin-installation-grunt-build-error?rq=1

7偿渡、Spark源碼編譯遇到的問題解決：http://www.tuicool.com/articles/NBVvai
內(nèi)存不夠臼寄，這個錯誤是因為編譯的時候內(nèi)存不夠?qū)е碌模梢栽诰幾g的時候加大內(nèi)存溜宽。

[ERROR] PermGen space -> [Help 1]
[ERROR] 
[ERROR] To see the full stack trace of the errors,re-run Maven with the -e switch.
[ERROR] Re-run Maven using the -X switch to enable full debug logging.
[ERROR] 
[ERROR] For more information about the errors and possible solutions, 
please read the following articles:
[ERROR] [Help 1]http://cwiki.apache.org/confluence/display/MAVEN/OutOfMemoryError

export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=512M -XX:ReservedCodeCacheSize=512m"

8吉拳、Exception in thread "main" java.lang.UnsatisfiedLinkError: no jnind4j in java.library.path
解決方案：I’m using a 64-Bit Java on Windows and still get the no jnind4j in java.library.path error It may be that you have incompatible DLLs on your PATH. In order to tell DL4J to ignore those you have to add the following as a VM parameter (Run -> Edit Configurations -> VM Options in IntelliJ): -Djava.library.path=""

9、spark2.0本地運行源碼報錯解決辦法：

修改對應pom中的依賴jar包适揉，將scope級別由provided改為compile
運行類之前留攒，去掉make選項；在運行vm設置中增加-Dspark.master=local
Win7下運行spark example代碼報錯：
java.lang.IllegalArgumentException: java.net.URISyntaxException: Relative path in absolute URI: file:D:/SourceCode/spark-2.0.0/spark-warehouse修改SQLConf類中WAREHOUSE_PATH變量涡扼，將file:前綴改為file:/或file:///
createWithDefault("file:/${system:user.dir}/spark-warehouse")
local模式運行：-Dspark.master=local

10稼跳、解決Task not serializable Exception錯誤
方法1：將RDD中的所有數(shù)據(jù)通過JDBC連接寫入數(shù)據(jù)庫，若使用map函數(shù)吃沪，可能要為每個元素都創(chuàng)建connection汤善，這樣開銷很大，如果使用mapPartitions票彪，那么只需要針對每個分區(qū)建立connection红淡；mapPartitions處理后返回的是Iterator。
方法2：對未序列化的對象加@transisent引用降铸，在進行網(wǎng)絡通信時不對對象中的屬性進行序列化

11在旱、這個函數(shù)在func("11")調(diào)用時候正常,但是在執(zhí)行func(11)或func(1.1)時候就會報error: type mismatch的錯誤. 這個問題很好解決

針對特定的參數(shù)類型, 重載多個func函數(shù),這個不難, 傳統(tǒng)JAVA中的思路, 但是需要定義多個函數(shù)
使用超類型, 比如使用AnyVal,Any;這樣的話比較麻煩,需要在函數(shù)中針對特定的邏輯做類型轉(zhuǎn)化,從而進一步處理上面兩個方法使用的是傳統(tǒng)JAVA思路,雖然都可以解決該問題,但是缺點是不夠簡潔;在充滿了語法糖的Scala中,針對類型轉(zhuǎn)換提供了特有的implicit隱式轉(zhuǎn)化的功能;

12、org.apache.spark.shuffle.MetadataFetchFailedException: Missing an output location for shuffle
解決方案：這種問題一般發(fā)生在有大量shuffle操作的時候,task不斷的failed,然后又重執(zhí)行推掸，一直循環(huán)下去桶蝎，直到application失敗。一般遇到這種問題提高executor內(nèi)存即可,同時增加每個executor的cpu,這樣不會減少task并行度谅畅。

13登渣、Spark ML PipeLine GBT/RF預測時報錯，java.util.NoSuchElementException: key not found: 8.0
錯誤原因：由于GBT/RF模型輸入setFeaturesCol毡泻，setLabelCol參數(shù)列名不一致導致胜茧。
解決方案：只保存訓練算法模型，不保存PipeLineModel

14仇味、linux刪除亂碼文件呻顽，step1. ls -la; step2. find . -inum inode num -exec rm {} -rf ;

15、Caused by: java.lang.RuntimeException: Failed to commit task Caused by: org.apache.spark.executor.CommitDeniedException: attempt_201603251514_0218_m_000245_0: Not committed because the driver did not authorize commit
如果你比較了解spark中的stage是如何劃分的丹墨，這個問題就比較簡單了廊遍。一個Stage中包含的task過大，一般由于你的transform過程太長贩挣，因此driver給executor分發(fā)的task就會變的很大喉前。所以解決這個問題我們可以通過拆分stage解決英染。也就是在執(zhí)行過程中調(diào)用cache.count緩存一些中間數(shù)據(jù)從而切斷過長的stage。

最后編輯于：2017.12.04 05:11:06

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末被饿，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子搪搏，更是在濱河造成了極大的恐慌狭握，老刑警劉巖，帶你破解...
沈念sama閱讀 206,723評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件疯溺，死亡現(xiàn)場離奇詭異论颅，居然都是意外死亡，警方通過查閱死者的電腦和手機囱嫩，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,485評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門恃疯，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人墨闲，你說我怎么就攤上這事今妄。” “怎么了鸳碧？”我有些...
開封第一講書人閱讀 152,998評論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵盾鳞，是天一觀的道長。經(jīng)常有香客問我瞻离，道長腾仅，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 55,323評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任套利，我火速辦了婚禮推励，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘肉迫。我一直安慰自己验辞，他們只是感情好，可當我...
茶點故事閱讀 64,355評論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布昂拂。她就那樣靜靜地躺著受神，像睡著了一般。火紅的嫁衣襯著肌膚如雪格侯。梳的紋絲不亂的頭發(fā)上鼻听，一...
開封第一講書人閱讀 49,079評論 1贊 285
城市分裂傳說
那天，我揣著相機與錄音联四，去河邊找鬼撑碴。笑死，一個胖子當著我的面吹牛朝墩，可吹牛的內(nèi)容都是我干的醉拓。我是一名探鬼主播，決...
沈念sama閱讀 38,389評論 3贊 400
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼亿卤！你這毒婦竟也來了愤兵？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 37,019評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤排吴，失蹤者是張志新（化名）和其女友劉穎秆乳，沒想到半個月后，有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體钻哩，經(jīng)...
沈念sama閱讀 43,519評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡屹堰，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 35,971評論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了街氢。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片扯键。...
茶點故事閱讀 38,100評論 1贊 333
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖珊肃，靈堂內(nèi)的尸體忽然破棺而出荣刑，到底是詐尸還是另有隱情，我是刑警寧澤近范，帶...
沈念sama閱讀 33,738評論 4贊 324
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布嘶摊，位于F島的核電站，受9級特大地震影響评矩，放射性物質(zhì)發(fā)生泄漏叶堆。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 39,293評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一斥杜、第九天我趴在偏房一處隱蔽的房頂上張望虱颗。院中可真熱鬧，春花似錦蔗喂、人聲如沸忘渔。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,289評論 0贊 19
一樁弒父案缰儿，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽畦粮。三九已至，卻和暖如春乖阵，著一層夾襖步出監(jiān)牢的瞬間宣赔，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,517評論 1贊 262
情欲美人皮
我被黑心中介騙來泰國打工瞪浸，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留儒将，地道東北人。一個月前我還...
沈念sama閱讀 45,547評論 2贊 354
代替公主和親
正文我出身青樓对蒲，卻偏偏與公主長得像钩蚊，于是被迫代替她去往敵國和親贡翘。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當晚...
茶點故事閱讀 42,834評論 2贊 345

Spark常見問題解決辦法

推薦閱讀更多精彩內(nèi)容