Spark踩坑vlog-推測執(zhí)行spark.speculation

@TOC

踩坑背景

流程如下所示:


在這里插入圖片描述

1.使用SparkSQL獲取到了一個DataFrame暮芭;
2.然后map這個DataFrame热芹,調(diào)用GET接口,獲得了IDs作為一個新的DatdaFrame富玷;
3.最后再map這個DataFrame,在map中調(diào)用Post接口淀零,將最終結(jié)果放到接口中烛缔。

踩坑原因

因為比較懶,所以在spark-submit的時候砍鸠,腳本直接復(fù)制了另外一個Spark作業(yè)的提交腳本,但是萬萬沒想到的是:這個腳本里耕驰,有一句設(shè)置:--conf "spark.speculation=true"爷辱,當(dāng)時沒注意,直接提交上去了朦肘。
后來反饋最終的Post接口存在重復(fù)調(diào)用的問題饭弓,有的name會調(diào)用兩次post接口,有的則只會調(diào)用一次媒抠。

解決

最后通過咨詢大佬得知示启,在嚴(yán)格執(zhí)行只能計算一次時,一定要把Spark的檢測執(zhí)行關(guān)掉领舰!也就是說,不要在代碼或者腳本里設(shè)置spark.speculation=true迟螺,此配置Spark默認(rèn)為false冲秽。

原因

當(dāng)Spark開啟檢測執(zhí)行時,它會根據(jù)數(shù)據(jù)片的執(zhí)行時間來啟動第二次執(zhí)行矩父。即當(dāng)partition1里的數(shù)據(jù)在executor1上執(zhí)行超過一定時間锉桑,但是仍然沒有執(zhí)行完畢時,此時executor2會起一個程序開始運(yùn)行partition1里的數(shù)據(jù)窍株,哪個先運(yùn)行完民轴,就把剩下那個沒運(yùn)行完的kill掉攻柠,返回最終結(jié)果。
因為我的代碼中后裸,獲取Post連接的時間可能比較長瑰钮,超出了檢測執(zhí)行的時間范圍,于是部分超出檢測執(zhí)行范圍的name被啟動了executor2計算微驶,雖然在最終的返回狀態(tài)結(jié)果中只有一份數(shù)據(jù)浪谴,但是它實際上已經(jīng)調(diào)用了兩次,看到的返回狀態(tài)結(jié)果已經(jīng)不準(zhǔn)了因苹。

教訓(xùn)

別瞎cv苟耻,所有提交的東西都要搞清楚,細(xì)細(xì)思考過才可以扶檐。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末凶杖,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子款筑,更是在濱河造成了極大的恐慌智蝠,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,123評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件醋虏,死亡現(xiàn)場離奇詭異寻咒,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)颈嚼,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,031評論 2 384
  • 文/潘曉璐 我一進(jìn)店門毛秘,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人阻课,你說我怎么就攤上這事叫挟。” “怎么了限煞?”我有些...
    開封第一講書人閱讀 156,723評論 0 345
  • 文/不壞的土叔 我叫張陵抹恳,是天一觀的道長。 經(jīng)常有香客問我署驻,道長奋献,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,357評論 1 283
  • 正文 為了忘掉前任旺上,我火速辦了婚禮瓶蚂,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘宣吱。我一直安慰自己窃这,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 65,412評論 5 384
  • 文/花漫 我一把揭開白布征候。 她就那樣靜靜地躺著杭攻,像睡著了一般祟敛。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上兆解,一...
    開封第一講書人閱讀 49,760評論 1 289
  • 那天馆铁,我揣著相機(jī)與錄音,去河邊找鬼痪宰。 笑死叼架,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的衣撬。 我是一名探鬼主播乖订,決...
    沈念sama閱讀 38,904評論 3 405
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼具练!你這毒婦竟也來了乍构?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,672評論 0 266
  • 序言:老撾萬榮一對情侶失蹤扛点,失蹤者是張志新(化名)和其女友劉穎哥遮,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體陵究,經(jīng)...
    沈念sama閱讀 44,118評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡眠饮,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,456評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了铜邮。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片仪召。...
    茶點故事閱讀 38,599評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖松蒜,靈堂內(nèi)的尸體忽然破棺而出扔茅,到底是詐尸還是另有隱情,我是刑警寧澤秸苗,帶...
    沈念sama閱讀 34,264評論 4 328
  • 正文 年R本政府宣布召娜,位于F島的核電站,受9級特大地震影響惊楼,放射性物質(zhì)發(fā)生泄漏玖瘸。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,857評論 3 312
  • 文/蒙蒙 一檀咙、第九天 我趴在偏房一處隱蔽的房頂上張望店读。 院中可真熱鬧,春花似錦攀芯、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,731評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽殖演。三九已至,卻和暖如春年鸳,著一層夾襖步出監(jiān)牢的瞬間趴久,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,956評論 1 264
  • 我被黑心中介騙來泰國打工搔确, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留彼棍,地道東北人。 一個月前我還...
    沈念sama閱讀 46,286評論 2 360
  • 正文 我出身青樓膳算,卻偏偏與公主長得像座硕,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子涕蜂,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,465評論 2 348

推薦閱讀更多精彩內(nèi)容