Task數(shù)量過多

背景

當(dāng)spark最終輸出文件stage，task數(shù)量非常多時(shí)准浴，會(huì)在driver端單線程執(zhí)行大量的rename操作事扭，比較耗時(shí)，如何解決呢乐横？

分析

罪魁禍?zhǔn)浊箝希褪莌adoop代碼里的commitJobInternal函數(shù)，這里會(huì)單線程調(diào)mergePaths葡公，會(huì)把每個(gè)task輸出在_temporary目錄的結(jié)果罐农，移動(dòng)到最終的輸出目錄。

  @VisibleForTesting
  protected void commitJobInternal(JobContext context) throws IOException {
    if (hasOutputPath()) {
      Path finalOutput = getOutputPath();
      FileSystem fs = finalOutput.getFileSystem(context.getConfiguration());

      // 如果v1催什，就執(zhí)行
      if (algorithmVersion == 1) {
        for (FileStatus stat: getAllCommittedTaskPaths(context)) {
          mergePaths(fs, stat, finalOutput);
        }
      }

      if (skipCleanup) {
        LOG.info("Skip cleanup the _temporary folders under job's output " +
            "directory in commitJob.");
      } else {
        // delete the _temporary folder and create a _done file in the o/p
        // folder
        try {
          cleanupJob(context);
        } catch (IOException e) {
          if (ignoreCleanupFailures) {
            // swallow exceptions in cleanup as user configure to make sure
            // commitJob could be success even when cleanup get failure.
            LOG.error("Error in cleanup job, manually cleanup is needed.", e);
          } else {
            // throw back exception to fail commitJob.
            throw e;
          }
        }
      }
      // True if the job requires output.dir marked on successful job.
      // Note that by default it is set to true.
      if (context.getConfiguration().getBoolean(
          SUCCESSFUL_JOB_OUTPUT_DIR_MARKER, true)) {
        Path markerPath = new Path(outputPath, SUCCEEDED_FILE_NAME);
        // If job commit is repeatable and previous/another AM could write
        // mark file already, we need to set overwritten to be true explicitly
        // in case other FS implementations don't overwritten by default.
        if (isCommitJobRepeatable(context)) {
          fs.create(markerPath, true).close();
        } else {
          fs.create(markerPath).close();
        }
      }
    } else {
      LOG.warn("Output Path is null in commitJob()");
    }
  }

如果mapreduce.fileoutputcommitter.algorithm.version配成v1涵亏，就會(huì)執(zhí)行上面的for循環(huán)，那有v1就有v2，v2又是怎樣的呢溯乒？

簡(jiǎn)單的說，v1就是每個(gè)task執(zhí)行的最終結(jié)果豹爹，輸出到_temporary目錄裆悄，所有task執(zhí)行結(jié)束后，由CommitCoordinator臂聋，一并執(zhí)行rename到最終的輸出目錄光稼。
而v2則是task執(zhí)行結(jié)果執(zhí)行輸出到最終的輸出目錄。

那么為什么不用v2呢孩等？v2有什么問題呢艾君？
答案是有問題的，一致性問題肄方。所謂一致性冰垄，就是正確性。
壞情況1：
如果執(zhí)行100個(gè)task权她，50個(gè)跑完了虹茶，剩下的掛了，在v2里隅要，輸出的結(jié)果就會(huì)直接殘留在最終的輸出目錄蝴罪。
壞情況2：
同樣是執(zhí)行100個(gè)task，但每個(gè)執(zhí)行的速度不一樣步清，有95個(gè)很快跑完了要门，5個(gè)還沒跑完，這時(shí)有人來訪問輸出文件廓啊，得到的就是個(gè)錯(cuò)誤的結(jié)果欢搜。

具體可以看下Spark CommitCoordinator 保證數(shù)據(jù)一致性這篇文章。

所以如果前面的一致性問題影響不大谴轮，那就用v2狂巢，否則依然只能用v1。v1該怎么優(yōu)化呢书聚？

減少輸出文件的那個(gè)stage的task數(shù)唧领，其實(shí)task數(shù)太多，很可能是文件太小雌续。
前面hadoop源碼里單線程的for循環(huán)斩个，是不是可以改成多線程？

參考

分布式系統(tǒng)中的一致性
 Spark CommitCoordinator 保證數(shù)據(jù)一致性
 二階段提交-維基百科

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末驯杜，一起剝皮案震驚了整個(gè)濱河市受啥，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖滚局，帶你破解...
沈念sama閱讀 216,591評(píng)論 6贊 501
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件居暖，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡藤肢，警方通過查閱死者的電腦和手機(jī)太闺，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 92,448評(píng)論 3贊 392
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來嘁圈，“玉大人省骂，你說我怎么就攤上這事∽钭。” “怎么了钞澳？”我有些...
開封第一講書人閱讀 162,823評(píng)論 0贊 353
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)涨缚。經(jīng)常有香客問我轧粟，道長(zhǎng)，這世上最難降的妖魔是什么脓魏？我笑而不...
開封第一講書人閱讀 58,204評(píng)論 1贊 292
?港島之戀（遺憾婚禮）
正文為了忘掉前任逃延，我火速辦了婚禮，結(jié)果婚禮上轧拄，老公的妹妹穿的比我還像新娘揽祥。我一直安慰自己，他們只是感情好檩电，可當(dāng)我...
茶點(diǎn)故事閱讀 67,228評(píng)論 6贊 388
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布拄丰。她就那樣靜靜地躺著，像睡著了一般俐末。火紅的嫁衣襯著肌膚如雪料按。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,190評(píng)論 1贊 299
城市分裂傳說
那天卓箫，我揣著相機(jī)與錄音载矿，去河邊找鬼。笑死烹卒，一個(gè)胖子當(dāng)著我的面吹牛闷盔，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播旅急，決...
沈念sama閱讀 40,078評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼逢勾，長(zhǎng)吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來了藐吮？” 一聲冷哼從身側(cè)響起溺拱，我...
開封第一講書人閱讀 38,923評(píng)論 0贊 274
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤逃贝，失蹤者是張志新（化名）和其女友劉穎，沒想到半個(gè)月后迫摔，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體沐扳，經(jīng)...
沈念sama閱讀 45,334評(píng)論 1贊 310
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,550評(píng)論 2贊 333
?白月光啟示錄
正文我和宋清朗相戀三年句占，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了沪摄。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點(diǎn)故事閱讀 39,727評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡辖众，死狀恐怖卓起，靈堂內(nèi)的尸體忽然破棺而出和敬，到底是詐尸還是另有隱情凹炸，我是刑警寧澤，帶...
沈念sama閱讀 35,428評(píng)論 5贊 343
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布昼弟，位于F島的核電站啤它，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏舱痘。R本人自食惡果不足惜变骡，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,022評(píng)論 3贊 326
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望芭逝。院中可真熱鬧塌碌，春花似錦、人聲如沸旬盯。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,672評(píng)論 0贊 22
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽胖翰。三九已至接剩，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間萨咳，已是汗流浹背懊缺。一陣腳步聲響...
開封第一講書人閱讀 32,826評(píng)論 1贊 269
情欲美人皮
我被黑心中介騙來泰國(guó)打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留培他，地道東北人鹃两。一個(gè)月前我還...
沈念sama閱讀 47,734評(píng)論 2贊 368
代替公主和親
正文我出身青樓，卻偏偏與公主長(zhǎng)得像舀凛，于是被迫代替她去往敵國(guó)和親怔毛。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,619評(píng)論 2贊 354

Task數(shù)量過多

背景

分析

參考

推薦閱讀更多精彩內(nèi)容