hdfs append的AlreadyBeingCreatedException異常

Hdfs append調(diào)用異常AlreadyBeingCreatedException

首先拋出的異常如下:

org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.hdfs.protocol.AlreadyBeingCreatedException): Failed to APPEND_FILE /binlogsync_test/binlog/mock/test/test_1502173606572 for DFSClient_NONMAPREDUCE_-70835360_1 on 127.0.0.1 because DFSClient_NONMAPREDUCE_-70835360_1 is already the current lease holder.
    at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.recoverLeaseInternal(FSNamesystem.java:2863)
    at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.appendFileInternal(FSNamesystem.java:2664)
    at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.appendFileInt(FSNamesystem.java:2962)
    at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.appendFile(FSNamesystem.java:2927)
    at org.apache.hadoop.hdfs.server.namenode.NameNodeRpcServer.append(NameNodeRpcServer.java:652)
    at org.apache.hadoop.hdfs.protocolPB.ClientNamenodeProtocolServerSideTranslatorPB.append(ClientNamenodeProtocolServerSideTranslatorPB.java:421)
    at org.apache.hadoop.hdfs.protocol.proto.ClientNamenodeProtocolProtos$ClientNamenodeProtocol$2.callBlockingMethod(ClientNamenodeProtocolProtos.java)
    at org.apache.hadoop.ipc.ProtobufRpcEngine$Server$ProtoBufRpcInvoker.call(ProtobufRpcEngine.java:616)
    at org.apache.hadoop.ipc.RPC$Server.call(RPC.java:969)
    at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:2049)
    at org.apache.hadoop.ipc.Server$Handler$1.run(Server.java:2045)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:422)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1657)
    at org.apache.hadoop.ipc.Server$Handler.run(Server.java:2043)

首先解釋一下我是在什么情況下出現(xiàn)的這個(gè)異常:

我編寫了一個(gè)測試用例:模擬在往hdfs文件中寫了一條不完整的記錄之后,按照之前ack文件回滾到最近一條完整記錄,然后接著寫沟涨。文件操作的調(diào)用線路的這樣的:

1. FileSystem # create打開文件
1. FsDataoutputStream # write(寫若干條不完整記錄佑力,并且調(diào)用hsync確保落盤) 
2. rollBack(根據(jù)ack文件回滾到最近一次的完整記錄,這個(gè)過程中調(diào)用了FsDataoutputStream # close關(guān)閉流俊马,然后FileSystem # truncate截?cái)辔募?
3. 以append的方式再次打開文件,寫若干條完整記錄,hsync落盤萝嘁,并且更新ack文件。(以上異常出現(xiàn)在這一步)
4. 對文件內(nèi)容和預(yù)期內(nèi)容做相等斷言

以上所有操作都是在一個(gè)線程中完成扬卷,使用同一個(gè)FileSystem的實(shí)例對象牙言,因此dfs client是同一個(gè),之所以提到這個(gè)是因?yàn)閔dfs的租約管理是以dfs client以及inode id來定位的怪得。

異常原因

這個(gè)異常的是由lease機(jī)制導(dǎo)致的咱枉,由namenode上rpc server(對應(yīng)NameNodeRpcServer的實(shí)現(xiàn))拋出來的卑硫。

hdfs通過lease機(jī)制來保證同一個(gè)文件某一時(shí)刻只會有一個(gè)客戶端執(zhí)行寫操作,client端調(diào)用append和create方法或者是FileSystem # truncate時(shí)蚕断,rpc server端都會添加一個(gè)新的lease欢伏。當(dāng)前client調(diào)用create之后獲得了lease,就不可以再調(diào)用append了亿乳,可以看看下面的拋出異常位置的代碼:

//這個(gè)方法rpc server端相應(yīng)create和append時(shí)都會調(diào)用
boolean recoverLeaseInternal(RecoverLeaseOp op, INodesInPath iip,
      String src, String holder, String clientMachine, boolean force)
      throws IOException {
    assert hasWriteLock();
    INodeFile file = iip.getLastINode().asFile();
     //isUnderConstruction()硝拧,UnderConstruction狀態(tài)表示文件正在被某個(gè)客戶端寫(append,truncate,write)
    if (file.isUnderConstruction()) {
      //holder是lease擁有者,也就是嘗試寫文件的客戶端的name葛假,對應(yīng)DFSClient的name字段障陶。
      Lease lease = leaseManager.getLease(holder);

      if (!force && lease != null) {
        /*獲得當(dāng)前寫操作的文件的lease,如果這個(gè)lease和holder擁有的lease是一樣的聊训,表示這個(gè)文件之前已經(jīng)由holder這個(gè)客戶端寫咸这,之前的那次寫請求使他獲得了lease,那么這個(gè)時(shí)候再調(diào)用一次寫就會拋這個(gè)異常(也就是本文開始的異常).
        這是可以理解的魔眨,即便是同一個(gè)用戶也不應(yīng)該同時(shí)使用多個(gè)寫接口去寫文件媳维,這樣顯然會導(dǎo)致寫的內(nèi)容不正確
        */
        Lease leaseFile = leaseManager.getLease(file);
        if (leaseFile != null && leaseFile.equals(lease)) {
          // We found the lease for this file but the original
          // holder is trying to obtain it again.
          throw new AlreadyBeingCreatedException(
              op.getExceptionMessage(src, holder, clientMachine,
                  holder + " is already the current lease holder."));
        }
      }
      //
      // Find the original holder.
      //
      FileUnderConstructionFeature uc = file.getFileUnderConstructionFeature();
      String clientName = uc.getClientName();
      lease = leaseManager.getLease(clientName);
      //這是另外一種情況,嘗試寫文件的用戶確沒有l(wèi)ease(可能是lease過期了)遏暴,那用戶就不能寫文件侄刽。
      if (lease == null) {
        throw new AlreadyBeingCreatedException(
            op.getExceptionMessage(src, holder, clientMachine,
                "the file is under construction but no leases found."));
      }
      if (force) {
        // close now: no need to wait for soft lease expiration and 
        // close only the file src
        LOG.info("recoverLease: " + lease + ", src=" + src +
          " from client " + clientName);
        return internalReleaseLease(lease, src, iip, holder);
      } else {
        assert lease.getHolder().equals(clientName) :
          "Current lease holder " + lease.getHolder() +
          " does not match file creator " + clientName;
        //
        // If the original holder has not renewed in the last SOFTLIMIT 
        // period, then start lease recovery.
        //
        if (lease.expiredSoftLimit()) {
          LOG.info("startFile: recover " + lease + ", src=" + src + " client "
              + clientName);
          if (internalReleaseLease(lease, src, iip, null)) {
            return true;
          } else {
            throw new RecoveryInProgressException(
                op.getExceptionMessage(src, holder, clientMachine,
                    "lease recovery is in progress. Try again later."));
          }
        } else {
          final BlockInfo lastBlock = file.getLastBlock();
          if (lastBlock != null
              && lastBlock.getBlockUCState() == BlockUCState.UNDER_RECOVERY) {
            throw new RecoveryInProgressException(
                op.getExceptionMessage(src, holder, clientMachine,
                    "another recovery is in progress by "
                        + clientName + " on " + uc.getClientMachine()));
          } else {
            throw new AlreadyBeingCreatedException(
                op.getExceptionMessage(src, holder, clientMachine,
                    "this file lease is currently owned by "
                        + clientName + " on " + uc.getClientMachine()));
          }
        }
      }
    } else {
      return true;
     }
  }

再回顧我的調(diào)用鏈:

FileSystem # create -> 獲得lease

FsDataOutputStream # close -> lease失效

FileSystem # truncate -> 獲得lease

FileSystem # append -> 獲得lease的情況下,再次嘗試新的接口寫朋凉,拋出異常州丹。

但是也有例外,比如下面這樣的調(diào)用就不會出現(xiàn)這種異常:

  1. truncate(path, 1) -> truncate(path, 1) . 連續(xù)兩次的trunc成同樣長度杂彭,是不會走到recoverLeaseInternal方法調(diào)用的墓毒,因?yàn)榕袛辔募呀?jīng)是那么大之后就直接返回,不做trunc亲怠。
  2. create(path, true)所计,指定true表示文件存在時(shí)overwrite,這個(gè)時(shí)候就算之前有client獲得lease团秽,指定overwrite會把之前文件刪除主胧,一并清除lease,所以也不會報(bào)錯(cuò)习勤。

后續(xù): 盡管知道了是因?yàn)閠runcate導(dǎo)致了append的異常踪栋,但是卻不知道怎么remove掉lease,最后的解決辦法居然是等待lease過期图毕,因?yàn)閠runcate操作不會不停的renew lease(續(xù)約)夷都。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市予颤,隨后出現(xiàn)的幾起案子囤官,更是在濱河造成了極大的恐慌厢破,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,640評論 6 507
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件治拿,死亡現(xiàn)場離奇詭異摩泪,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)劫谅,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,254評論 3 395
  • 文/潘曉璐 我一進(jìn)店門见坑,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人捏检,你說我怎么就攤上這事荞驴。” “怎么了贯城?”我有些...
    開封第一講書人閱讀 165,011評論 0 355
  • 文/不壞的土叔 我叫張陵熊楼,是天一觀的道長。 經(jīng)常有香客問我能犯,道長鲫骗,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,755評論 1 294
  • 正文 為了忘掉前任踩晶,我火速辦了婚禮执泰,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘渡蜻。我一直安慰自己术吝,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,774評論 6 392
  • 文/花漫 我一把揭開白布茸苇。 她就那樣靜靜地躺著排苍,像睡著了一般。 火紅的嫁衣襯著肌膚如雪学密。 梳的紋絲不亂的頭發(fā)上淘衙,一...
    開封第一講書人閱讀 51,610評論 1 305
  • 那天,我揣著相機(jī)與錄音则果,去河邊找鬼幔翰。 笑死漩氨,一個(gè)胖子當(dāng)著我的面吹牛西壮,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播叫惊,決...
    沈念sama閱讀 40,352評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼款青,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了霍狰?” 一聲冷哼從身側(cè)響起抡草,我...
    開封第一講書人閱讀 39,257評論 0 276
  • 序言:老撾萬榮一對情侶失蹤饰及,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后康震,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體燎含,經(jīng)...
    沈念sama閱讀 45,717評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,894評論 3 336
  • 正文 我和宋清朗相戀三年腿短,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了屏箍。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 40,021評論 1 350
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡橘忱,死狀恐怖赴魁,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情钝诚,我是刑警寧澤颖御,帶...
    沈念sama閱讀 35,735評論 5 346
  • 正文 年R本政府宣布,位于F島的核電站凝颇,受9級特大地震影響潘拱,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜拧略,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,354評論 3 330
  • 文/蒙蒙 一泽铛、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧辑鲤,春花似錦盔腔、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,936評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至宁赤,卻和暖如春皂冰,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背毅厚。 一陣腳步聲響...
    開封第一講書人閱讀 33,054評論 1 270
  • 我被黑心中介騙來泰國打工偷俭, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人佛猛。 一個(gè)月前我還...
    沈念sama閱讀 48,224評論 3 371
  • 正文 我出身青樓惑芭,卻偏偏與公主長得像,于是被迫代替她去往敵國和親继找。 傳聞我的和親對象是個(gè)殘疾皇子遂跟,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,974評論 2 355

推薦閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn),斷路器幻锁,智...
    卡卡羅2017閱讀 134,658評論 18 139
  • 當(dāng)數(shù)據(jù)量增大到超出了單個(gè)物理計(jì)算機(jī)存儲容量時(shí)凯亮,有必要把它分開存儲在多個(gè)不同的計(jì)算機(jī)中。那些管理存儲在多個(gè)網(wǎng)絡(luò)互連的...
    單行線的旋律閱讀 1,920評論 0 7
  • 1. 客戶端正在寫的文件哄尔,被另外一個(gè)客戶端刪除了會怎樣假消? 會出錯(cuò),但不會立馬出錯(cuò)岭接。這里簡單介紹一下寫的流程置谦,一些c...
    aaron1993閱讀 485評論 0 0
  • 桃子要結(jié)婚了媒峡,對象是老鼠。 我是通過別人發(fā)的祝福的朋友圈知道這個(gè)消息的葵擎,下面還附上了他們倆的結(jié)婚照谅阿,照片上的桃子,...
    李果茶閱讀 311評論 0 0
  • 芮妮和丈夫結(jié)婚了酬滤。 她和他是青梅竹馬签餐,他是凱旋的海軍中士,她是癡癡盼君歸的青春少女盯串。 在婚宴上氯檐,新娘全程僵硬著,連...
    西顧微微閱讀 525評論 0 1