【Apache Doris】數(shù)據(jù)副本問題排查指南

本文主要分享Doris中數(shù)據(jù)副本異常的問題現(xiàn)象、問題定位以及如何處理此類問題。

一、問題現(xiàn)象

  1. 問題日志

查詢報(bào)錯(cuò)

Failed to initialize storage reader, tablet={tablet_id}.xxx.xxx
  1. 問題說明

查詢時(shí)闹炉,F(xiàn)E讓BE返回spec_version范圍的數(shù)據(jù),但是BE缺部分version了润樱,就會(huì)報(bào)這個(gè)錯(cuò)誤渣触。

  1. 問題原因

遷移副本過程可能丟version,在2.0.3修復(fù)了壹若,或者在數(shù)據(jù)導(dǎo)入過程中be宕機(jī)嗅钻。

注意:
如果版本是2.0.1及以前皂冰,且它的所有副本last failed version > 0,通常需要重新建表進(jìn)行導(dǎo)數(shù)养篓。

二秃流、問題定位

如上圖所示,查詢報(bào)錯(cuò)的 tablet_id 是 606202柳弄, BE ip是 10.xxx舶胀, BE 需要包含version 區(qū)間 [0 - 35]。

當(dāng)確定異常tablet_id時(shí)碧注,參考如下步驟先進(jìn)行問題信息收集:

  1. show tablet {tablet_id} (這里是606202)嚣伐,拿到detail cmd

  2. 執(zhí)行detail cmd的輸出

SHOW PROC ' /dbs/10113/591325/partitions/606195/591326/606202";

找出該BE所在的副本(compact status url中包含有該BE的ip)

  1. 執(zhí)行curl<步驟2的compact status url>, 該例子是
curl  http://10.xxx:8040/api/compaction/show?tablet_id=606202

查看該副本的rowset 和 missing_rowset萍丐,重點(diǎn)看rowset 的最大版本(這里是34)和 missing_rowsets纤控。從上圖可以看出該副本的rowset 為 0 ~ 34, 且中間不缺version(missing_rowsets為空)碉纺。而查詢語句中是 special version 是 [0, 35]船万, 但該BE不含version 35。所以需要給該BE補(bǔ)上version 35骨田。

注意:這里的special version實(shí)際就是partition的visible version耿导。 它也可以通過如下指令查看。

show partitions from <table-name xxx> where PartitionName = '<partition name xxx>' 

三态贤、問題處理

  1. 確認(rèn)是否自動(dòng)修復(fù)

由于doris內(nèi)部會(huì)自動(dòng)做數(shù)據(jù)均衡和修復(fù)舱呻,所以當(dāng)出現(xiàn)數(shù)據(jù)副本異常時(shí),先確認(rèn)異常數(shù)據(jù)副本能否自動(dòng)修復(fù):

如果是多副本悠汽,查看是否存在健康副本箱吕。健康副本是指副本version >= special version && last failed version = -1 && isBad = false, 且curl 它的 compact status柿冲, missing rowsets 為空茬高。

如果存在這樣的副本,把查詢報(bào)錯(cuò)的副本set bad假抄,如上圖所示BackendId為10003上版本遠(yuǎn)落后于其他兩個(gè)副本的version怎栽,可以通過設(shè)置為bad來自動(dòng)修復(fù)。

ADMIN SET REPLICA STATUS PROPERTIES("tablet_id" = "7552021", "backend_id" = "10003", "status" = "bad");

等待一會(huì)(可能需要一兩分鐘)宿饱,再執(zhí)行步驟2中的detail cmd熏瞄,如果副本都健康了:

version >= special version && last failed version = -1 && isBad = false

且curl它的compact status, missing rowsets為空,說明修補(bǔ)OK了谬以。且執(zhí)行select count (*) from table_xx 是否OK强饮。

如果沒問題,就自動(dòng)修復(fù)完成了为黎,不用往下看邮丰。如果還是有問題行您,接著往下看。

  1. 重新導(dǎo)數(shù)手動(dòng)修復(fù)
  • 如果是多個(gè)副本都損壞柠座,并且是分區(qū)表的情況下,可以刪除這個(gè)分區(qū)片橡,然后手動(dòng)重建這個(gè)分區(qū)妈经,重新導(dǎo)入數(shù)據(jù)即可。
  • 如果是多個(gè)副本都損壞捧书,并且是非分區(qū)表的情況下吹泡,只能刪除這個(gè)表重新導(dǎo)入數(shù)據(jù)。
  1. 填充空副本進(jìn)行修復(fù)

注意:
以上兩個(gè)方法可以恢復(fù)丟失的數(shù)據(jù)经瓷,而填充空副本方法爆哑,是插入若干個(gè)空rowset,它能恢復(fù)讀寫舆吮。但如果丟失的rowset是包含數(shù)據(jù)的揭朝,這種方法實(shí)質(zhì)是丟數(shù)據(jù)的。

空副本修復(fù)方式如下:

curl -X POST "http://10.151.2.29:8040/api/pad_rowset?tablet_id=606202&start_version=35&end_version=35"
  • tablet_id table 的 id
  • start_version 起始版本
  • end_version 終止版本

該功能用于使用一個(gè)空的 rowset 填充損壞的副本色冀。這個(gè)例子中修補(bǔ)的url中 start_version = 35, end_version = 35潭袱。

這個(gè)例子只是缺一個(gè)rowset, 實(shí)際中可能缺多個(gè)(missing rowset锋恬,最大version + 1 ~ special version)屯换,缺多少個(gè)rowset,就調(diào)用多少次修補(bǔ)的方法与学。

修補(bǔ)完之后彤悔,再執(zhí)行下show tablet xxx,該副本last fail version 是否等于 -1索守,如果它的version都補(bǔ)上了晕窑,但是last fail version = version + 1, 還需要手工執(zhí)行把last fail version 改成 -1:

ADMIN SET REPLICA VERSION PROPERTIES("tablet_id" = "10003", "backend_id" = "10001", "last_failed_version" = "-1");

低版本的doris可能不含這個(gè)SQL卵佛, 如果不支持這個(gè)SQL且是單副本的幕屹,通常需要重新建表進(jìn)行導(dǎo)數(shù)。

如果沒問題级遭,使用

select count(*) from table_xx;

查看是否可讀望拖,可讀則說明數(shù)據(jù)副本問題已處理。

本文由mdnice多平臺(tái)發(fā)布

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末挫鸽,一起剝皮案震驚了整個(gè)濱河市说敏,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌丢郊,老刑警劉巖盔沫,帶你破解...
    沈念sama閱讀 211,817評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件医咨,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡架诞,警方通過查閱死者的電腦和手機(jī)拟淮,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,329評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來谴忧,“玉大人很泊,你說我怎么就攤上這事≌次剑” “怎么了委造?”我有些...
    開封第一講書人閱讀 157,354評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)均驶。 經(jīng)常有香客問我昏兆,道長(zhǎng),這世上最難降的妖魔是什么妇穴? 我笑而不...
    開封第一講書人閱讀 56,498評(píng)論 1 284
  • 正文 為了忘掉前任爬虱,我火速辦了婚禮,結(jié)果婚禮上腾它,老公的妹妹穿的比我還像新娘饮潦。我一直安慰自己,他們只是感情好携狭,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,600評(píng)論 6 386
  • 文/花漫 我一把揭開白布继蜡。 她就那樣靜靜地躺著,像睡著了一般逛腿。 火紅的嫁衣襯著肌膚如雪稀并。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,829評(píng)論 1 290
  • 那天单默,我揣著相機(jī)與錄音碘举,去河邊找鬼。 笑死搁廓,一個(gè)胖子當(dāng)著我的面吹牛引颈,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播境蜕,決...
    沈念sama閱讀 38,979評(píng)論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼蝙场,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了粱年?” 一聲冷哼從身側(cè)響起售滤,我...
    開封第一講書人閱讀 37,722評(píng)論 0 266
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后完箩,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體赐俗,經(jīng)...
    沈念sama閱讀 44,189評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,519評(píng)論 2 327
  • 正文 我和宋清朗相戀三年弊知,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了阻逮。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 38,654評(píng)論 1 340
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡秩彤,死狀恐怖叔扼,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情呐舔,我是刑警寧澤币励,帶...
    沈念sama閱讀 34,329評(píng)論 4 330
  • 正文 年R本政府宣布慷蠕,位于F島的核電站珊拼,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏流炕。R本人自食惡果不足惜澎现,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,940評(píng)論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望每辟。 院中可真熱鬧剑辫,春花似錦、人聲如沸渠欺。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,762評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽挠将。三九已至胳岂,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間舔稀,已是汗流浹背乳丰。 一陣腳步聲響...
    開封第一講書人閱讀 31,993評(píng)論 1 266
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留内贮,地道東北人产园。 一個(gè)月前我還...
    沈念sama閱讀 46,382評(píng)論 2 360
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像夜郁,于是被迫代替她去往敵國(guó)和親什燕。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,543評(píng)論 2 349

推薦閱讀更多精彩內(nèi)容