記一次ceph pg unfound處理過程

今天檢查ceph集群,發(fā)現(xiàn)有pg丟失,于是就有了本文~~~

1.查看集群狀態(tài)

[root@k8snode001 ~]# ceph health detail
HEALTH_ERR 1/973013 objects unfound (0.000%); 17 scrub errors; Possible data damage: 1 pg recovery_unfound, 8 pgs inconsistent, 1 pg repair; Degraded data redundancy: 1/2919039 objects degraded (0.000%), 1 pg degraded
OBJECT_UNFOUND 1/973013 objects unfound (0.000%)
    pg 2.2b has 1 unfound objects
OSD_SCRUB_ERRORS 17 scrub errors
PG_DAMAGED Possible data damage: 1 pg recovery_unfound, 8 pgs inconsistent, 1 pg repair
    pg 2.2b is active+recovery_unfound+degraded, acting [14,22,4], 1 unfound
    pg 2.44 is active+clean+inconsistent, acting [14,8,21]
    pg 2.73 is active+clean+inconsistent, acting [25,14,8]
    pg 2.80 is active+clean+scrubbing+deep+inconsistent+repair, acting [4,8,14]
    pg 2.83 is active+clean+inconsistent, acting [14,13,6]
    pg 2.ae is active+clean+inconsistent, acting [14,3,2]
    pg 2.c4 is active+clean+inconsistent, acting [8,21,14]
    pg 2.da is active+clean+inconsistent, acting [23,14,15]
    pg 2.fa is active+clean+inconsistent, acting [14,23,25]
PG_DEGRADED Degraded data redundancy: 1/2919039 objects degraded (0.000%), 1 pg degraded
    pg 2.2b is active+recovery_unfound+degraded, acting [14,22,4], 1 unfound

從輸出發(fā)現(xiàn)pg 2.2b is active+recovery_unfound+degraded, acting [14,22,4], 1 unfound
現(xiàn)在我們來查看pg 2.2b拘领,看看這個pg得想想信息嘉赎。

[root@k8snode001 ~]# ceph pg dump_json pools    |grep 2.2b
dumped all
2.2b       2487                  1        1         0       1  9533198403 3048     3048                active+recovery_unfound+degraded 2020-07-23 08:56:07.669903  10373'5448370  10373:7312614  [14,22,4]         14  [14,22,4]             14  10371'5437258 2020-07-23 08:56:06.637012   10371'5437258 2020-07-23 08:56:06.637012             0

可以看到它現(xiàn)在只有一個副本

2.查看pg map

[root@k8snode001 ~]# ceph pg map 2.2b
osdmap e10373 pg 2.2b (2.2b) -> up [14,22,4] acting [14,22,4]

從pg map可以看出,pg 2.2b分布到osd [14,22,4]上

3.查看存儲池狀態(tài)

[root@k8snode001 ~]# ceph osd pool stats k8s-1
pool k8s-1 id 2
  1/1955664 objects degraded (0.000%)
  1/651888 objects unfound (0.000%)
  client io 271 KiB/s wr, 0 op/s rd, 52 op/s wr

[root@k8snode001 ~]# ceph osd pool ls detail|grep k8s-1
pool 2 'k8s-1' replicated size 3 min_size 1 crush_rule 0 object_hash rjenkins pg_num 256 pgp_num 256 last_change 88 flags hashpspool,selfmanaged_snaps stripe_width 0 application rbd

4.嘗試恢復(fù)pg 2.2b丟失的塊

[root@k8snode001 ~]# ceph pg repair 2.2b

如果一直修復(fù)不成功栓始,可以查看卡住PG的具體信息,主要關(guān)注recovery_state血当,命令如下

[root@k8snode001 ~]# ceph pg 2.2b  query
{
    "......
    "recovery_state": [
        {
            "name": "Started/Primary/Active",
            "enter_time": "2020-07-21 14:17:05.855923",
            "might_have_unfound": [],
            "recovery_progress": {
                "backfill_targets": [],
                "waiting_on_backfill": [],
                "last_backfill_started": "MIN",
                "backfill_info": {
                    "begin": "MIN",
                    "end": "MIN",
                    "objects": []
                },
                "peer_backfill_info": [],
                "backfills_in_flight": [],
                "recovering": [],
                "pg_backend": {
                    "pull_from_peer": [],
                    "pushing": []
                }
            },
            "scrub": {
                "scrubber.epoch_start": "10370",
                "scrubber.active": false,
                "scrubber.state": "INACTIVE",
                "scrubber.start": "MIN",
                "scrubber.end": "MIN",
                "scrubber.max_end": "MIN",
                "scrubber.subset_last_update": "0'0",
                "scrubber.deep": false,
                "scrubber.waiting_on_whom": []
            }
        },
        {
            "name": "Started",
            "enter_time": "2020-07-21 14:17:04.814061"
        }
    ],
    "agent_state": {}
}

如果repair修復(fù)不了幻赚;兩種解決方案,回退舊版或者直接刪除

5.解決方案

回退舊版
[root@k8snode001 ~]# ceph pg  2.2b  mark_unfound_lost revert
直接刪除
[root@k8snode001 ~]# ceph pg  2.2b  mark_unfound_lost delete

6.驗證

我這里直接刪除了臊旭,然后ceph集群重建pg,稍等會再看落恼,pg狀態(tài)變?yōu)?code>active+clean

[root@k8snode001 ~]#  ceph pg  2.2b query
{
    "state": "active+clean",
    "snap_trimq": "[]",
    "snap_trimq_len": 0,
    "epoch": 11069,
    "up": [
        12,
        22,
        4
    ],

再次查看集群狀態(tài)

[root@k8snode001 ~]# ceph health detail
HEALTH_OK
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市离熏,隨后出現(xiàn)的幾起案子佳谦,更是在濱河造成了極大的恐慌,老刑警劉巖撤奸,帶你破解...
    沈念sama閱讀 216,744評論 6 502
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件吠昭,死亡現(xiàn)場離奇詭異,居然都是意外死亡胧瓜,警方通過查閱死者的電腦和手機矢棚,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,505評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來府喳,“玉大人蒲肋,你說我怎么就攤上這事《勐” “怎么了兜粘?”我有些...
    開封第一講書人閱讀 163,105評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長弯蚜。 經(jīng)常有香客問我孔轴,道長,這世上最難降的妖魔是什么碎捺? 我笑而不...
    開封第一講書人閱讀 58,242評論 1 292
  • 正文 為了忘掉前任路鹰,我火速辦了婚禮,結(jié)果婚禮上收厨,老公的妹妹穿的比我還像新娘晋柱。我一直安慰自己,他們只是感情好诵叁,可當(dāng)我...
    茶點故事閱讀 67,269評論 6 389
  • 文/花漫 我一把揭開白布雁竞。 她就那樣靜靜地躺著,像睡著了一般拧额。 火紅的嫁衣襯著肌膚如雪碑诉。 梳的紋絲不亂的頭發(fā)上彪腔,一...
    開封第一講書人閱讀 51,215評論 1 299
  • 那天,我揣著相機與錄音联贩,去河邊找鬼漫仆。 笑死,一個胖子當(dāng)著我的面吹牛泪幌,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播署照,決...
    沈念sama閱讀 40,096評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼祸泪,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了建芙?” 一聲冷哼從身側(cè)響起没隘,我...
    開封第一講書人閱讀 38,939評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎禁荸,沒想到半個月后右蒲,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,354評論 1 311
  • 正文 獨居荒郊野嶺守林人離奇死亡赶熟,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,573評論 2 333
  • 正文 我和宋清朗相戀三年瑰妄,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片映砖。...
    茶點故事閱讀 39,745評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡间坐,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出邑退,到底是詐尸還是另有隱情竹宋,我是刑警寧澤,帶...
    沈念sama閱讀 35,448評論 5 344
  • 正文 年R本政府宣布地技,位于F島的核電站蜈七,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏莫矗。R本人自食惡果不足惜飒硅,卻給世界環(huán)境...
    茶點故事閱讀 41,048評論 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望趣苏。 院中可真熱鬧狡相,春花似錦、人聲如沸食磕。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,683評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽彬伦。三九已至滔悉,卻和暖如春伊诵,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背回官。 一陣腳步聲響...
    開封第一講書人閱讀 32,838評論 1 269
  • 我被黑心中介騙來泰國打工曹宴, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人歉提。 一個月前我還...
    沈念sama閱讀 47,776評論 2 369
  • 正文 我出身青樓笛坦,卻偏偏與公主長得像,于是被迫代替她去往敵國和親苔巨。 傳聞我的和親對象是個殘疾皇子版扩,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 44,652評論 2 354

推薦閱讀更多精彩內(nèi)容

  • 3. 常見 PG 故障處理 3.1 PG 無法達(dá)到 CLEAN 狀態(tài) 創(chuàng)建一個新集群后,PG 的狀態(tài)一直處于 ac...
    lihanglucien閱讀 9,129評論 1 4
  • 本文借鑒了ceph官方資料侄泽,以及網(wǎng)絡(luò)公開可查的技術(shù)文檔或者圖片礁芦,非絕對原創(chuàng),向開源領(lǐng)域的貢獻(xiàn)者和傳播者致敬悼尾。 架構(gòu)...
    hcci閱讀 2,694評論 0 6
  • 1. PG介紹 繼上次分享的《Ceph介紹及原理架構(gòu)分享》柿扣,這次主要來分享Ceph中的PG各種狀態(tài)詳解,PG是最復(fù)...
    lihanglucien閱讀 23,508評論 2 16
  • 官網(wǎng):http://docs.ceph.com/docs/master/rados/operations/pg-s...
    Joncc閱讀 3,011評論 0 2
  • 一闺魏、如果出現(xiàn) osd啟動報try_get_map錯誤未状,可以從正常的osd去導(dǎo)出對應(yīng)版本的epoch,然后導(dǎo)回就可以...
    zcking閱讀 7,313評論 0 1