運行在容器中Postgres數據庫數據損壞后如何恢復?

前言

在使用 K8S 部署 RSS 全套自托管解決方案- RssHub + Tiny Tiny Rss, 我介紹了將 RssHub + Tiny Tiny RSS 部署到 K8s 集群中的方案. 其中 TTRSS 會用到 Postgres 存儲數據, 也一并部署到 K8s 容器中.

但是最近, 由于一次錯誤操作, 導致 Postgres 數據庫的 WAL 損壞, Postgres 的 Pod 頻繁 CrashBackoffLoop. 具體報錯如下:

Postgres shutdown exit code 1:

2023-09-27 02:32:17.127 UTC [1] LOG:  received fast shutdown request
2023-09-27 02:32:17.181 UTC [1] LOG:  aborting any active transactions
2023-09-27 02:32:17.434 UTC [1] LOG:  background worker "logical replication launcher" (PID 26) exited with exit code 1
2023-09-27 02:32:17.481 UTC [21] LOG:  shutting down
2023-09-27 02:32:17.880 UTC [1] LOG:  database system is shut down

Postgres "invalid resource manager ID in primary checkpoint record" and "could not locate a valid checkpoint record"

2023-09-27 02:33:23.189 UTC [1] LOG:  starting PostgreSQL 13.5 on x86_64-pc-linux-musl, compiled by gcc (Alpine 10.3.1_git20211027) 10.3.1 20211027, 64-bit
2023-09-27 02:33:23.190 UTC [1] LOG:  listening on IPv4 address "0.0.0.0", port 5432
2023-09-27 02:33:23.190 UTC [1] LOG:  listening on IPv6 address "::", port 5432
2023-09-27 02:33:23.199 UTC [1] LOG:  listening on Unix socket "/var/run/postgresql/.s.PGSQL.5432"
2023-09-27 02:33:23.210 UTC [21] LOG:  database system was shut down at 2023-09-27 02:32:22 UTC
2023-09-27 02:33:23.210 UTC [21] LOG:  invalid resource manager ID in primary checkpoint record
2023-09-27 02:33:23.210 UTC [21] PANIC:  could not locate a valid checkpoint record
2023-09-27 02:33:24.657 UTC [1] LOG:  startup process (PID 21) was terminated by signal 6: Aborted
2023-09-27 02:33:24.657 UTC [1] LOG:  aborting startup due to startup process failure
2023-09-27 02:33:24.659 UTC [1] LOG:  database system is shut down

如上, WAL文件已損壞, 應該如何恢復?

恢復步驟

??Warning:

目的是啟動 Postgres 恢復應用的正常運行. 數據可能存在丟失.

這是一個 TTRSS feed 應用, 只供我自己使用, 只要能啟動起來, 丟失一點數據無所謂.

首先, Postgres Pod 在 CrashBackoffLoop, 無法進行任何操作, 首要任務是使 Pod 啟動起來, 不要關閉. 這里通過在 Deployment 添加一些命令來實現. 如下:

apiVersion: apps/v1
kind: Deployment
metadata:
  ...
spec:
  ...
  template:
    spec:
      containers:
      - image: postgres:13-alpine
        imagePullPolicy: IfNotPresent
        name: postgres
        command: ["sh"]
        args: ["-c", "tail -f /dev/null"]
...

如上, 通過 sh -c tail -f /dev/null 實現 Pod 運行. 也可以通過類似 while true; do sleep 30; done; 等類似命令來實現.

Pod 穩(wěn)定運行后, 通過 kubectl exec -it 進入該Pod:

k3s kubectl exec -it database-postgres-56cff865bb-92pcx -n rsshub -- /bin/sh

并切換到 postgres 用戶:

su - postgres

??Warning:

切換到 postgres 用戶方可執(zhí)行下面命令.

接下來就順利了, 使用 pg_reset_wal 恢復 WAL:

先用 --dry-run 看看運行結果:

pg_resetwal --dry-run /var/lib/postgresql/data/

如果結果符合預期, 再運行:

pg_resetwal /var/lib/postgresql/data/
Write-ahead log reset

成功后, 退出 Pod. 并移除 Deploy 的 command 和 args 后, postgres 即可正常啟動. 如下:

2023-09-27 04:03:25.172 UTC [1] LOG:  starting PostgreSQL 13.5 on x86_64-pc-linux-musl, compiled by gcc (Alpine 10.3.1_git20211027) 10.3.1 20211027, 64-bit
2023-09-27 04:03:25.173 UTC [1] LOG:  listening on IPv4 address "0.0.0.0", port 5432
2023-09-27 04:03:25.173 UTC [1] LOG:  listening on IPv6 address "::", port 5432
2023-09-27 04:03:25.179 UTC [1] LOG:  listening on Unix socket "/var/run/postgresql/.s.PGSQL.5432"
2023-09-27 04:03:25.187 UTC [20] LOG:  database system was shut down at 2023-09-27 04:02:42 UTC
2023-09-27 04:03:25.210 UTC [1] LOG:  database system is ready to accept connections

完成??????

三人行, 必有我?guī)? 知識共享, 天下為公. 本文由東風微鳴技術博客 EWhisper.cn 編寫.

?著作權歸作者所有,轉載或內容合作請聯系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市缆八，隨后出現的幾起案子肚吏，更是在濱河造成了極大的恐慌，老刑警劉巖冤留，帶你破解...
沈念sama閱讀 218,755評論 6贊 507
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件譬巫，死亡現場離奇詭異捣鲸，居然都是意外死亡漫贞，警方通過查閱死者的電腦和手機甸箱，發(fā)現死者居然都...
沈念sama閱讀 93,305評論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來迅脐，“玉大人芍殖，你說我怎么就攤上這事∏疵铮” “怎么了豌骏？”我有些...
開封第一講書人閱讀 165,138評論 0贊 355
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長隐锭。經常有香客問我窃躲，道長，這世上最難降的妖魔是什么钦睡？我笑而不...
開封第一講書人閱讀 58,791評論 1贊 295
?港島之戀（遺憾婚禮）
正文為了忘掉前任蒂窒，我火速辦了婚禮，結果婚禮上荞怒，老公的妹妹穿的比我還像新娘洒琢。我一直安慰自己，他們只是感情好褐桌，可當我...
茶點故事閱讀 67,794評論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布衰抑。她就那樣靜靜地躺著，像睡著了一般荧嵌。火紅的嫁衣襯著肌膚如雪呛踊。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 51,631評論 1贊 305
城市分裂傳說
那天啦撮，我揣著相機與錄音恋技，去河邊找鬼。笑死逻族，一個胖子當著我的面吹牛蜻底，可吹牛的內容都是我干的。我是一名探鬼主播聘鳞，決...
沈念sama閱讀 40,362評論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼薄辅，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了抠璃？” 一聲冷哼從身側響起站楚，我...
開封第一講書人閱讀 39,264評論 0贊 276
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎搏嗡，沒想到半個月后窿春，有當地人在樹林里發(fā)現了一具尸體拉一，經...
沈念sama閱讀 45,724評論 1贊 315
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內容為張勛視角年9月15日...
茶點故事閱讀 37,900評論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年旧乞，在試婚紗的時候發(fā)現自己被綠了蔚润。大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 40,040評論 1贊 350
活死人
序言：一個原本活蹦亂跳的男人離奇死亡尺栖，死狀恐怖嫡纠，靈堂內的尸體忽然破棺而出，到底是詐尸還是另有隱情延赌，我是刑警寧澤除盏，帶...
沈念sama閱讀 35,742評論 5贊 346
?日本核電站爆炸內幕
正文年R本政府宣布，位于F島的核電站挫以，受9級特大地震影響者蠕，放射性物質發(fā)生泄漏。R本人自食惡果不足惜掐松，卻給世界環(huán)境...
茶點故事閱讀 41,364評論 3贊 330
男人毒藥：我在死后第九天來索命
文/蒙蒙一踱侣、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧甩栈，春花似錦泻仙、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 31,944評論 0贊 22
一樁弒父案玉转，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至殴蹄，卻和暖如春究抓，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背袭灯。一陣腳步聲響...
開封第一講書人閱讀 33,060評論 1贊 270
情欲美人皮
我被黑心中介騙來泰國打工刺下，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人稽荧。一個月前我還...
沈念sama閱讀 48,247評論 3贊 371
代替公主和親
正文我出身青樓橘茉，卻偏偏與公主長得像，于是被迫代替她去往敵國和親姨丈。傳聞我的和親對象是個殘疾皇子畅卓，可洞房花燭夜當晚...
茶點故事閱讀 44,979評論 2贊 355

運行在容器中Postgres數據庫數據損壞后如何恢復?

前言

恢復步驟

推薦閱讀更多精彩內容