有時(shí)候?yàn)榱藦浹a(bǔ)Bug或者系統(tǒng)異常倔幼,經(jīng)常線上操作DB來修正數(shù)據(jù)顷蟆,常在河邊走哪有不濕鞋饲齐,濕鞋的場(chǎng)景如:
(1)update錯(cuò)數(shù)據(jù)了钉凌;
(2)delete錯(cuò)數(shù)據(jù)了;
(3)drop錯(cuò)數(shù)據(jù)了捂人;
咋整坝瘛?找DBA恢復(fù)數(shù)據(jù)唄滥搭,即使恢復(fù)不了酸纲,鍋總得有人背呀。
一瑟匆、不能實(shí)現(xiàn)數(shù)據(jù)恢復(fù)方案
從“從庫”恢復(fù)數(shù)據(jù)闽坡。一般來說數(shù)據(jù)庫集群是主從架構(gòu):如果人為執(zhí)行了“刪庫”操作,命令會(huì)同步給其他從庫脓诡,導(dǎo)致所有庫上的數(shù)據(jù)全被刪除无午,無法恢復(fù),故這種方案是不行的祝谚。
二宪迟、如果沒有做安全方案,最常見的處理方案
如果沒有做數(shù)據(jù)安全方案交惯,應(yīng)對(duì)“刪庫”最常見的操作是次泽,跑路
。
刪掉了公司最重要的資產(chǎn)席爽,還不快閃意荤。
三、如果DBA日常做了全量備份+增量備份
DBA最常見的技能是:全量備份+增量備份只锻。
全量備份:定期(例如一個(gè)月)將庫文件全量備份玖像。
增量備份:定期(例如每天)將binlog增量備份。
如果不小心“刪庫”齐饮,可以這么恢復(fù):
(1)將最近一次全量備份的全庫找到捐寥,拷貝回來(文件一般比較大),解壓祖驱,應(yīng)用握恳;
(2)將最近一次全量備份后,每一天的增量binlog找到捺僻,拷貝回來(文件較多)乡洼,依次重放崇裁;
(3)將最近一次增量備份后,到執(zhí)行“刪全庫”之前的binlog找到束昵,重放拔稳;恢復(fù)完畢。
為了保證方案的可靠性妻怎,需要定期進(jìn)行演練
壳炎。很有可能只是做了理論上的方案,如果真出了問題逼侦,效果也只是理論上能恢復(fù)匿辩。此時(shí)回歸方案一,跑路榛丢。全量備份+增量備份的恢復(fù)周期也非常長铲球,可能是天級(jí)別。解釋:把幾T的數(shù)據(jù)傳輸過來都用了好長時(shí)間晰赞。
四稼病、如果DBA做了“1小時(shí)延時(shí)從庫”
什么是1小時(shí)延時(shí)從庫?如上圖所示掖鱼,增加一個(gè)從庫然走,這個(gè)從庫不是實(shí)時(shí)與主庫保持同步的,而是每隔1個(gè)小時(shí)同步一次主庫戏挡,同步完之后立馬斷開1小時(shí)芍瑞,這個(gè)從庫會(huì)與主庫保持1個(gè)小時(shí)的數(shù)據(jù)差距。
當(dāng)“刪全庫”事故發(fā)生時(shí)褐墅,如何利用“1小時(shí)延時(shí)從庫”快速恢復(fù)數(shù)據(jù)拆檬?
(1)應(yīng)用1小時(shí)延時(shí)從;
(2)將1小時(shí)延時(shí)從最近一次同步時(shí)間到妥凳,執(zhí)行“刪全庫”之前的binlog找到竟贯,重放快速恢復(fù)完畢。這個(gè)方案的優(yōu)點(diǎn)是逝钥,能夠快速找回?cái)?shù)據(jù)屑那。潛在不足是,萬一“1小時(shí)延時(shí)從庫”正在連上主庫進(jìn)行同步的一小段時(shí)間內(nèi)艘款,發(fā)生了“刪庫”事故持际,也無法恢復(fù)。
五磷箕、如果DBA做了“雙份1小時(shí)延時(shí)從庫”
什么是雙份1小時(shí)延時(shí)從?如上圖所示阵难,兩個(gè)1小時(shí)延時(shí)從庫岳枷,它們連主庫同步數(shù)據(jù)的時(shí)間“岔開半小時(shí)”。這樣,即使一個(gè)延時(shí)從連上主庫進(jìn)行同步的一小段時(shí)間內(nèi)空繁,發(fā)生了“刪庫”事故殿衰,依然有另一個(gè)延時(shí)從保有半小時(shí)之前的數(shù)據(jù),可以實(shí)施快速恢復(fù)盛泡。這個(gè)方案的優(yōu)點(diǎn)是闷祥,沒有萬一,一定能快速恢復(fù)數(shù)據(jù)傲诵。潛在的不足是凯砍,資源利用率有點(diǎn)低,為了保證數(shù)據(jù)的安全性拴竹,多了2臺(tái)延時(shí)從悟衩,降低了從庫利用率。如何提高從庫利用效率栓拜?
對(duì)于一些“允許延時(shí)”的業(yè)務(wù)座泳,可以使用1小時(shí)延時(shí)從,例如:
(1)運(yùn)營后臺(tái)幕与,產(chǎn)品后臺(tái)挑势;
(2)BI進(jìn)行數(shù)據(jù)同步;
(3)研發(fā)進(jìn)行數(shù)據(jù)抽樣啦鸣,調(diào)研潮饱;但需要注意的是,畢竟這是從庫赏陵,只能夠提供“只讀”服務(wù)喲饼齿。
六、總結(jié)
保證數(shù)據(jù)的安全性是DBA第一要?jiǎng)?wù):
(0)理論上可以恢復(fù)+跑路蝙搔;
(1)全量備份+增量備份+定期演練缕溉;
(2)1小時(shí)延時(shí)從庫;
(3)雙份1小時(shí)延時(shí)從庫+提高資源利用率吃型;
補(bǔ)充說明:現(xiàn)如今很多成熟的云數(shù)據(jù)庫產(chǎn)品提供了基于時(shí)間點(diǎn)快照的快速恢復(fù)機(jī)制证鸥。
七、通過binlog進(jìn)行恢復(fù)
通過mysql恢復(fù)的話需要確保刪除前是mysql是開啟binlog勤晚。
具體步驟:
1.查詢binlog狀態(tài)以及位置枉层。在/etc/my.cfg查看binlog開啟狀態(tài):
cat /etc/my.cnf
- mysql查詢執(zhí)行的binlog文件。例如:目標(biāo)文件是mysql-bin.000053.
3.利用mysqlbinlog轉(zhuǎn)化文件格式赐写,獲取想要恢復(fù)的位置鸟蜡。
cd /usr/local/mysql/bin
mysqlbinlog 執(zhí)行文件在以上路徑
mysql-bin.000053
在/usr/local/mysql/var
中。
執(zhí)行挺邀,test需要恢復(fù)的數(shù)據(jù)庫揉忘。
mysqlbinlog --no-defaults --base64-output='decode-rows' -d test -v mysql-bin.000053 > /home/test
4.在導(dǎo)出的test文件中查找需要回退的位置跳座。
選取位置為817759979,由于我是整個(gè)數(shù)據(jù)庫出現(xiàn)的數(shù)據(jù)混亂以及替換泣矛,全部回退疲眷。
5.恢復(fù)數(shù)據(jù)。
刪除原有的數(shù)據(jù)庫(以防萬一您朽,提前做好備份)狂丝。
./mysqlbinlog -d test --stop-position=817759979 /usr/local/mysql/var/mysql-bin.000053 | mysql -uroot -ppasswd
命令執(zhí)行完成就已經(jīng)恢復(fù)到需要恢復(fù)的指定點(diǎn)。