摘要:一饱须、故障描述 服務(wù)器是dell 730系列服務(wù)器域醇,存儲(chǔ)陣列是MD3200系列存儲(chǔ)5T的Lun,操作系統(tǒng)是Linux centos 7蓉媳,文件系統(tǒng)類型是EXT4譬挚,因意外斷電,導(dǎo)致系統(tǒng)不能正常啟動(dòng)酪呻,修復(fù)之后系統(tǒng)可以正常啟動(dòng)减宣,但是掛載的5T分區(qū)不能正常訪問了,對(duì)這個(gè)5T的分區(qū)進(jìn)行fsck修復(fù)玩荠,修復(fù)完成之后文件系統(tǒng)正常漆腌,但是丟失了部分文件,仔細(xì)查看之后缺失的部分文件在lost+found文件夾里面阶冈,文件名稱已經(jīng)被改變闷尿。
一、故障描述
服務(wù)器是dell 730系列服務(wù)器眼溶,存儲(chǔ)陣列是MD3200系列存儲(chǔ)5T的Lun悠砚,操作系統(tǒng)是Linux centos 7,文件系統(tǒng)類型是EXT4堂飞,因意外斷電灌旧,導(dǎo)致系統(tǒng)不能正常啟動(dòng)绑咱,修復(fù)之后系統(tǒng)可以正常啟動(dòng),但是掛載的5T分區(qū)不能正常訪問了枢泰,對(duì)這個(gè)5T的分區(qū)進(jìn)行fsck修復(fù)描融,修復(fù)完成之后文件系統(tǒng)正常,但是丟失了部分文件衡蚂,仔細(xì)查看之后缺失的部分文件在lost+found文件夾里面窿克,文件名稱已經(jīng)被改變。
二毛甲、故障分析
1年叮、備份數(shù)據(jù)
把MD3200存儲(chǔ)的5T的lun以只讀模式重新映射到一臺(tái)windows 2008的備份服務(wù)器上,接著使用專業(yè)的工具將整個(gè)5T卷以扇區(qū)的方式鏡像到已準(zhǔn)備的備份空間上玻募,以確敝凰穑客戶的數(shù)據(jù)安全,之后的分析和恢復(fù)操作均在備份的數(shù)據(jù)上進(jìn)行七咧。
2跃惫、分析故障原因
仔細(xì)分析5T卷的底層數(shù)據(jù)發(fā)現(xiàn),服務(wù)器的突然斷電導(dǎo)致故障虛擬機(jī)目錄下的目錄項(xiàng)出現(xiàn)破壞艾栋,但是這種破壞不會(huì)影響重要數(shù)據(jù)爆存,只是破壞了文件的目錄項(xiàng)而已,可以通過人工修復(fù)即可解決蝗砾。而之后對(duì)文件系統(tǒng)進(jìn)行fsck修復(fù)先较,導(dǎo)致?lián)p壞的目錄項(xiàng)修復(fù)不成功,直接以目錄節(jié)點(diǎn)號(hào)命名放到lost+found文件夾下遥诉,則目錄項(xiàng)對(duì)應(yīng)的數(shù)據(jù)區(qū)索引會(huì)被清掉拇泣,也不會(huì)影響刪除文件的實(shí)際數(shù)據(jù)噪叙。這種情況可根據(jù)刪除虛擬磁盤文件中的文件系統(tǒng)以及虛擬磁盤中的文件類型在VMFS卷自由空間中進(jìn)行碎片匹配和合并矮锈,最終也可恢復(fù)刪除的虛擬磁盤文件。
三睁蕾、實(shí)施方向
由于ext4文件系統(tǒng)文件丟失之后苞笨,文件的節(jié)點(diǎn)信息被清除了,所以無法根據(jù)文件的節(jié)點(diǎn)信息進(jìn)行還原子眶,只能根據(jù)丟失的文件的目錄項(xiàng)節(jié)點(diǎn)號(hào)和lost+found里面的文件的名稱進(jìn)行匹配瀑凝,由于lost+found里面的文件是以該文件的目錄項(xiàng)的節(jié)點(diǎn)號(hào)命名的,所以把目錄項(xiàng)節(jié)點(diǎn)號(hào)提取出來和lost+found的文件名稱進(jìn)行匹配就可以還原之前的目錄結(jié)構(gòu)臭杰。
四粤咪、恢復(fù)數(shù)據(jù)
按照實(shí)施方向思路進(jìn)行底層分析,根據(jù)EXT4的文件系統(tǒng)結(jié)構(gòu)信息渴杆,在底層的空間中掃描符合的目錄項(xiàng)的區(qū)域寥枝,并統(tǒng)計(jì)其數(shù)量和計(jì)算目錄項(xiàng)的節(jié)點(diǎn)號(hào)宪塔。再根據(jù)磁盤中的文件系統(tǒng)的信息將這些掃描到的目錄項(xiàng)節(jié)點(diǎn)號(hào)進(jìn)行整合,把掃描到的目錄項(xiàng)節(jié)點(diǎn)號(hào)記錄到數(shù)據(jù)庫(kù)里面囊拜,之后在通過lost+found里面的文件記錄號(hào)和數(shù)據(jù)庫(kù)里面的記錄號(hào)進(jìn)行匹配某筐。
五、恢復(fù)總結(jié)
由于客戶數(shù)據(jù)先是被突然斷電導(dǎo)致文件系統(tǒng)出現(xiàn)問題冠跷,接著人為fsck修復(fù)導(dǎo)致大量文件目錄結(jié)構(gòu)丟失南誊,并且又重新寫入部分?jǐn)?shù)據(jù),導(dǎo)致其存在數(shù)據(jù)覆蓋的可能性蜜托。由于對(duì)ext4文件系統(tǒng)底層結(jié)構(gòu)足夠了解抄囚,并且有處理過類似故障類型的經(jīng)驗(yàn)。所以整個(gè)恢復(fù)過程中還算比
較順利橄务。匹配之后數(shù)據(jù)正车√Γ恢復(fù),并且驗(yàn)證沒有問題仪糖,整個(gè)數(shù)據(jù)恢復(fù)成功柑司。