掉電后文件內(nèi)容出錯(cuò)或文件損壞的原理
程序運(yùn)行過程中吞滞,有讀寫配置文件保存配置信息的操作战授。在程序運(yùn)行過程中突然斷電或者異常終止程序,會(huì)出現(xiàn)配置文件內(nèi)容出錯(cuò)(亂碼)甚至是文件被清空或者文件直接損壞而無法打開的情況。文件損壞時(shí)讼稚,可能報(bào)出segmentation fault的錯(cuò)誤,以致程序沒法正常運(yùn)行绕沈。
斷電瞬間正在往磁盤寫文件锐想。
內(nèi)容丟失:Linux為延遲寫(delayedwrite),突然斷電時(shí)乍狐,文件緩沖區(qū)中數(shù)據(jù)還未寫入文件赠摇,意味著并沒有持久化到磁盤。
文件損壞:文件系統(tǒng)內(nèi)部結(jié)構(gòu)不一致,導(dǎo)致文件系統(tǒng)破壞藕帜。
解決方案一烫罩、二、三洽故、四
方案一:程序先自行退出贝攒,而不能讓操作系統(tǒng)強(qiáng)制殺掉程序。
在C程序中加入SIGINT響應(yīng)函數(shù)时甚,保證程序正常退出隘弊。
1)Linux中的kill命令,會(huì)導(dǎo)致寫文件失敗荒适。
大部分的程序都需要一個(gè)handler來應(yīng)對(duì)SIGINT信號(hào)梨熙。只有正常退出,才能做到flush刀诬,保證寫文件成功咽扇。
方案二、使用具有容錯(cuò)和修復(fù)的文件系統(tǒng)解決文件損壞修復(fù)
Linux下普遍采用的是ext3文件系統(tǒng)陕壹,ext3是一個(gè)具有日志記錄功能的日志文件系統(tǒng)质欲,可以進(jìn)行簡(jiǎn)單的容錯(cuò)和恢復(fù),但是在一個(gè)高負(fù)荷讀寫的ext3文件系統(tǒng)下糠馆,如果突然發(fā)生掉電嘶伟,就很有可能發(fā)生文件系統(tǒng)內(nèi)部結(jié)構(gòu)不一致,導(dǎo)致文件系統(tǒng)破壞榨惠。
Linux在啟動(dòng)時(shí)奋早,會(huì)自動(dòng)去分析和檢查系統(tǒng)分區(qū),如果發(fā)現(xiàn)文件系統(tǒng)有簡(jiǎn)單的錯(cuò)誤赠橙,會(huì)自動(dòng)修復(fù)耽装,如果文件系統(tǒng)破壞比較嚴(yán)重,系統(tǒng)無法完成修復(fù)時(shí)期揪,系統(tǒng)就會(huì)自動(dòng)進(jìn)入單用戶模式下或者出現(xiàn)一個(gè)交互界面掉奄,提示用戶介入手動(dòng)修復(fù)。現(xiàn)象類似下面所示:
checking root filesystem
/dev/sdb5 contains a file system with? errors, check forced /dev/sdb5: Unattached inode 68338812
/dev/sdb5: UNEXPECTED INCONSISTENCY; RUN fsck MANUALLY (i.e., without -a or -p options) FAILED
/contains a file system with errors check? forced an eror occurred during the file? system? check
****dropping you to a shell;the system will reboot
****when you leave the shell
Press enter for maintenance(or type? Control-D to continue):
give root password for maintenance
從這個(gè)錯(cuò)誤可以看出凤薛,系統(tǒng)根分區(qū)文件系統(tǒng)出現(xiàn)了問題姓建,系統(tǒng)在啟動(dòng)時(shí)無法自動(dòng)修復(fù)。根據(jù)上面的錯(cuò)誤提示缤苫,當(dāng)按下“Control-D”組合鍵后系統(tǒng)自動(dòng)重啟速兔,當(dāng)輸入root密碼后進(jìn)入系統(tǒng)修復(fù)模式,執(zhí)行fsck命令進(jìn)行修復(fù):
[root@localhost /]# umount /dev/sdb5
[root@localhost /]# fsck .ext3 -y? /dev/sdb5
e2fsck 1.39 (29-May-2006)
/ contains a file system with errors, check forced.
Pass 1: Checking inodes, blocks, and sizes
Pass 2: Checking directory structure
Pass 3: Checking directory connectivity
Pass 4: Checking reference counts
Inode 6833812 ref count is 2, should be 1.? Fix<y>? yes
Unattached inode 6833812
Connect to /lost+found<y>? yes
Inode 6833812 ref count is 2, should be 1.? Fix<y>? yes
Pass 5: Checking group summary information
Block bitmap differences:? -(519--529) -9273
Fix<y>? yes
…… ……
/: ***** FILE SYSTEM WAS MODIFIED *****
/: 19/128520 files (15.8% non-contiguous), 46034/514048 blocks
方案三:編程時(shí)以犧牲性能效率達(dá)到及時(shí)同步數(shù)據(jù)
在C程序中加入fflush函數(shù)活玲,保證所有輸出第一時(shí)間寫入文件涣狗,防止數(shù)據(jù)丟失谍婉。
1. 背景:
fwrite函數(shù)只是將所寫內(nèi)容存入用戶緩存,并不立刻寫入文件.
fflush函數(shù)將用戶緩存中的內(nèi)容寫入內(nèi)核緩沖區(qū)
fsync函數(shù)則是將內(nèi)核緩沖寫入文件
fclose則先執(zhí)行fflush,再關(guān)閉文件的讀寫.
fclose庫函數(shù)關(guān)閉指定的文件流stream,使所有尚未寫出的數(shù)據(jù)都寫出镀钓。因?yàn)閟tdio庫會(huì)對(duì)數(shù)據(jù)進(jìn)行緩沖穗熬,所以使用fclose是很重要的。如果程序需要確保數(shù)據(jù)已經(jīng)全部寫出丁溅,就應(yīng)該調(diào)用fclose函數(shù)唤蔗。雖然當(dāng)程序正常結(jié)束時(shí),會(huì)自動(dòng)對(duì)所有還打開的文件流調(diào)用fclose函數(shù)窟赏。
2. 方法:
每次寫完后fflush(FILE*fp) ; int fsync(int fd); →強(qiáng)制把數(shù)據(jù)寫到磁盤妓柜。
(還有就是可以把緩沖區(qū)設(shè)置成無緩沖. )
這樣就能最多限度的保證不會(huì)因?yàn)榫彌_的緣故而照此數(shù)據(jù)丟失.不過這要在效率上要付出代價(jià)的.
方案四:建立備份配置文件
若原配置文件損壞,則新建配置文件饰序,并將備份文件內(nèi)容拷貝到新建配置文件领虹。
解決找不到配置文件而產(chǎn)生段錯(cuò)誤规哪,以致程序無法啟動(dòng)或正常運(yùn)行的問題求豫。
硬件服務(wù)器:RAID卡配置超級(jí)電容解決掉電丟數(shù)據(jù)問題
在服務(wù)器進(jìn)行一次大量寫操作時(shí),一般使用高速緩存來提升系統(tǒng)性能诉稍,因?yàn)閿?shù)據(jù)寫入高速緩存的速度大于數(shù)據(jù)寫入硬盤的速度蝠嘉。當(dāng)服務(wù)器寫壓力減小或高速緩存將寫滿時(shí),數(shù)據(jù)再由高速緩存寫入硬盤杯巨。
開啟高速緩存提升寫性能的同時(shí)蚤告,增大了數(shù)據(jù)丟失的風(fēng)險(xiǎn),在整機(jī)意外掉電時(shí)服爷,高速緩存中的數(shù)據(jù)將會(huì)丟失杜恰。
為了提升整機(jī)的高讀寫性能和高速緩存中數(shù)據(jù)的安全,可為RAID卡配置超級(jí)電容仍源。超級(jí)電容保護(hù)模塊的原理是在發(fā)生系統(tǒng)意外掉電時(shí)心褐,利用其超級(jí)電容供電,將高速緩存中的數(shù)據(jù)寫入超級(jí)電容模塊中的NAND Flash中笼踩。
由于數(shù)據(jù)保護(hù)需要超級(jí)電容的配合逗爹,為了記錄超級(jí)電容的放電曲線,以便RAID卡了解超級(jí)電容的狀態(tài)嚎于,例如最大和最小電壓等掘而,同時(shí)為了延長超級(jí)電容的壽命,RAID卡默認(rèn)啟動(dòng)超級(jí)電容自動(dòng)校準(zhǔn)模式于购。超級(jí)電容電量校準(zhǔn)過程中袍睡,RAID卡寫策略自動(dòng)調(diào)整為“WT”模式以保證數(shù)據(jù)完整性,此時(shí)RAID卡性能會(huì)降低肋僧。電量校準(zhǔn)的周期取決于超級(jí)電容充放電速度斑胜。
虛擬機(jī)篇
案例1:阿里云的云存儲(chǔ)網(wǎng)關(guān)方案
網(wǎng)關(guān)緩存模式采用同步IO(Sync IO)落盤持舆,確保掉電不丟失數(shù)據(jù)。
云上網(wǎng)關(guān)依托于阿里云云盤的高可靠性伪窖,確保了緩存盤的數(shù)據(jù)持久可靠逸寓。
本地部署的網(wǎng)關(guān)依賴于您虛擬環(huán)境后端存儲(chǔ)的可靠性,建議您使用RAID存儲(chǔ)或高可靠分布式存儲(chǔ)作為緩存盤覆山。
網(wǎng)關(guān)將緩存盤的新數(shù)據(jù)刷新上傳到OSS Bucket竹伸,依托OSS數(shù)據(jù)設(shè)計(jì)持久性不低于99.9999999999%(12個(gè)9)保證了數(shù)據(jù)的安全可靠,進(jìn)而確保了數(shù)據(jù)從進(jìn)入網(wǎng)關(guān)到上傳云端整條鏈路的高可靠性簇宽。
案例2:linux物理主機(jī)判斷掉電后自動(dòng)關(guān)閉虛擬機(jī)
如何才能讓exsi主機(jī)在斷電的時(shí)候自動(dòng)的進(jìn)行判斷勋篓,然后按照設(shè)定的順序依次關(guān)閉虛擬機(jī)然后自己關(guān)機(jī)以保護(hù)硬盤數(shù)據(jù)。
#!/bin/sh
while
? ? ? ping -c 1 12.12.12.252 > /dev/null
? ? ? [ $? -eq 0 ];
do
#? date && echo ' AC Power OK ! '? >> /vmfs/volumes/datastore1/ups/ups.log
? ? ? sleep 180
done
? ? ? date &&? echo ' AC Power maybe off,? checking again after 3 minutes ! ' >> /vmfs/volumes/datastore1/ups/ups.log
? ? sleep 180
? ? ping -c 1 12.12.12.252 > /dev/null
if [ $? -eq 0 ]
then
? date &&? echo 'Checkagain,AC Power OK! ' >> /vmfs/volumes/datastore1/ups/ups.log
else
? ? date &&? echo ' AC Power is already off,? shut down NAS Now! ' >> /vmfs/volumes/datastore1/ups/ups.log
? ? /bin/shutdown.sh
? ? halt
fi
代碼中的12.12.12.252 改為你要Ping的網(wǎng)關(guān)地址魏割,datastore1 部分的改為你的硬盤名稱譬嚣。
方案三(自我思考,方案待實(shí)現(xiàn)):KVM虛擬出來一個(gè)檢測(cè)掉電的設(shè)備安裝到虛擬機(jī)上钞它,虛擬機(jī)掉電設(shè)備檢查出來物理主機(jī)掉電拜银,可以觸發(fā)虛擬機(jī)進(jìn)行優(yōu)雅關(guān)機(jī)。依托于物理主機(jī)有掉電保護(hù)機(jī)制遭垛,給虛擬機(jī)一定的時(shí)間來同步數(shù)據(jù)到磁盤尼桶。
方案匯總
1. 選擇具有容錯(cuò)和修復(fù)的文件系統(tǒng)解決文件損壞修復(fù)
2. 開發(fā)人員注意編程事項(xiàng),fclose等優(yōu)雅操作锯仪。
3. 物理主機(jī)RAID卡配置超級(jí)電容解決掉電丟數(shù)據(jù)問題
4. 物理主機(jī)給虛擬機(jī)爭(zhēng)取同步數(shù)據(jù)到磁盤的時(shí)間泵督,增加掉電檢測(cè)設(shè)備或腳本。
參考
https://support.huawei.com/enterprise/zh/doc/EDOC1000163568/9fb0a004