Linux虛擬機(jī)掉電后文件損壞或出錯(cuò)的原理和解決方案

掉電后文件內(nèi)容出錯(cuò)或文件損壞的原理

程序運(yùn)行過程中吞滞,有讀寫配置文件保存配置信息的操作战授。在程序運(yùn)行過程中突然斷電或者異常終止程序,會(huì)出現(xiàn)配置文件內(nèi)容出錯(cuò)(亂碼)甚至是文件被清空或者文件直接損壞而無法打開的情況。文件損壞時(shí)讼稚,可能報(bào)出segmentation fault的錯(cuò)誤,以致程序沒法正常運(yùn)行绕沈。

斷電瞬間正在往磁盤寫文件锐想。

內(nèi)容丟失:Linux為延遲寫(delayedwrite),突然斷電時(shí)乍狐,文件緩沖區(qū)中數(shù)據(jù)還未寫入文件赠摇,意味著并沒有持久化到磁盤。

文件損壞:文件系統(tǒng)內(nèi)部結(jié)構(gòu)不一致,導(dǎo)致文件系統(tǒng)破壞藕帜。

解決方案一烫罩、二、三洽故、四

方案一:程序先自行退出贝攒,而不能讓操作系統(tǒng)強(qiáng)制殺掉程序。

在C程序中加入SIGINT響應(yīng)函數(shù)时甚,保證程序正常退出隘弊。

1)Linux中的kill命令,會(huì)導(dǎo)致寫文件失敗荒适。

大部分的程序都需要一個(gè)handler來應(yīng)對(duì)SIGINT信號(hào)梨熙。只有正常退出,才能做到flush刀诬,保證寫文件成功咽扇。

方案二、使用具有容錯(cuò)和修復(fù)的文件系統(tǒng)解決文件損壞修復(fù)

Linux下普遍采用的是ext3文件系統(tǒng)陕壹,ext3是一個(gè)具有日志記錄功能的日志文件系統(tǒng)质欲,可以進(jìn)行簡(jiǎn)單的容錯(cuò)和恢復(fù),但是在一個(gè)高負(fù)荷讀寫的ext3文件系統(tǒng)下糠馆,如果突然發(fā)生掉電嘶伟,就很有可能發(fā)生文件系統(tǒng)內(nèi)部結(jié)構(gòu)不一致,導(dǎo)致文件系統(tǒng)破壞榨惠。

Linux在啟動(dòng)時(shí)奋早,會(huì)自動(dòng)去分析和檢查系統(tǒng)分區(qū),如果發(fā)現(xiàn)文件系統(tǒng)有簡(jiǎn)單的錯(cuò)誤赠橙,會(huì)自動(dòng)修復(fù)耽装,如果文件系統(tǒng)破壞比較嚴(yán)重,系統(tǒng)無法完成修復(fù)時(shí)期揪,系統(tǒng)就會(huì)自動(dòng)進(jìn)入單用戶模式下或者出現(xiàn)一個(gè)交互界面掉奄,提示用戶介入手動(dòng)修復(fù)。現(xiàn)象類似下面所示:

checking root filesystem

/dev/sdb5 contains a file system with? errors, check forced /dev/sdb5: Unattached inode 68338812

/dev/sdb5: UNEXPECTED INCONSISTENCY; RUN fsck MANUALLY (i.e., without -a or -p options) FAILED

/contains a file system with errors check? forced an eror occurred during the file? system? check

****dropping you to a shell;the system will reboot

****when you leave the shell

Press enter for maintenance(or type? Control-D to continue):

give root password for maintenance

從這個(gè)錯(cuò)誤可以看出凤薛,系統(tǒng)根分區(qū)文件系統(tǒng)出現(xiàn)了問題姓建,系統(tǒng)在啟動(dòng)時(shí)無法自動(dòng)修復(fù)。根據(jù)上面的錯(cuò)誤提示缤苫,當(dāng)按下“Control-D”組合鍵后系統(tǒng)自動(dòng)重啟速兔,當(dāng)輸入root密碼后進(jìn)入系統(tǒng)修復(fù)模式,執(zhí)行fsck命令進(jìn)行修復(fù):

[root@localhost /]# umount /dev/sdb5

[root@localhost /]# fsck .ext3 -y? /dev/sdb5

e2fsck 1.39 (29-May-2006)

/ contains a file system with errors, check forced.

Pass 1: Checking inodes, blocks, and sizes

Pass 2: Checking directory structure

Pass 3: Checking directory connectivity

Pass 4: Checking reference counts

Inode 6833812 ref count is 2, should be 1.? Fix<y>? yes

Unattached inode 6833812

Connect to /lost+found<y>? yes

Inode 6833812 ref count is 2, should be 1.? Fix<y>? yes

Pass 5: Checking group summary information

Block bitmap differences:? -(519--529) -9273

Fix<y>? yes

…… ……

/: ***** FILE SYSTEM WAS MODIFIED *****

/: 19/128520 files (15.8% non-contiguous), 46034/514048 blocks

方案三:編程時(shí)以犧牲性能效率達(dá)到及時(shí)同步數(shù)據(jù)

在C程序中加入fflush函數(shù)活玲,保證所有輸出第一時(shí)間寫入文件涣狗,防止數(shù)據(jù)丟失谍婉。

1. 背景:

fwrite函數(shù)只是將所寫內(nèi)容存入用戶緩存,并不立刻寫入文件.

fflush函數(shù)將用戶緩存中的內(nèi)容寫入內(nèi)核緩沖區(qū)

fsync函數(shù)則是將內(nèi)核緩沖寫入文件

fclose則先執(zhí)行fflush,再關(guān)閉文件的讀寫.

fclose庫函數(shù)關(guān)閉指定的文件流stream,使所有尚未寫出的數(shù)據(jù)都寫出镀钓。因?yàn)閟tdio庫會(huì)對(duì)數(shù)據(jù)進(jìn)行緩沖穗熬,所以使用fclose是很重要的。如果程序需要確保數(shù)據(jù)已經(jīng)全部寫出丁溅,就應(yīng)該調(diào)用fclose函數(shù)唤蔗。雖然當(dāng)程序正常結(jié)束時(shí),會(huì)自動(dòng)對(duì)所有還打開的文件流調(diào)用fclose函數(shù)窟赏。

2. 方法:

每次寫完后fflush(FILE*fp) ; int fsync(int fd); →強(qiáng)制把數(shù)據(jù)寫到磁盤妓柜。

(還有就是可以把緩沖區(qū)設(shè)置成無緩沖. )

這樣就能最多限度的保證不會(huì)因?yàn)榫彌_的緣故而照此數(shù)據(jù)丟失.不過這要在效率上要付出代價(jià)的.

方案四:建立備份配置文件

若原配置文件損壞,則新建配置文件饰序,并將備份文件內(nèi)容拷貝到新建配置文件领虹。

解決找不到配置文件而產(chǎn)生段錯(cuò)誤规哪,以致程序無法啟動(dòng)或正常運(yùn)行的問題求豫。

硬件服務(wù)器:RAID卡配置超級(jí)電容解決掉電丟數(shù)據(jù)問題

在服務(wù)器進(jìn)行一次大量寫操作時(shí),一般使用高速緩存來提升系統(tǒng)性能诉稍,因?yàn)閿?shù)據(jù)寫入高速緩存的速度大于數(shù)據(jù)寫入硬盤的速度蝠嘉。當(dāng)服務(wù)器寫壓力減小或高速緩存將寫滿時(shí),數(shù)據(jù)再由高速緩存寫入硬盤杯巨。

開啟高速緩存提升寫性能的同時(shí)蚤告,增大了數(shù)據(jù)丟失的風(fēng)險(xiǎn),在整機(jī)意外掉電時(shí)服爷,高速緩存中的數(shù)據(jù)將會(huì)丟失杜恰。

為了提升整機(jī)的高讀寫性能和高速緩存中數(shù)據(jù)的安全,可為RAID卡配置超級(jí)電容仍源。超級(jí)電容保護(hù)模塊的原理是在發(fā)生系統(tǒng)意外掉電時(shí)心褐,利用其超級(jí)電容供電,將高速緩存中的數(shù)據(jù)寫入超級(jí)電容模塊中的NAND Flash中笼踩。

由于數(shù)據(jù)保護(hù)需要超級(jí)電容的配合逗爹,為了記錄超級(jí)電容的放電曲線,以便RAID卡了解超級(jí)電容的狀態(tài)嚎于,例如最大和最小電壓等掘而,同時(shí)為了延長超級(jí)電容的壽命,RAID卡默認(rèn)啟動(dòng)超級(jí)電容自動(dòng)校準(zhǔn)模式于购。超級(jí)電容電量校準(zhǔn)過程中袍睡,RAID卡寫策略自動(dòng)調(diào)整為“WT”模式以保證數(shù)據(jù)完整性,此時(shí)RAID卡性能會(huì)降低肋僧。電量校準(zhǔn)的周期取決于超級(jí)電容充放電速度斑胜。

虛擬機(jī)篇

案例1:阿里云的云存儲(chǔ)網(wǎng)關(guān)方案

網(wǎng)關(guān)緩存模式采用同步IO(Sync IO)落盤持舆,確保掉電不丟失數(shù)據(jù)。

云上網(wǎng)關(guān)依托于阿里云云盤的高可靠性伪窖,確保了緩存盤的數(shù)據(jù)持久可靠逸寓。

本地部署的網(wǎng)關(guān)依賴于您虛擬環(huán)境后端存儲(chǔ)的可靠性,建議您使用RAID存儲(chǔ)或高可靠分布式存儲(chǔ)作為緩存盤覆山。

網(wǎng)關(guān)將緩存盤的新數(shù)據(jù)刷新上傳到OSS Bucket竹伸,依托OSS數(shù)據(jù)設(shè)計(jì)持久性不低于99.9999999999%(12個(gè)9)保證了數(shù)據(jù)的安全可靠,進(jìn)而確保了數(shù)據(jù)從進(jìn)入網(wǎng)關(guān)到上傳云端整條鏈路的高可靠性簇宽。

案例2:linux物理主機(jī)判斷掉電后自動(dòng)關(guān)閉虛擬機(jī)

如何才能讓exsi主機(jī)在斷電的時(shí)候自動(dòng)的進(jìn)行判斷勋篓,然后按照設(shè)定的順序依次關(guān)閉虛擬機(jī)然后自己關(guān)機(jī)以保護(hù)硬盤數(shù)據(jù)。

#!/bin/sh

while

? ? ? ping -c 1 12.12.12.252 > /dev/null

? ? ? [ $? -eq 0 ];

do

#? date && echo ' AC Power OK ! '? >> /vmfs/volumes/datastore1/ups/ups.log

? ? ? sleep 180

done

? ? ? date &&? echo ' AC Power maybe off,? checking again after 3 minutes ! ' >> /vmfs/volumes/datastore1/ups/ups.log

? ? sleep 180

? ? ping -c 1 12.12.12.252 > /dev/null

if [ $? -eq 0 ]

then

? date &&? echo 'Checkagain,AC Power OK! ' >> /vmfs/volumes/datastore1/ups/ups.log

else

? ? date &&? echo ' AC Power is already off,? shut down NAS Now! ' >> /vmfs/volumes/datastore1/ups/ups.log

? ? /bin/shutdown.sh

? ? halt

fi

代碼中的12.12.12.252 改為你要Ping的網(wǎng)關(guān)地址魏割,datastore1 部分的改為你的硬盤名稱譬嚣。

方案三(自我思考,方案待實(shí)現(xiàn)):KVM虛擬出來一個(gè)檢測(cè)掉電的設(shè)備安裝到虛擬機(jī)上钞它,虛擬機(jī)掉電設(shè)備檢查出來物理主機(jī)掉電拜银,可以觸發(fā)虛擬機(jī)進(jìn)行優(yōu)雅關(guān)機(jī)。依托于物理主機(jī)有掉電保護(hù)機(jī)制遭垛,給虛擬機(jī)一定的時(shí)間來同步數(shù)據(jù)到磁盤尼桶。

方案匯總

1. 選擇具有容錯(cuò)和修復(fù)的文件系統(tǒng)解決文件損壞修復(fù)

2. 開發(fā)人員注意編程事項(xiàng),fclose等優(yōu)雅操作锯仪。

3. 物理主機(jī)RAID卡配置超級(jí)電容解決掉電丟數(shù)據(jù)問題

4. 物理主機(jī)給虛擬機(jī)爭(zhēng)取同步數(shù)據(jù)到磁盤的時(shí)間泵督,增加掉電檢測(cè)設(shè)備或腳本。

參考

https://blog.csdn.net/Peach2Orange/article/details/78979809?utm_medium=distribute.wap_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.wap_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase

https://support.huawei.com/enterprise/zh/doc/EDOC1000163568/9fb0a004

https://blog.csdn.net/i12344/article/details/107395251?utm_medium=distribute.pc_relevant.none-task-blog-baidujs-2

https://help.aliyun.com/document_detail/163299.html

https://blog.csdn.net/i12344/article/details/107395251

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末庶喜,一起剝皮案震驚了整個(gè)濱河市小腊,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌久窟,老刑警劉巖秩冈,帶你破解...
    沈念sama閱讀 212,454評(píng)論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異瘸羡,居然都是意外死亡漩仙,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,553評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門犹赖,熙熙樓的掌柜王于貴愁眉苦臉地迎上來队他,“玉大人,你說我怎么就攤上這事峻村◆镎郏” “怎么了?”我有些...
    開封第一講書人閱讀 157,921評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵粘昨,是天一觀的道長垢啼。 經(jīng)常有香客問我窜锯,道長,這世上最難降的妖魔是什么芭析? 我笑而不...
    開封第一講書人閱讀 56,648評(píng)論 1 284
  • 正文 為了忘掉前任锚扎,我火速辦了婚禮,結(jié)果婚禮上馁启,老公的妹妹穿的比我還像新娘驾孔。我一直安慰自己,他們只是感情好惯疙,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,770評(píng)論 6 386
  • 文/花漫 我一把揭開白布翠勉。 她就那樣靜靜地躺著,像睡著了一般霉颠。 火紅的嫁衣襯著肌膚如雪对碌。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,950評(píng)論 1 291
  • 那天蒿偎,我揣著相機(jī)與錄音朽们,去河邊找鬼。 笑死酥郭,一個(gè)胖子當(dāng)著我的面吹牛华坦,可吹牛的內(nèi)容都是我干的愿吹。 我是一名探鬼主播不从,決...
    沈念sama閱讀 39,090評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼犁跪!你這毒婦竟也來了椿息?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,817評(píng)論 0 268
  • 序言:老撾萬榮一對(duì)情侶失蹤坷衍,失蹤者是張志新(化名)和其女友劉穎寝优,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體枫耳,經(jīng)...
    沈念sama閱讀 44,275評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡乏矾,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,592評(píng)論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了迁杨。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片钻心。...
    茶點(diǎn)故事閱讀 38,724評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖铅协,靈堂內(nèi)的尸體忽然破棺而出捷沸,到底是詐尸還是另有隱情,我是刑警寧澤狐史,帶...
    沈念sama閱讀 34,409評(píng)論 4 333
  • 正文 年R本政府宣布痒给,位于F島的核電站说墨,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏苍柏。R本人自食惡果不足惜尼斧,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,052評(píng)論 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望试吁。 院中可真熱鬧突颊,春花似錦、人聲如沸潘悼。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,815評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽治唤。三九已至棒动,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間宾添,已是汗流浹背船惨。 一陣腳步聲響...
    開封第一講書人閱讀 32,043評(píng)論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留缕陕,地道東北人粱锐。 一個(gè)月前我還...
    沈念sama閱讀 46,503評(píng)論 2 361
  • 正文 我出身青樓,卻偏偏與公主長得像扛邑,于是被迫代替她去往敵國和親怜浅。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,627評(píng)論 2 350

推薦閱讀更多精彩內(nèi)容