Linux虛擬機(jī)掉電后文件損壞或出錯(cuò)的原理和解決方案

掉電后文件內(nèi)容出錯(cuò)或文件損壞的原理

程序運(yùn)行過程中吞滞，有讀寫配置文件保存配置信息的操作战授。在程序運(yùn)行過程中突然斷電或者異常終止程序，會(huì)出現(xiàn)配置文件內(nèi)容出錯(cuò)(亂碼)甚至是文件被清空或者文件直接損壞而無法打開的情況。文件損壞時(shí)讼稚，可能報(bào)出segmentation fault的錯(cuò)誤，以致程序沒法正常運(yùn)行绕沈。

斷電瞬間正在往磁盤寫文件锐想。

內(nèi)容丟失：Linux為延遲寫(delayedwrite)，突然斷電時(shí)乍狐，文件緩沖區(qū)中數(shù)據(jù)還未寫入文件赠摇，意味著并沒有持久化到磁盤。

文件損壞：文件系統(tǒng)內(nèi)部結(jié)構(gòu)不一致，導(dǎo)致文件系統(tǒng)破壞藕帜。

解決方案一烫罩、二、三洽故、四

方案一：程序先自行退出贝攒，而不能讓操作系統(tǒng)強(qiáng)制殺掉程序。

在C程序中加入SIGINT響應(yīng)函數(shù)时甚，保證程序正常退出隘弊。

1）Linux中的kill命令，會(huì)導(dǎo)致寫文件失敗荒适。

大部分的程序都需要一個(gè)handler來應(yīng)對(duì)SIGINT信號(hào)梨熙。只有正常退出，才能做到flush刀诬，保證寫文件成功咽扇。

方案二、使用具有容錯(cuò)和修復(fù)的文件系統(tǒng)解決文件損壞修復(fù)

Linux下普遍采用的是ext3文件系統(tǒng)陕壹，ext3是一個(gè)具有日志記錄功能的日志文件系統(tǒng)质欲，可以進(jìn)行簡(jiǎn)單的容錯(cuò)和恢復(fù)，但是在一個(gè)高負(fù)荷讀寫的ext3文件系統(tǒng)下糠馆，如果突然發(fā)生掉電嘶伟，就很有可能發(fā)生文件系統(tǒng)內(nèi)部結(jié)構(gòu)不一致，導(dǎo)致文件系統(tǒng)破壞榨惠。

Linux在啟動(dòng)時(shí)奋早，會(huì)自動(dòng)去分析和檢查系統(tǒng)分區(qū)，如果發(fā)現(xiàn)文件系統(tǒng)有簡(jiǎn)單的錯(cuò)誤赠橙，會(huì)自動(dòng)修復(fù)耽装，如果文件系統(tǒng)破壞比較嚴(yán)重，系統(tǒng)無法完成修復(fù)時(shí)期揪，系統(tǒng)就會(huì)自動(dòng)進(jìn)入單用戶模式下或者出現(xiàn)一個(gè)交互界面掉奄，提示用戶介入手動(dòng)修復(fù)。現(xiàn)象類似下面所示：

checking root filesystem

/dev/sdb5 contains a file system with? errors, check forced /dev/sdb5: Unattached inode 68338812

/dev/sdb5: UNEXPECTED INCONSISTENCY; RUN fsck MANUALLY (i.e., without -a or -p options) FAILED

/contains a file system with errors check? forced an eror occurred during the file? system? check

****dropping you to a shell;the system will reboot

****when you leave the shell

Press enter for maintenance(or type? Control-D to continue):

give root password for maintenance

從這個(gè)錯(cuò)誤可以看出凤薛，系統(tǒng)根分區(qū)文件系統(tǒng)出現(xiàn)了問題姓建，系統(tǒng)在啟動(dòng)時(shí)無法自動(dòng)修復(fù)。根據(jù)上面的錯(cuò)誤提示缤苫，當(dāng)按下“Control-D”組合鍵后系統(tǒng)自動(dòng)重啟速兔，當(dāng)輸入root密碼后進(jìn)入系統(tǒng)修復(fù)模式，執(zhí)行fsck命令進(jìn)行修復(fù)：

[root@localhost /]# umount /dev/sdb5

[root@localhost /]# fsck .ext3 -y? /dev/sdb5

e2fsck 1.39 (29-May-2006)

/ contains a file system with errors, check forced.

Pass 1: Checking inodes, blocks, and sizes

Pass 2: Checking directory structure

Pass 3: Checking directory connectivity

Pass 4: Checking reference counts

Inode 6833812 ref count is 2, should be 1.? Fix<y>? yes

Unattached inode 6833812

Connect to /lost+found<y>? yes

Inode 6833812 ref count is 2, should be 1.? Fix<y>? yes

Pass 5: Checking group summary information

Block bitmap differences:? -(519--529) -9273

Fix<y>? yes

…… ……

/: ***** FILE SYSTEM WAS MODIFIED *****

/: 19/128520 files (15.8% non-contiguous), 46034/514048 blocks

方案三：編程時(shí)以犧牲性能效率達(dá)到及時(shí)同步數(shù)據(jù)

在C程序中加入fflush函數(shù)活玲，保證所有輸出第一時(shí)間寫入文件涣狗，防止數(shù)據(jù)丟失谍婉。

1. 背景：

fwrite函數(shù)只是將所寫內(nèi)容存入用戶緩存,并不立刻寫入文件.

fflush函數(shù)將用戶緩存中的內(nèi)容寫入內(nèi)核緩沖區(qū)

fsync函數(shù)則是將內(nèi)核緩沖寫入文件

fclose則先執(zhí)行fflush,再關(guān)閉文件的讀寫.

fclose庫函數(shù)關(guān)閉指定的文件流stream，使所有尚未寫出的數(shù)據(jù)都寫出镀钓。因?yàn)閟tdio庫會(huì)對(duì)數(shù)據(jù)進(jìn)行緩沖穗熬，所以使用fclose是很重要的。如果程序需要確保數(shù)據(jù)已經(jīng)全部寫出丁溅，就應(yīng)該調(diào)用fclose函數(shù)唤蔗。雖然當(dāng)程序正常結(jié)束時(shí)，會(huì)自動(dòng)對(duì)所有還打開的文件流調(diào)用fclose函數(shù)窟赏。

2. 方法：

每次寫完后fflush(FILE*fp) ; int fsync(int fd); →強(qiáng)制把數(shù)據(jù)寫到磁盤妓柜。

（還有就是可以把緩沖區(qū)設(shè)置成無緩沖. ）

這樣就能最多限度的保證不會(huì)因?yàn)榫彌_的緣故而照此數(shù)據(jù)丟失.不過這要在效率上要付出代價(jià)的.

方案四：建立備份配置文件

若原配置文件損壞，則新建配置文件饰序，并將備份文件內(nèi)容拷貝到新建配置文件领虹。

解決找不到配置文件而產(chǎn)生段錯(cuò)誤规哪，以致程序無法啟動(dòng)或正常運(yùn)行的問題求豫。

硬件服務(wù)器：RAID卡配置超級(jí)電容解決掉電丟數(shù)據(jù)問題

在服務(wù)器進(jìn)行一次大量寫操作時(shí)，一般使用高速緩存來提升系統(tǒng)性能诉稍，因?yàn)閿?shù)據(jù)寫入高速緩存的速度大于數(shù)據(jù)寫入硬盤的速度蝠嘉。當(dāng)服務(wù)器寫壓力減小或高速緩存將寫滿時(shí)，數(shù)據(jù)再由高速緩存寫入硬盤杯巨。

開啟高速緩存提升寫性能的同時(shí)蚤告，增大了數(shù)據(jù)丟失的風(fēng)險(xiǎn)，在整機(jī)意外掉電時(shí)服爷，高速緩存中的數(shù)據(jù)將會(huì)丟失杜恰。

為了提升整機(jī)的高讀寫性能和高速緩存中數(shù)據(jù)的安全，可為RAID卡配置超級(jí)電容仍源。超級(jí)電容保護(hù)模塊的原理是在發(fā)生系統(tǒng)意外掉電時(shí)心褐，利用其超級(jí)電容供電，將高速緩存中的數(shù)據(jù)寫入超級(jí)電容模塊中的NAND Flash中笼踩。

由于數(shù)據(jù)保護(hù)需要超級(jí)電容的配合逗爹，為了記錄超級(jí)電容的放電曲線，以便RAID卡了解超級(jí)電容的狀態(tài)嚎于，例如最大和最小電壓等掘而，同時(shí)為了延長超級(jí)電容的壽命，RAID卡默認(rèn)啟動(dòng)超級(jí)電容自動(dòng)校準(zhǔn)模式于购。超級(jí)電容電量校準(zhǔn)過程中袍睡，RAID卡寫策略自動(dòng)調(diào)整為“WT”模式以保證數(shù)據(jù)完整性，此時(shí)RAID卡性能會(huì)降低肋僧。電量校準(zhǔn)的周期取決于超級(jí)電容充放電速度斑胜。

虛擬機(jī)篇

案例1：阿里云的云存儲(chǔ)網(wǎng)關(guān)方案

網(wǎng)關(guān)緩存模式采用同步IO（Sync IO）落盤持舆，確保掉電不丟失數(shù)據(jù)。

云上網(wǎng)關(guān)依托于阿里云云盤的高可靠性伪窖，確保了緩存盤的數(shù)據(jù)持久可靠逸寓。

本地部署的網(wǎng)關(guān)依賴于您虛擬環(huán)境后端存儲(chǔ)的可靠性，建議您使用RAID存儲(chǔ)或高可靠分布式存儲(chǔ)作為緩存盤覆山。

網(wǎng)關(guān)將緩存盤的新數(shù)據(jù)刷新上傳到OSS Bucket竹伸，依托OSS數(shù)據(jù)設(shè)計(jì)持久性不低于99.9999999999%（12個(gè)9）保證了數(shù)據(jù)的安全可靠，進(jìn)而確保了數(shù)據(jù)從進(jìn)入網(wǎng)關(guān)到上傳云端整條鏈路的高可靠性簇宽。

案例2：linux物理主機(jī)判斷掉電后自動(dòng)關(guān)閉虛擬機(jī)

如何才能讓exsi主機(jī)在斷電的時(shí)候自動(dòng)的進(jìn)行判斷勋篓，然后按照設(shè)定的順序依次關(guān)閉虛擬機(jī)然后自己關(guān)機(jī)以保護(hù)硬盤數(shù)據(jù)。

#!/bin/sh

while

? ? ? ping -c 1 12.12.12.252 > /dev/null

? ? ? [ $? -eq 0 ];

#? date && echo ' AC Power OK ! '? >> /vmfs/volumes/datastore1/ups/ups.log

? ? ? sleep 180

done

? ? ? date &&? echo ' AC Power maybe off,? checking again after 3 minutes ! ' >> /vmfs/volumes/datastore1/ups/ups.log

? ? sleep 180

? ? ping -c 1 12.12.12.252 > /dev/null

if [ $? -eq 0 ]

then

? date &&? echo 'Checkagain,AC Power OK! ' >> /vmfs/volumes/datastore1/ups/ups.log

else

? ? date &&? echo ' AC Power is already off,? shut down NAS Now! ' >> /vmfs/volumes/datastore1/ups/ups.log

? ? /bin/shutdown.sh

? ? halt

代碼中的12.12.12.252 改為你要Ping的網(wǎng)關(guān)地址魏割，datastore1 部分的改為你的硬盤名稱譬嚣。

方案三(自我思考，方案待實(shí)現(xiàn))：KVM虛擬出來一個(gè)檢測(cè)掉電的設(shè)備安裝到虛擬機(jī)上钞它，虛擬機(jī)掉電設(shè)備檢查出來物理主機(jī)掉電拜银，可以觸發(fā)虛擬機(jī)進(jìn)行優(yōu)雅關(guān)機(jī)。依托于物理主機(jī)有掉電保護(hù)機(jī)制遭垛，給虛擬機(jī)一定的時(shí)間來同步數(shù)據(jù)到磁盤尼桶。

方案匯總

1. 選擇具有容錯(cuò)和修復(fù)的文件系統(tǒng)解決文件損壞修復(fù)

2. 開發(fā)人員注意編程事項(xiàng)，fclose等優(yōu)雅操作锯仪。

3. 物理主機(jī)RAID卡配置超級(jí)電容解決掉電丟數(shù)據(jù)問題

4. 物理主機(jī)給虛擬機(jī)爭(zhēng)取同步數(shù)據(jù)到磁盤的時(shí)間泵督，增加掉電檢測(cè)設(shè)備或腳本。

參考

https://blog.csdn.net/Peach2Orange/article/details/78979809?utm_medium=distribute.wap_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase&depth_1-utm_source=distribute.wap_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.nonecase

https://support.huawei.com/enterprise/zh/doc/EDOC1000163568/9fb0a004

https://blog.csdn.net/i12344/article/details/107395251?utm_medium=distribute.pc_relevant.none-task-blog-baidujs-2

https://help.aliyun.com/document_detail/163299.html

https://blog.csdn.net/i12344/article/details/107395251

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末庶喜，一起剝皮案震驚了整個(gè)濱河市小腊，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌久窟，老刑警劉巖秩冈，帶你破解...
沈念sama閱讀 212,454評(píng)論 6贊 493
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異瘸羡，居然都是意外死亡漩仙，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,553評(píng)論 3贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門犹赖，熙熙樓的掌柜王于貴愁眉苦臉地迎上來队他，“玉大人，你說我怎么就攤上這事峻村◆镎郏” “怎么了？”我有些...
開封第一講書人閱讀 157,921評(píng)論 0贊 348
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵粘昨，是天一觀的道長垢啼。經(jīng)常有香客問我窜锯，道長，這世上最難降的妖魔是什么芭析？我笑而不...
開封第一講書人閱讀 56,648評(píng)論 1贊 284
?港島之戀（遺憾婚禮）
正文為了忘掉前任锚扎，我火速辦了婚禮，結(jié)果婚禮上馁启，老公的妹妹穿的比我還像新娘驾孔。我一直安慰自己，他們只是感情好惯疙，可當(dāng)我...
茶點(diǎn)故事閱讀 65,770評(píng)論 6贊 386
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布翠勉。她就那樣靜靜地躺著，像睡著了一般霉颠。火紅的嫁衣襯著肌膚如雪对碌。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 49,950評(píng)論 1贊 291
城市分裂傳說
那天蒿偎，我揣著相機(jī)與錄音朽们，去河邊找鬼。笑死酥郭，一個(gè)胖子當(dāng)著我的面吹牛华坦，可吹牛的內(nèi)容都是我干的愿吹。我是一名探鬼主播不从，決...
沈念sama閱讀 39,090評(píng)論 3贊 410
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場(chǎng)噩夢(mèng)啊……” “哼犁跪！你這毒婦竟也來了椿息？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 37,817評(píng)論 0贊 268
萬榮殺人案實(shí)錄
序言：老撾萬榮一對(duì)情侶失蹤坷衍，失蹤者是張志新（化名）和其女友劉穎寝优，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體枫耳，經(jīng)...
沈念sama閱讀 44,275評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡乏矾，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,592評(píng)論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了迁杨。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片钻心。...
茶點(diǎn)故事閱讀 38,724評(píng)論 1贊 341
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖铅协，靈堂內(nèi)的尸體忽然破棺而出捷沸，到底是詐尸還是另有隱情，我是刑警寧澤狐史，帶...
沈念sama閱讀 34,409評(píng)論 4贊 333
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布痒给，位于F島的核電站说墨，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏苍柏。R本人自食惡果不足惜尼斧，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 40,052評(píng)論 3贊 316
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望试吁。院中可真熱鬧突颊，春花似錦、人聲如沸潘悼。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,815評(píng)論 0贊 21
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽治唤。三九已至棒动，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間宾添，已是汗流浹背船惨。一陣腳步聲響...
開封第一講書人閱讀 32,043評(píng)論 1贊 266
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留缕陕，地道東北人粱锐。一個(gè)月前我還...
沈念sama閱讀 46,503評(píng)論 2贊 361
代替公主和親
正文我出身青樓，卻偏偏與公主長得像扛邑，于是被迫代替她去往敵國和親怜浅。傳聞我的和親對(duì)象是個(gè)殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,627評(píng)論 2贊 350