在Gitlab和Instapaper連續(xù)遭到災難性數(shù)據(jù)損失之后搅吁,作為一個有硬盤的人,如果還不未雨綢繆诫龙,顯然大有“平時袖手談心性析显,臨危一死報君王”的東林風范∏┰撸可惜有事發(fā)生時谷异,東林君子們還可以改換門庭,硬盤里的貨可就跟我永別了锦聊。
數(shù)據(jù)類型
首先分析一下硬盤里的數(shù)據(jù)類型歹嘹,不同類型的數(shù)據(jù),需要的處理方式也不同:
照片
我還沒見過全家根本沒人照相的家庭孔庭,雖然卡片相機已經(jīng)基本被淘汰尺上,然而即便沒個單反,也有微單圆到,最起碼手機里還有大量照片怎抛。基本不會重名芽淡,也沒有版本控制問題马绝,直接全部拷貝到備份目錄即可。
視頻
視頻分兩種:A.電影電視綜藝動畫等從網(wǎng)上下載的挣菲;B.自己拍攝的富稻。
A類就算是珍貴的4k高清也好,我的意見是完全不用備份己单,第一重復觀看可能性低(好吧比如《勇闖奪命島》這種我看上一百遍也不會膩的片子就留著好了)
其次隨著科技的發(fā)展唉窃,我硬盤里《勇闖奪命島》的版本耙饰,經(jīng)歷了vcd->dvd->720p->1080p->藍光5.1聲道等諸版本纹笼。當然只要片子的母帶不是太古老,2k/4k/8k分辨率的高清版遲早會出現(xiàn)苟跪,而網(wǎng)絡帶寬現(xiàn)在也已經(jīng)到了100M廷痘,已經(jīng)足夠應付4K視頻的碼率:
Netflix是15Mbps碼率H265編碼蔓涧。
Youtube是18Mbps碼率VP9編碼。
Comcast試播的服務是18M~22M碼率H265笋额。
預計國內網(wǎng)站會使用5Mbps的H265來播放4k內容
--From知乎
對于A類視頻元暴,網(wǎng)上直接看片好了。
B類沒什么好說的兄猩,和照片一樣備份茉盏。只有一點需要提一下:很多視頻采集設備出于節(jié)省成本,使用了低壓縮比的編碼格式枢冤,導致了視頻體積非常臃腫(給視頻編碼時沒有使用需要專門dsp芯片或者高性能cpu)鸠姨。舉個例子,分別使用松下GM1默認avc/H264/HEVC這三種編碼淹真,生成的質量相近的視頻文件讶迁,大小比是4/2/1。
作為存了一大把視頻的拍娃黨核蘸,備份前用5M碼率的HEVC壓縮一下巍糯,硬盤能減負不少。
應用程序和設置
應用程序本身是沒有備份價值的客扎,如果系統(tǒng)掛了祟峦,重新安裝即可。但是設置就不一樣了虐唠,比如我windows上的必需品終端軟件SecurtCRT搀愧,幾十個host和對應設置都存在系統(tǒng)的文檔目錄,如果重新安裝疆偿,需要全部重設咱筛,一天時間就過去了。
使用ssd做系統(tǒng)盤的各位我建議直接使用操作系統(tǒng)的備份工具做個系統(tǒng)盤鏡像杆故,不到200G的內容毫無壓力迅箩。萬一系統(tǒng)掛了,隨時直接恢復处铛。
文檔
最重要的可能就是文檔饲趋,當然這塊的解決方案也最多。如果不牽涉機密的文檔撤蟆,使用網(wǎng)盤如Dropbox等等就完全解決了奕塑,如果只用windows的化,系統(tǒng)自帶的OneDrive也很好使家肯。
至于機密文檔——誰讓你把機密文檔拷回家的龄砰?還不趕緊刪了!
游戲
正版用戶只用steam和origin,所有游戲存檔和虛擬資產(chǎn)都存在服務器上换棚,除非游戲公司的服務出問題式镐,存儲不用操心。就算服務出問題固蚤,還會有補償呢娘汞!
代碼
上面說的那些數(shù)據(jù),基本家家都有夕玩,代碼不是你弦。但專業(yè)程序員的代碼恰恰是最不需要擔心備份的——在普遍使用git管理代碼的今天,就算哪天硬盤掛了燎孟,還可以輕松從服務器上或者同事的電腦里恢復回來鳖目,分布式版本控制工具不是說著玩的——前提是代碼要及時提交......
一句話總結:分布式版本控制——文件系統(tǒng)的未來。
反向驗證
Gitlab出事的重要原因是備份毫無用處缤弦,無法恢復之前的文件领迈。原因很多,比如備份選項:無條件使用源覆蓋目標碍沐,即便源已經(jīng)被清空了狸捅,備份行為也會將備份清空。
Instapaper出事累提,是因為RDS在出事前很穩(wěn)定尘喝,從來沒演練過恢復數(shù)據(jù)這一操作。一出事斋陪,只好拉上亞馬遜的工程師來解決問題朽褪,花了一個禮拜。
所以對于企業(yè)來說无虚,反向的備份恢復驗證也是必不可少的缔赠。辦法也很多,比如一拍腦門友题,最糙快猛的方法就是找臺沒用的機器嗤堰,定時從備份里取最新版,放在本地做恢復操作度宦。寫個腳本驗證一下是否恢復正常:比如看看數(shù)據(jù)庫的某個表是否存在踢匣、某個照片目錄文件數(shù)是否大于1000等等,如果不正常戈抄,立即發(fā)郵件或者發(fā)短信報警离唬。
耗散模型
數(shù)據(jù)作為低熵實體,符合自然規(guī)律的過程是耗散划鸽。比如我丟失的第一筆數(shù)據(jù)输莺,是存在5寸1.2M軟盤上花了一個禮拜制作的多媒體課件。軟盤會隨時因為溫度、適度模闲、壓力、灰塵而宣告不治這一特性誰用過誰知道崭捍,所以當出現(xiàn)了更靠譜的光盤后尸折,我不惜工本把所有數(shù)據(jù)都刻在了幾十張光盤上。然而幾年后發(fā)現(xiàn)殷蛇,還是裝在金屬殼子里的硬盤最為靠譜......
“刻在石頭上实夹。”
——《三體》