課程大綱
1戏售、RDB和AOF兩種持久化機制的介紹
2霸旗、RDB持久化機制的優(yōu)點
3签舞、RDB持久化機制的缺點
4榔昔、AOF持久化機制的優(yōu)點
5、AOF持久化機制的缺點
6瘪菌、RDB和AOF到底該如何選擇
我們已經知道對于一個企業(yè)級的redis架構來說撒会,持久化是不可減少的
企業(yè)級redis集群架構:海量數(shù)據(jù)、高并發(fā)师妙、高可用
持久化主要是做災難恢復诵肛,數(shù)據(jù)恢復,也可以歸類到高可用的一個環(huán)節(jié)里面去
比如你redis整個掛了,然后redis就不可用了怔檩,你要做的事情是讓redis變得可用褪秀,盡快變得可用
重啟redis,盡快讓它對外提供服務薛训,但是就像上一講說媒吗,如果你沒做數(shù)據(jù)備份,這個時候redis啟動了乙埃,也不可用啊闸英,數(shù)據(jù)都沒了
很可能說,大量的請求過來介袜,緩存全部無法命中甫何,在redis里根本找不到數(shù)據(jù),這個時候就死定了遇伞,緩存雪崩問題辙喂,所有請求,沒有在redis命中鸠珠,就會去mysql數(shù)據(jù)庫這種數(shù)據(jù)源頭中去找巍耗,一下子mysql承接高并發(fā),然后就掛了
mysql掛掉渐排,你都沒法去找數(shù)據(jù)恢復到redis里面去芍锦,redis的數(shù)據(jù)從哪兒來?從mysql來飞盆。娄琉。。
具體的完整的緩存雪崩的場景吓歇,還有企業(yè)級的解決方案孽水,到后面講
如果你把redis的持久化做好,備份和恢復方案做到企業(yè)級的程度城看,那么即使你的redis故障了女气,也可以通過備份數(shù)據(jù),快速恢復测柠,一旦恢復立即對外提供服務
redis的持久化炼鞠,跟高可用,是有關系的轰胁,企業(yè)級redis架構中去講解
redis持久化:RDB谒主,AOF
1、RDB和AOF兩種持久化機制的介紹
RDB持久化機制赃阀,對redis中的數(shù)據(jù)執(zhí)行周期性的持久化
AOF機制對每條寫入命令作為日志霎肯,以append-only的模式寫入一個日志文件中,在redis重啟的時候,可以通過回放AOF日志中的寫入指令來重新構建整個數(shù)據(jù)集
如果我們想要redis僅僅作為純內存的緩存來用观游,那么可以禁止RDB和AOF所有的持久化機制
通過RDB或AOF搂捧,都可以將redis內存中的數(shù)據(jù)給持久化到磁盤上面來,然后可以將這些數(shù)據(jù)備份到別的地方去懂缕,比如說阿里云允跑,云服務
如果redis掛了,服務器上的內存和磁盤上的數(shù)據(jù)都丟了搪柑,可以從云服務上拷貝回來之前的數(shù)據(jù)聋丝,放到指定的目錄中,然后重新啟動redis拌屏,redis就會自動根據(jù)持久化數(shù)據(jù)文件中的數(shù)據(jù),去恢復內存中的數(shù)據(jù)术荤,繼續(xù)對外提供服務
如果同時使用RDB和AOF兩種持久化機制倚喂,那么在redis重啟的時候,會使用AOF來重新構建數(shù)據(jù)瓣戚,因為AOF中的數(shù)據(jù)更加完整
2端圈、RDB持久化機制的優(yōu)點
(1)RDB會生成多個數(shù)據(jù)文件,每個數(shù)據(jù)文件都代表了某一個時刻中redis的數(shù)據(jù)子库,這種多個數(shù)據(jù)文件的方式舱权,非常適合做冷備,可以將這種完整的數(shù)據(jù)文件發(fā)送到一些遠程的安全存儲上去仑嗅,比如說Amazon的S3云服務上去宴倍,在國內可以是阿里云的ODPS分布式存儲上,以預定好的備份策略來定期備份redis中的數(shù)據(jù)
RDB也可以做冷備仓技,生成多個文件鸵贬,每個文件都代表了某一個時刻的完整的數(shù)據(jù)快照
AOF也可以做冷備,只有一個文件脖捻,但是你可以阔逼,每隔一定時間,去copy一份這個文件出來
RDB做冷備地沮,優(yōu)勢在哪兒呢嗜浮?由redis去控制固定時長生成快照文件的事情,比較方便; AOF摩疑,還需要自己寫一些腳本去做這個事情危融,各種定時
RDB數(shù)據(jù)做冷備,在最壞的情況下雷袋,提供數(shù)據(jù)恢復的時候专挪,速度比AOF快
(2)RDB對redis對外提供的讀寫服務,影響非常小,可以讓redis保持高性能寨腔,因為redis主進程只需要fork一個子進程速侈,讓子進程執(zhí)行磁盤IO操作來進行RDB持久化即可
RDB,每次寫迫卢,都是直接寫redis內存倚搬,只是在一定的時候,才會將數(shù)據(jù)寫入磁盤中
AOF乾蛤,每次都是要寫文件的每界,雖然可以快速寫入os cache中,但是還是有一定的時間開銷的,速度肯定比RDB略慢一些
(3)相對于AOF持久化機制來說家卖,直接基于RDB數(shù)據(jù)文件來重啟和恢復redis進程眨层,更加快速
AOF,存放的指令日志上荡,做數(shù)據(jù)恢復的時候趴樱,其實是要回放和執(zhí)行所有的指令日志,來恢復出來內存中的所有數(shù)據(jù)的
RDB酪捡,就是一份數(shù)據(jù)文件叁征,恢復的時候,直接加載到內存中即可
結合上述優(yōu)點逛薇,RDB特別適合做冷備份捺疼,冷備
3、RDB持久化機制的缺點
(1)如果想要在redis故障時永罚,盡可能少的丟失數(shù)據(jù)啤呼,那么RDB沒有AOF好。一般來說呢袱,RDB數(shù)據(jù)快照文件媳友,都是每隔5分鐘,或者更長時間生成一次产捞,這個時候就得接受一旦redis進程宕機醇锚,那么會丟失最近5分鐘的數(shù)據(jù)
這個問題,也是rdb最大的缺點坯临,就是不適合做第一優(yōu)先的恢復方案焊唬,如果你依賴RDB做第一優(yōu)先恢復方案,會導致數(shù)據(jù)丟失的比較多
(2)RDB每次在fork子進程來執(zhí)行RDB快照數(shù)據(jù)文件生成的時候看靠,如果數(shù)據(jù)文件特別大赶促,可能會導致對客戶端提供的服務暫停數(shù)毫秒,或者甚至數(shù)秒
一般不要讓RDB的間隔太長挟炬,否則每次生成的RDB文件太大了鸥滨,對redis本身的性能可能會有影響的
4嗦哆、AOF持久化機制的優(yōu)點
(1)AOF可以更好的保護數(shù)據(jù)不丟失,一般AOF會每隔1秒婿滓,通過一個后臺線程執(zhí)行一次fsync操作老速,最多丟失1秒鐘的數(shù)據(jù)
每隔1秒,就執(zhí)行一次fsync操作凸主,保證os cache中的數(shù)據(jù)寫入磁盤中
redis進程掛了橘券,最多丟掉1秒鐘的數(shù)據(jù)
(2)AOF日志文件以append-only模式寫入,所以沒有任何磁盤尋址的開銷卿吐,寫入性能非常高旁舰,而且文件不容易破損,即使文件尾部破損嗡官,也很容易修復
(3)AOF日志文件即使過大的時候箭窜,出現(xiàn)后臺重寫操作,也不會影響客戶端的讀寫。因為在rewrite log的時候,會對其中的指導進行壓縮形病,創(chuàng)建出一份需要恢復數(shù)據(jù)的最小日志出來。再創(chuàng)建新日志文件的時候坊罢,老的日志文件還是照常寫入续担。當新的merge后的日志文件ready的時候擅耽,再交換新老日志文件即可。
(4)AOF日志文件的命令通過非澄镉觯可讀的方式進行記錄乖仇,這個特性非常適合做災難性的誤刪除的緊急恢復。比如某人不小心用flushall命令清空了所有數(shù)據(jù)询兴,只要這個時候后臺rewrite還沒有發(fā)生乃沙,那么就可以立即拷貝AOF文件,將最后一條flushall命令給刪了诗舰,然后再將該AOF文件放回去警儒,就可以通過恢復機制,自動恢復所有數(shù)據(jù)
5眶根、AOF持久化機制的缺點
(1)對于同一份數(shù)據(jù)來說蜀铲,AOF日志文件通常比RDB數(shù)據(jù)快照文件更大
(2)AOF開啟后,支持的寫QPS會比RDB支持的寫QPS低属百,因為AOF一般會配置成每秒fsync一次日志文件记劝,當然,每秒一次fsync族扰,性能也還是很高的
如果你要保證一條數(shù)據(jù)都不丟厌丑,也是可以的定欧,AOF的fsync設置成沒寫入一條數(shù)據(jù),fsync一次怒竿,那就完蛋了砍鸠,redis的QPS大降
(3)以前AOF發(fā)生過bug,就是通過AOF記錄的日志愧口,進行數(shù)據(jù)恢復的時候睦番,沒有恢復一模一樣的數(shù)據(jù)出來。所以說耍属,類似AOF這種較為復雜的基于命令日志/merge/回放的方式托嚣,比基于RDB每次持久化一份完整的數(shù)據(jù)快照文件的方式,更加脆弱一些厚骗,容易有bug示启。不過AOF就是為了避免rewrite過程導致的bug,因此每次rewrite并不是基于舊的指令日志進行merge的领舰,而是基于當時內存中的數(shù)據(jù)進行指令的重新構建夫嗓,這樣健壯性會好很多。
(4)唯一的比較大的缺點冲秽,其實就是做數(shù)據(jù)恢復的時候舍咖,會比較慢,還有做冷備锉桑,定期的備份排霉,不太方便,可能要自己手寫復雜的腳本去做民轴,做冷備不太合適
6攻柠、RDB和AOF到底該如何選擇
(1)不要僅僅使用RDB,因為那樣會導致你丟失很多數(shù)據(jù)
(2)也不要僅僅使用AOF后裸,因為那樣有兩個問題瑰钮,第一,你通過AOF做冷備微驶,沒有RDB做冷備浪谴,來的恢復速度更快; 第二,RDB每次簡單粗暴生成數(shù)據(jù)快照因苹,更加健壯苟耻,可以避免AOF這種復雜的備份和恢復機制的bug
(3)綜合使用AOF和RDB兩種持久化機制,用AOF來保證數(shù)據(jù)不丟失容燕,作為數(shù)據(jù)恢復的第一選擇; 用RDB來做不同程度的冷備梁呈,在AOF文件都丟失或損壞不可用的時候,還可以使用RDB來進行快速的數(shù)據(jù)恢復