Redis 持久化:
常用的兩種持久化
提供了多種不同級別的持久化方式:一種是RDB,另一種是AOF.
RDB 持久化可以在指定的時間間隔內(nèi)生成數(shù)據(jù)集的時間點快照(point-in-time snapshot)阔逼。
相關(guān)配置
redis.conf配置文件:
################################ 快照 #################################
#
# Save the DB on disk:保存數(shù)據(jù)庫到磁盤
#
# save <秒> <更新>
#
# 如果指定的秒數(shù)和數(shù)據(jù)庫寫操作次數(shù)都滿足了就將數(shù)據(jù)庫保存喧兄。
#
# 下面是保存操作的實例:
# 900秒(15分鐘)內(nèi)至少1個key值改變(則進(jìn)行數(shù)據(jù)庫保存--持久化)
# 300秒(5分鐘)內(nèi)至少10個key值改變(則進(jìn)行數(shù)據(jù)庫保存--持久化)
# 60秒(1分鐘)內(nèi)至少10000個key值改變(則進(jìn)行數(shù)據(jù)庫保存--持久化)
#
# 注釋:注釋掉“save”這一行配置項就可以讓保存數(shù)據(jù)庫功能失效盯荤。
#
# 你也可以通過增加一個只有一個空字符串的配置項(如下面的實例)來去掉前面的“save”配置兼搏。
#
# save ""
save 900 1
save 300 10
save 60 10000
#在默認(rèn)情況下挠蛉,如果RDB快照持久化操作被激活(至少一個條件被激活)并且持久化操作失敗,Redis則會停止接受更新操作垛吗。
#這樣會讓用戶了解到數(shù)據(jù)沒有被正確的存儲到磁盤上残腌。否則沒人會注意到這個問題,可能會造成災(zāi)難鸠删。
#
#如果后臺存儲(持久化)操作進(jìn)程再次工作抱完,Redis會自動允許更新操作。
#
#然而刃泡,如果你已經(jīng)恰當(dāng)?shù)呐渲昧藢edis服務(wù)器的監(jiān)視和備份巧娱,你也許想關(guān)掉這項功能。
#如此一來即使后臺保存操作出錯,redis也仍然可以繼續(xù)像平常一樣工作烘贴。
stop-writes-on-bgsave-error yes
#是否在導(dǎo)出.rdb數(shù)據(jù)庫文件的時候采用LZF壓縮字符串和對象禁添?
#默認(rèn)情況下總是設(shè)置成‘yes’, 他看起來是一把雙刃劍桨踪。
#如果你想在存儲的子進(jìn)程中節(jié)省一些CPU就設(shè)置成'no'老翘,
#但是這樣如果你的kye/value是可壓縮的,你的到處數(shù)據(jù)接就會很大锻离。
rdbcompression yes
#從版本RDB版本5開始铺峭,一個CRC64的校驗就被放在了文件末尾。
#這會讓格式更加耐攻擊汽纠,但是當(dāng)存儲或者加載rbd文件的時候會有一個10%左右的性能下降卫键,
#所以,為了達(dá)到性能的最大化虱朵,你可以關(guān)掉這個配置項莉炉。
#
#沒有校驗的RDB文件會有一個0校驗位钓账,來告訴加載代碼跳過校驗檢查。
rdbchecksum yes
# 導(dǎo)出數(shù)據(jù)庫的文件名稱
dbfilename dump.rdb
# 工作目錄
#
# 導(dǎo)出的數(shù)據(jù)庫會被寫入這個目錄呢袱,文件名就是上面'dbfilename'配置項指定的文件名官扣。
#
# 只增的文件也會在這個目錄創(chuàng)建(這句話沒看明白)
#
# 注意你一定要在這個配置一個工作目錄,而不是文件名稱羞福。
dir ./
AOF 持久化記錄服務(wù)器執(zhí)行的所有寫操作命令惕蹄,并在服務(wù)器啟動時,通過重新執(zhí)行這些命令來還原數(shù)據(jù)集治专。 AOF 文件中的命令全部以 Redis 協(xié)議的格式來保存卖陵,新命令會被追加到文件的末尾。 Redis 還可以在后臺對 AOF 文件進(jìn)行重寫(rewrite)张峰,使得 AOF 文件的體積不會超出保存數(shù)據(jù)集狀態(tài)所需的實際大小泪蔫。Redis 還可以同時使用 AOF 持久化和 RDB 持久化。 在這種情況下喘批, 當(dāng) Redis 重啟時撩荣, 它會優(yōu)先使用 AOF 文件來還原數(shù)據(jù)集, 因為 AOF 文件保存的數(shù)據(jù)集通常比 RDB 文件所保存的數(shù)據(jù)集更完整饶深。你甚至可以關(guān)閉持久化功能餐曹,讓數(shù)據(jù)只在服務(wù)器運行時存在。
相關(guān)配置
############################## APPEND ONLY MODE ###############################
# 是否開啟AOF敌厘,默認(rèn)關(guān)閉(no)
appendonly yes
# 指定 AOF 文件名
appendfilename appendonly.aof
# Redis支持三種不同的刷寫模式:
# appendfsync always #每次收到寫命令就立即強(qiáng)制寫入磁盤台猴,是最有保證的完全的持久化,但速度也是最慢的俱两,一般不推薦使用饱狂。
appendfsync everysec #每秒鐘強(qiáng)制寫入磁盤一次,在性能和持久化方面做了很好的折中宪彩,是受推薦的方式休讳。
# appendfsync no #完全依賴OS的寫入,一般為30秒左右一次毯焕,性能最好但是持久化最沒有保證衍腥,不被推薦。
#在日志重寫時纳猫,不進(jìn)行命令追加操作婆咸,而只是將其放在緩沖區(qū)里,避免與命令的追加造成DISK IO上的沖突芜辕。
#設(shè)置為yes表示rewrite期間對新寫操作不fsync,暫時存在內(nèi)存中,等rewrite完成后再寫入尚骄,默認(rèn)為no
no-appendfsync-on-rewrite no
#當(dāng)前AOF文件大小是上次日志重寫得到AOF文件大小的二倍時,自動啟動新的日志重寫過程侵续。
auto-aof-rewrite-percentage 100
#當(dāng)前AOF文件啟動新的日志重寫過程的最小值倔丈,避免剛剛啟動Reids時由于文件尺寸較小導(dǎo)致頻繁的重寫憨闰。
auto-aof-rewrite-min-size 64mb
了解 RDB 持久化和 AOF 持久化之間的異同是非常重要的, 以下幾個小節(jié)將詳細(xì)地介紹這這兩種持久化功能需五, 并對它們的相同和不同之處進(jìn)行說明鹉动。
RDB 的優(yōu)點:
RDB 是一個非常緊湊(compact)的文件,它保存了 Redis 在某個時間點上的數(shù)據(jù)集宏邮。 這種文件非常適合用于進(jìn)行備份: 比如說泽示,你可以在最近的 24 小時內(nèi),每小時備份一次 RDB 文件蜜氨,并且在每個月的每一天械筛,也備份一個 RDB 文件。 這樣的話飒炎,即使遇上問題埋哟,也可以隨時將數(shù)據(jù)集還原到不同的版本。RDB 非常適用于災(zāi)難恢復(fù)(disaster recovery):它只有一個文件郎汪,并且內(nèi)容都非常緊湊赤赊,可以(在加密后)將它傳送到別的數(shù)據(jù)中心,或者亞馬遜 S3 中煞赢。RDB 可以最大化 Redis 的性能:父進(jìn)程在保存 RDB 文件時唯一要做的就是 fork 出一個子進(jìn)程砍鸠,然后這個子進(jìn)程就會處理接下來的所有保存工作,父進(jìn)程無須執(zhí)行任何磁盤 I/O 操作耕驰。RDB 在恢復(fù)大數(shù)據(jù)集時的速度比 AOF 的恢復(fù)速度要快。
RDB 的缺點:
如果你需要盡量避免在服務(wù)器故障時丟失數(shù)據(jù)录豺,那么 RDB 不適合你朦肘。 雖然 Redis 允許你設(shè)置不同的保存點(save point)來控制保存 RDB 文件的頻率, 但是双饥, 因為RDB 文件需要保存整個數(shù)據(jù)集的狀態(tài)媒抠, 所以它并不是一個輕松的操作。 因此你可能會至少 5 分鐘才保存一次 RDB 文件咏花。 在這種情況下趴生, 一旦發(fā)生故障停機(jī), 你就可能會丟失好幾分鐘的數(shù)據(jù)昏翰。每次保存 RDB 的時候苍匆,Redis 都要 fork() 出一個子進(jìn)程,并由子進(jìn)程來進(jìn)行實際的持久化工作棚菊。 在數(shù)據(jù)集比較龐大時浸踩, fork() 可能會非常耗時,造成服務(wù)器在某某毫秒內(nèi)停止處理客戶端统求; 如果數(shù)據(jù)集非常巨大检碗,并且 CPU 時間非常緊張的話据块,那么這種停止時間甚至可能會長達(dá)整整一秒。 雖然 AOF 重寫也需要進(jìn)行 fork() 折剃,但無論 AOF 重寫的執(zhí)行間隔有多長另假,數(shù)據(jù)的耐久性都不會有任何損失。
AOF 的優(yōu)點:
使用 AOF 持久化會讓 Redis 變得非常耐久(much more durable):你可以設(shè)置不同的 fsync 策略怕犁,比如無 fsync 边篮,每秒鐘一次 fsync ,或者每次執(zhí)行寫入命令時 fsync 因苹。 AOF 的默認(rèn)策略為每秒鐘 fsync 一次苟耻,在這種配置下,Redis 仍然可以保持良好的性能扶檐,并且就算發(fā)生故障停機(jī)凶杖,也最多只會丟失一秒鐘的數(shù)據(jù)( fsync 會在后臺線程執(zhí)行,所以主線程可以繼續(xù)努力地處理命令請求)款筑。AOF 文件是一個只進(jìn)行追加操作的日志文件(append only log)智蝠, 因此對 AOF 文件的寫入不需要進(jìn)行 seek , 即使日志因為某些原因而包含了未寫入完整的命令(比如寫入時磁盤已滿奈梳,寫入中途停機(jī)杈湾,等等), redis-check-aof 工具也可以輕易地修復(fù)這種問題攘须。
Redis 可以在 AOF 文件體積變得過大時漆撞,自動地在后臺對 AOF 進(jìn)行重寫: 重寫后的新 AOF 文件包含了恢復(fù)當(dāng)前數(shù)據(jù)集所需的最小命令集合。 整個重寫操作是絕對安全的于宙,因為 Redis 在創(chuàng)建新 AOF 文件的過程中浮驳,會繼續(xù)將命令追加到現(xiàn)有的 AOF 文件里面,即使重寫過程中發(fā)生停機(jī)捞魁,現(xiàn)有的 AOF 文件也不會丟失至会。 而一旦新 AOF 文件創(chuàng)建完畢,Redis 就會從舊 AOF 文件切換到新 AOF 文件谱俭,并開始對新 AOF 文件進(jìn)行追加操作奉件。AOF 文件有序地保存了對數(shù)據(jù)庫執(zhí)行的所有寫入操作, 這些寫入操作以 Redis 協(xié)議的格式保存昆著, 因此 AOF 文件的內(nèi)容非常容易被人讀懂县貌, 對文件進(jìn)行分析(parse)也很輕松。 導(dǎo)出(export) AOF 文件也非常簡單: 舉個例子凑懂, 如果你不小心執(zhí)行了 FLUSHALL 命令窃这, 但只要 AOF 文件未被重寫, 那么只要停止服務(wù)器, 移除 AOF 文件末尾的 FLUSHALL 命令杭攻, 并重啟 Redis 祟敛, 就可以將數(shù)據(jù)集恢復(fù)到 FLUSHALL 執(zhí)行之前的狀態(tài)。
AOF 的缺點:
對于相同的數(shù)據(jù)集來說兆解,AOF 文件的體積通常要大于 RDB 文件的體積馆铁。根據(jù)所使用的 fsync 策略,AOF 的速度可能會慢于 RDB 锅睛。 在一般情況下埠巨, 每秒 fsync 的性能依然非常高, 而關(guān)閉 fsync 可以讓 AOF 的速度和 RDB 一樣快现拒, 即使在高負(fù)荷之下也是如此辣垒。 不過在處理巨大的寫入載入時,RDB 可以提供更有保證的最大延遲時間(latency)印蔬。AOF 在過去曾經(jīng)發(fā)生過這樣的 bug : 因為個別命令的原因勋桶,導(dǎo)致 AOF 文件在重新載入時,無法將數(shù)據(jù)集恢復(fù)成保存時的原樣侥猬。 (舉個例子例驹,阻塞命令 BRPOPLPUSH 就曾經(jīng)引起過這樣的 bug 。) 測試套件里為這種情況添加了測試: 它們會自動生成隨機(jī)的退唠、復(fù)雜的數(shù)據(jù)集鹃锈, 并通過重新載入這些數(shù)據(jù)來確保一切正常。 雖然這種 bug 在 AOF 文件中并不常見瞧预, 但是對比來說屎债, RDB 幾乎是不可能出現(xiàn)這種 bug 的。
RDB 和 AOF ,我應(yīng)該用哪一個垢油?
一般來說,如果想達(dá)到足以媲美 PostgreSQL 的數(shù)據(jù)安全性扔茅, 你應(yīng)該同時使用兩種持久化功能。如果你非常關(guān)心你的數(shù)據(jù),但仍然可以承受數(shù)分鐘以內(nèi)的數(shù)據(jù)丟失秸苗, 那么你可以只使用 RDB 持久化。有很多用戶都只使用 AOF 持久化运褪, 但我們并不推薦這種方式: 因為定時生成 RDB 快照(snapshot)非常便于進(jìn)行數(shù)據(jù)庫備份惊楼, 并且 RDB 恢復(fù)數(shù)據(jù)集的速度也要比 AOF 恢復(fù)的速度要快, 除此之外秸讹, 使用 RDB 還可以避免之前提到的 AOF 程序的 bug 檀咙。因為以上提到的種種原因, 未來我們可能會將 AOF 和 RDB 整合成單個持久化模型璃诀。 (這是一個長期計劃弧可。)
RDB 快照:
在默認(rèn)情況下, Redis 將數(shù)據(jù)庫快照保存在名字為 dump.rdb 的二進(jìn)制文件中劣欢。你可以對 Redis 進(jìn)行設(shè)置棕诵, 讓它在“ N 秒內(nèi)數(shù)據(jù)集至少有 M 個改動”這一條件被滿足時裁良, 自動保存一次數(shù)據(jù)集。你也可以通過調(diào)用 SAVE 或者 BGSAVE 校套, 手動讓 Redis 進(jìn)行數(shù)據(jù)集保存操作价脾。比如說, 以下設(shè)置會讓 Redis 在滿足“ 60 秒內(nèi)有至少有 1000 個鍵被改動”這一條件時笛匙, 自動保存一次數(shù)據(jù)集:
save 60 1000
這種持久化方式被稱為快照(snapshot)侨把。
快照的運作方式:
當(dāng) Redis 需要保存 dump.rdb 文件時, 服務(wù)器執(zhí)行以下操作:
Redis 調(diào)用 fork() 妹孙,同時擁有父進(jìn)程和子進(jìn)程秋柄。
子進(jìn)程將數(shù)據(jù)集寫入到一個臨時 RDB 文件中。
當(dāng)子進(jìn)程完成對新 RDB 文件的寫入時蠢正,Redis 用新 RDB 文件替換原來的 RDB 文件骇笔,并刪除舊的 RDB 文件。
這種工作方式使得 Redis 可以從寫時復(fù)制(copy-on-write)機(jī)制中獲益机隙。
只進(jìn)行追加操作的文件(append-only file蜘拉,AOF)
快照功能并不是非常耐久(durable): 如果 Redis 因為某些原因而造成故障停機(jī), 那么服務(wù)器將丟失最近寫入有鹿、且仍未保存到快照中的那些數(shù)據(jù)旭旭。盡管對于某些程序來說, 數(shù)據(jù)的耐久性并不是最重要的考慮因素葱跋, 但是對于那些追求完全耐久能力(full durability)的程序來說持寄, 快照功能就不太適用了。
從 1.1 版本開始娱俺, Redis 增加了一種完全耐久的持久化方式: AOF 持久化稍味。
你可以通過修改配置文件來打開 AOF 功能:
appendonly yes
從現(xiàn)在開始, 每當(dāng) Redis 執(zhí)行一個改變數(shù)據(jù)集的命令時(比如 SET)荠卷, 這個命令就會被追加到 AOF 文件的末尾模庐。
這樣的話, 當(dāng) Redis 重新啟時油宜, 程序就可以通過重新執(zhí)行 AOF 文件中的命令來達(dá)到重建數(shù)據(jù)集的目的掂碱。
AOF 重寫:
因為 AOF 的運作方式是不斷地將命令追加到文件的末尾, 所以隨著寫入命令的不斷增加慎冤, AOF 文件的體積也會變得越來越大疼燥。舉個例子, 如果你對一個計數(shù)器調(diào)用了 100 次 INCR 蚁堤, 那么僅僅是為了保存這個計數(shù)器的當(dāng)前值醉者, AOF 文件就需要使用 100 條記錄(entry)。然而在實際上, 只使用一條 SET 命令已經(jīng)足以保存計數(shù)器的當(dāng)前值了撬即, 其余 99 條記錄實際上都是多余的立磁。為了處理這種情況, Redis 支持一種有趣的特性: 可以在不打斷服務(wù)客戶端的情況下搞莺, 對 AOF 文件進(jìn)行重建(rebuild)息罗。執(zhí)行 BGREWRITEAOF 命令, Redis 將生成一個新的 AOF 文件才沧, 這個文件包含重建當(dāng)前數(shù)據(jù)集所需的最少命令迈喉。
AOF 有多耐久?
你可以配置 Redis 多久才將數(shù)據(jù) fsync 到磁盤一次温圆。
有三個選項:
每次有新命令追加到 AOF 文件時就執(zhí)行一次 fsync :非常慢挨摸,也非常安全。
每秒 fsync 一次:足夠快(和使用 RDB 持久化差不多)岁歉,并且在故障時只會丟失 1 秒鐘的數(shù)據(jù)得运。
從不 fsync :將數(shù)據(jù)交給操作系統(tǒng)來處理。更快锅移,也更不安全的選擇熔掺。
推薦(并且也是默認(rèn))的措施為每秒 fsync 一次, 這種 fsync 策略可以兼顧速度和安全性非剃。
總是 fsync 的策略在實際使用中非常慢置逻, 即使在 Redis 2.0 對相關(guān)的程序進(jìn)行了改進(jìn)之后仍是如此 —— 頻繁調(diào)用 fsync 注定了這種策略不可能快得起來。
如果 AOF 文件出錯了备绽,怎么辦券坞?
服務(wù)器可能在程序正在對 AOF 文件進(jìn)行寫入時停機(jī), 如果停機(jī)造成了 AOF 文件出錯(corrupt)肺素, 那么 Redis 在重啟時會拒絕載入這個 AOF 文件恨锚, 從而確保數(shù)據(jù)的一致性不會被破壞。
當(dāng)發(fā)生這種情況時倍靡, 可以用以下方法來修復(fù)出錯的 AOF 文件:
為現(xiàn)有的 AOF 文件創(chuàng)建一個備份猴伶。
使用 Redis 附帶的 redis-check-aof 程序,對原來的 AOF 文件進(jìn)行修復(fù)塌西。
$ redis-check-aof --fix
(可選)使用 diff -u 對比修復(fù)后的 AOF 文件和原始 AOF 文件的備份他挎,查看兩個文件之間的不同之處。
重啟 Redis 服務(wù)器雨让,等待服務(wù)器載入修復(fù)后的 AOF 文件,并進(jìn)行數(shù)據(jù)恢復(fù)忿等。
AOF 的運作方式
AOF 重寫和 RDB 創(chuàng)建快照一樣栖忠,都巧妙地利用了寫時復(fù)制機(jī)制。
以下是 AOF 重寫的執(zhí)行步驟:
Redis 執(zhí)行 fork() ,現(xiàn)在同時擁有父進(jìn)程和子進(jìn)程庵寞。
子進(jìn)程開始將新 AOF 文件的內(nèi)容寫入到臨時文件狸相。對于所有新執(zhí)行的寫入命令,父進(jìn)程一邊將它們累積到一個內(nèi)存緩存中捐川,一邊將這些改動追加到現(xiàn)有 AOF 文件的末尾: 這樣即使在重寫的中途發(fā)生停機(jī)脓鹃,現(xiàn)有的 AOF 文件也還是安全的。當(dāng)子進(jìn)程完成重寫工作時古沥,它給父進(jìn)程發(fā)送一個信號瘸右,父進(jìn)程在接收到信號之后,將內(nèi)存緩存中的所有數(shù)據(jù)追加到新 AOF 文件的末尾⊙页荩現(xiàn)在 Redis 原子地用新文件替換舊文件太颤,之后所有命令都會直接追加到新 AOF 文件的末尾。
為最新的 dump.rdb 文件創(chuàng)建一個備份盹沈。
將備份放到一個安全的地方龄章。
執(zhí)行以下兩條命令:
redis-cli> CONFIG SET appendonly yes
redis-cli> CONFIG SET save ""
確保命令執(zhí)行之后,數(shù)據(jù)庫的鍵的數(shù)量沒有改變乞封。
確保寫命令會被正確地追加到 AOF 文件的末尾做裙。
步驟 3 執(zhí)行的第一條命令開啟了 AOF 功能: Redis 會阻塞直到初始 AOF 文件創(chuàng)建完成為止, 之后 Redis 會繼續(xù)處理命令請求肃晚, 并開始將寫入命令追加到 AOF 文件末尾锚贱。
步驟 3 執(zhí)行的第二條命令用于關(guān)閉 RDB 功能。 這一步是可選的陷揪, 如果你愿意的話惋鸥, 也可以同時使用 RDB 和 AOF 這兩種持久化功能。
別忘了在 redis.conf 中打開 AOF 功能悍缠! 否則的話卦绣, 服務(wù)器重啟之后, 之前通過 CONFIG SET 設(shè)置的配置就會被遺忘飞蚓, 程序會按原來的配置來啟動服務(wù)器滤港。
RDB 和 AOF 之間的相互作用:
在版本號大于等于 2.4 的 Redis 中, BGSAVE 執(zhí)行的過程中趴拧, 不可以執(zhí)行 BGREWRITEAOF 溅漾。 反過來說, 在 BGREWRITEAOF 執(zhí)行的過程中著榴, 也不可以執(zhí)行 BGSAVE 添履。
這可以防止兩個 Redis 后臺進(jìn)程同時對磁盤進(jìn)行大量的 I/O 操作。
如果 BGSAVE 正在執(zhí)行脑又, 并且用戶顯示地調(diào)用 BGREWRITEAOF 命令暮胧, 那么服務(wù)器將向用戶回復(fù)一個 OK 狀態(tài)锐借, 并告知用戶, BGREWRITEAOF 已經(jīng)被預(yù)定執(zhí)行: 一旦 BGSAVE 執(zhí)行完畢往衷, BGREWRITEAOF 就會正式開始钞翔。當(dāng) Redis 啟動時, 如果 RDB 持久化和 AOF 持久化都被打開了席舍, 那么程序會優(yōu)先使用 AOF 文件來恢復(fù)數(shù)據(jù)集布轿, 因為 AOF 文件所保存的數(shù)據(jù)通常是最完整的。
備份 Redis 數(shù)據(jù):
Redis 對于數(shù)據(jù)備份是非常友好的来颤, 因為你可以在服務(wù)器運行的時候?qū)?RDB 文件進(jìn)行復(fù)制: RDB 文件一旦被創(chuàng)建汰扭, 就不會進(jìn)行任何修改。 當(dāng)服務(wù)器要創(chuàng)建一個新的 RDB 文件時脚曾, 它先將文件的內(nèi)容保存在一個臨時文件里面东且, 當(dāng)臨時文件寫入完畢時, 程序才使用 原子地用臨時文件替換原來的 RDB 文件本讥。這也就是說珊泳, 無論何時, 復(fù)制 RDB 文件都是絕對安全的拷沸。