Redis數(shù)據(jù)"丟失"討論及規(guī)避和解決的幾點總結(jié)

Redis大部分應(yīng)用場景是純緩存服務(wù),請求后端有Primary Storage的組件,如MySQL,HBase;請求Redis的鍵未命中润梯,會從primary Storage中獲取數(shù)據(jù)返回,同時更新Redis緩存轩猩。如果少量數(shù)據(jù)丟失,相當于請求"緩沖未命中"; 一般對業(yè)務(wù)的影響是無感知的庭瑰。但現(xiàn)在Redis用作存儲的業(yè)務(wù)場景變多,數(shù)據(jù)丟失對業(yè)務(wù)是致命的影響抢埋。

下面簡單討論幾個Redis常見數(shù)據(jù)"丟失"現(xiàn)象弹灭,以及怎么規(guī)避;

數(shù)據(jù)丟失的影響

- Redis存儲的應(yīng)用場景揪垄,數(shù)據(jù)丟失是不能接受的;

- 因為Redis的持久化特性穷吮,數(shù)據(jù)還原很難保證一致性,因rdb全備和aof重寫備份饥努,RPO不能像MySQL這樣保證恢復到故障操作的前一個事務(wù)捡鱼。

- 緩存的應(yīng)用場景,如果大量緩存數(shù)據(jù)丟失酷愧,往往導致后端存儲組件”打死“堰汉,應(yīng)用程序雪崩的情況。

常見Redis數(shù)據(jù)丟失的情況

- 程序bug或人為誤操作伟墙。

- 因客戶端緩沖區(qū)內(nèi)存使用過大,導致大量鍵被LRU淘汰滴铅。

- 主庫故障后自動重啟戳葵,可能導致數(shù)據(jù)丟失。

- 網(wǎng)絡(luò)分區(qū)的問題汉匙,可能導致短時間的寫入數(shù)據(jù)丟失拱烁。

- 主從復制數(shù)據(jù)不一致,發(fā)生故障切換后噩翠,出現(xiàn)數(shù)據(jù)丟失戏自。

- 大量過期鍵,同時被淘汰清理伤锚。

程序bug或人為誤操作

- 程序bug誤刪除數(shù)據(jù)擅笔;

- DBA/RD誤操作執(zhí)行flushall/flushdb這類命令。

這類問題的預防和監(jiān)控

- 重命名危險命令:keys(程度大批量誤刪除屯援,很多通過keys獲取鍵后再刪除)猛们,flushall,flushdb

- 細化幾個重要的監(jiān)控項:

- 實例當前的鍵個數(shù)(dbsize/info), 當大量鍵丟失時狞洋,可通過此項歷史監(jiān)控圖弯淘,定位發(fā)生的時間范圍。

- 各類刪除命令的執(zhí)行數(shù)監(jiān)控:cmdtats_flushall, cmdstats_flushdb,cmdstat_del吉懊。

- 對應(yīng)時間范圍庐橙,確認具體是什么操作假勿。

因客戶端緩沖區(qū)內(nèi)存使用過大,導致大量鍵被LRU淘汰

因客戶端緩沖區(qū)的內(nèi)存大小很難限制,它們消耗的內(nèi)存數(shù)會計算在used_memory內(nèi)态鳖;如果使用不當转培,導致緩沖區(qū)內(nèi)存使用過大,達到maxmemory限制郁惜;(緩存場景)會導致大量的鍵被淘汰堡距,最壞會把所有鍵清理,緩沖無鍵可淘汰兆蕉,寫入失敗羽戒。相當于整個緩沖失效,對業(yè)務(wù)影響較大虎韵。

這類問題的預防和監(jiān)控:

- 業(yè)務(wù)容量規(guī)劃時把緩沖正常消耗計算在內(nèi)易稠,合理高大maxmemory的限制;

每個實例最好可預留幾百M(大小根據(jù)客戶端連接數(shù)和key的使用有關(guān)包蓝,根據(jù)大小集群合理調(diào)整)驶社。

- 對輸出緩沖區(qū)設(shè)置合理limit;如normal設(shè)置10MB, SLAVE設(shè)置1GB等测萎。 如果復制因slave線程輸出緩沖區(qū)反復同步亡电,需臨時調(diào)大slave client-output-buffer,要同時調(diào)大maxmemory限制硅瞧。

- 主要監(jiān)控

- 監(jiān)控內(nèi)存使用大小 used_memory份乒。

- 監(jiān)控兩個buffer的使用量client_longest_output_list和client_biggest_input_buf。

- 監(jiān)控鍵的LRU驅(qū)逐數(shù)量:evicted_keys腕唧。

主庫故障后自動重啟或辖,可能導致數(shù)據(jù)全部丟失

這種故障發(fā)生,極有可能數(shù)據(jù)全部丟失枣接。

問題發(fā)生的現(xiàn)象:時間點T1,主庫故障關(guān)閉了颂暇,因設(shè)置有自動重啟的守護程序,時間點T2主庫被重新拉起但惶,因(T2-T1)時間間隔過小耳鸯,未達到Redis集群或哨兵的主從切換判斷時長;這樣從庫發(fā)現(xiàn)主庫runid變了或斷開過膀曾,會全量同步主庫rdb清理片拍,并清理自己的數(shù)據(jù)。而為保障性能,Redis主庫往往不做數(shù)據(jù)持久化設(shè)置妓肢,那么時間點T2啟動的主庫捌省,很有可能是個空實例(或很久前的rdb文件)。這種問題發(fā)生時間間隔碉钠,一般小于1分鐘纲缓,可能監(jiān)控告警無法感知到卷拘。

這類總是的預防和監(jiān)控:

- 強烈反對Redis粗暴地設(shè)置自動重啟。

- 這種監(jiān)控鍵個數(shù)的變化祝高,緩存命中率栗弟,同時ELK類型準實時監(jiān)控redis日志變化并告警。

建議:數(shù)據(jù)庫這類重“狀態(tài)性”服務(wù)工闺,不建議程序暴力自動重啟乍赫!

網(wǎng)絡(luò)分區(qū)的問題,可能導致短時間的寫入數(shù)據(jù)丟失

這種問題出現(xiàn)丟失數(shù)據(jù)都很少陆蟆,網(wǎng)絡(luò)分區(qū)時雷厂,Redis集群或哨兵在判斷故障切換的時間窗口,這段時間寫入到原主庫的數(shù)據(jù)叠殷,5秒~15秒的寫入量改鲫。

主從復制數(shù)據(jù)不一致,發(fā)生故障切換后林束,出現(xiàn)數(shù)據(jù)丟失

主從數(shù)據(jù)出現(xiàn)不一致像棘,發(fā)生故障切換,從庫提升為主后壶冒,導致數(shù)據(jù)丟失的情況缕题。

大量過期鍵,同時被淘汰清理

這類情況不是真正的“數(shù)據(jù)丟失”胖腾,只是定期主動清理Redis堆積的過期鍵避除,會導致Redis的鍵個數(shù)(dbsize)出現(xiàn)陡降(最大能達20%)。業(yè)務(wù)方常誤以為有數(shù)據(jù)丟失胸嘁。

這時可通過監(jiān)控過期鍵淘汰的數(shù)量:expireed_keys的增長量,與dbsize鍵總數(shù)減少數(shù)據(jù)量是否相等凉逛。

======================================================================================

Redis的數(shù)據(jù)回寫機制

Redis的數(shù)據(jù)回寫機制分同步和異步兩種性宏,

- 同步回寫即SAVE命令,主進程直接向磁盤回寫數(shù)據(jù)状飞。在數(shù)據(jù)大的情況下會導致系統(tǒng)假死很長時間毫胜,所以一般不是推薦的。

- 異步回寫即BGSAVE命令诬辈,主進程fork后酵使,復制自身并通過這個新的進程回寫磁盤,回寫結(jié)束后新進程自行關(guān)閉焙糟。由于這樣做不需要主進程阻塞口渔,系統(tǒng)不會假死,一般默認會采用這個方法穿撮。

個人感覺方法2采用fork主進程的方式很拙劣缺脉,但似乎是唯一的方法痪欲。內(nèi)存中的熱數(shù)據(jù)隨時可能修改,要在磁盤上保存某個時間的內(nèi)存鏡像必須要凍結(jié)攻礼。凍結(jié)就會導致假死业踢。fork一個新的進程之后等于復制了當時的一個內(nèi)存鏡像,這樣主進程上就不需要凍結(jié)礁扮,只要子進程上操作就可以了知举。

在小內(nèi)存的進程上做一個fork,不需要太多資源,但當這個進程的內(nèi)存空間以G為單位時太伊,fork就成為一件很恐怖的操作雇锡。何況在16G內(nèi)存的主機上fork 14G內(nèi)存的進程呢?肯定會報內(nèi)存無法分配的倦畅。更可氣的是遮糖,越是改動頻繁的主機上fork也越頻繁,fork操作本身的代價恐怕也不會比假死好多少叠赐。

找到原因之后欲账,直接修改/etc/sysctl.conf內(nèi)核參數(shù)vm.overcommit_memory= 1

然后執(zhí)行sysctl -p

Linux內(nèi)核會根據(jù)參數(shù)vm.overcommit_memory參數(shù)的設(shè)置決定是否放行。

- 如果 vm.overcommit_memory = 1芭概,直接放行

- vm.overcommit_memory = 0:則比較 此次請求分配的虛擬內(nèi)存大小和系統(tǒng)當前空閑的物理內(nèi)存加上swap赛不,決定是否放行。

- vm.overcommit_memory= 2:則會比較進程所有已分配的虛擬內(nèi)存加上此次請求分配的虛擬內(nèi)存和系統(tǒng)當前的空閑物理內(nèi)存加上swap罢洲,決定是否放行踢故。

Redis持久化實踐及災(zāi)難恢復模擬

1)對Redis持久化的探討與理解

目前Redis持久化的方式有兩種: RDB 和 AOF

首先,我們應(yīng)該明確持久化的數(shù)據(jù)有什么用惹苗,答案是用于重啟后的數(shù)據(jù)恢復殿较。Redis是一個內(nèi)存數(shù)據(jù)庫,無論是RDB還是AOF桩蓉,都只是其保證數(shù)據(jù)恢復的措施淋纲。所以Redis在利用RDB和AOF進行恢復的時候私恬,都會讀取RDB或AOF文件兄猩,重新加載到內(nèi)存中。RDB就是Snapshot快照存儲操漠,是默認的持久化方式业汰』锴裕可理解為半持久化模式,即按照一定的策略周期性的將數(shù)據(jù)保存到磁盤样漆。對應(yīng)產(chǎn)生的數(shù)據(jù)文件為dump.rdb为障,通過配置文件中的save參數(shù)來定義快照的周期。下面是默認的快照設(shè)置:

save9001#當有一條Keys數(shù)據(jù)被改變時,900秒刷新到Disk一次

save30010#當有10條Keys數(shù)據(jù)被改變時产场,300秒刷新到Disk一次

save6010000#當有10000條Keys數(shù)據(jù)被改變時鹅髓,60秒刷新到Disk一次

同時,Redis的RDB文件也是Redis主從同步內(nèi)部實現(xiàn)中的一環(huán)京景。第一次Slave向Master同步的實現(xiàn)是:Slave向Master發(fā)出同步請求窿冯,Master先dump出rdb文件,然后將rdb文件全量傳輸給slave确徙,然后Master把緩存的命令轉(zhuǎn)發(fā)給Slave醒串,初次同步完成。第二次以及以后的同步實現(xiàn)是:Master將變量的快照直接實時依次發(fā)送給各個Slave鄙皇。但不管什么原因?qū)е耂lave和Master斷開重連都會重復以上兩個步驟的過程芜赌。Redis的主從復制是建立在內(nèi)存快照的持久化基礎(chǔ)上的,只要有Slave就一定會有內(nèi)存快照發(fā)生伴逸。Redis的RDB文件不會壞掉缠沈,因為其寫操作是在一個新進程中進行的。當生成一個新的RDB文件時错蝴,Redis生成的子進程會先將數(shù)據(jù)寫到一個臨時文件中洲愤,然后通過原子性rename系統(tǒng)調(diào)用將臨時文件重命名為RDB文件。

可以很明顯的看到顷锰,RDB有它的不足柬赐,就是一旦數(shù)據(jù)庫出現(xiàn)問題,那么我們的RDB文件中保存的數(shù)據(jù)并不是全新的官紫。從上次RDB文件生成到Redis停機這段時間的數(shù)據(jù)全部丟掉了肛宋。

AOF(Append-Only File)比RDB方式有更好的持久化性。

由于在使用AOF持久化方式時束世,Redis會將每一個收到的寫命令都通過Write函數(shù)追加到文件中酝陈,類似于MySQL的binlog。當Redis重啟是會通過重新執(zhí)行文件中保存的寫命令來在內(nèi)存中重建整個數(shù)據(jù)庫的內(nèi)容毁涉。對應(yīng)的設(shè)置參數(shù)為:

# vim /opt/redis/etc/redis_6379.conf

appendonly yes#啟用AOF持久化方式

appendfilename appendonly.aof#AOF文件的名稱沉帮,默認為appendonly.aof

# appendfsync always #每次收到寫命令就立即強制寫入磁盤,是最有保證的完全的持久化薪丁,但速度也是最慢的,一般不推薦使用馅精。

appendfsync everysec#每秒鐘強制寫入磁盤一次严嗜,在性能和持久化方面做了很好的折中,是受推薦的方式洲敢。

# appendfsync no #完全依賴OS的寫入漫玄,一般為30秒左右一次,性能最好但是持久化最沒有保證,不被推薦睦优。

AOF的完全持久化方式同時也帶來了另一個問題渗常,持久化文件會變得越來越大。比如我們調(diào)用INCR test命令100次汗盘,文件中就必須保存全部的100條命令皱碘,但其實99條都是多余的。因為要恢復數(shù)據(jù)庫的狀態(tài)其實文件中保存一條SET test 100就夠了隐孽。為了壓縮AOF的持久化文件癌椿,Redis提供了bgrewriteaof命令。收到此命令后Redis將使用與快照類似的方式將內(nèi)存中的數(shù)據(jù)以命令的方式保存到臨時文件中菱阵,最后替換原來的文件踢俄,以此來實現(xiàn)控制AOF文件的增長。由于是模擬快照的過程晴及,因此在重寫AOF文件時并沒有讀取舊的AOF文件都办,而是將整個內(nèi)存中的數(shù)據(jù)庫內(nèi)容用命令的方式重寫了一個新的AOF文件。對應(yīng)的設(shè)置參數(shù)為:

# vim /opt/redis/etc/redis_6379.conf

no-appendfsync-on-rewrite yes#在日志重寫時虑稼,不進行命令追加操作琳钉,而只是將其放在緩沖區(qū)里,避免與命令的追加造成DISK IO上的沖突动雹。

auto-aof-rewrite-percentage100#當前AOF文件大小是上次日志重寫得到AOF文件大小的二倍時槽卫,自動啟動新的日志重寫過程。

auto-aof-rewrite-min-size64mb#當前AOF文件啟動新的日志重寫過程的最小值胰蝠,避免剛剛啟動Reids時由于文件尺寸較小導致頻繁的重寫歼培。

在數(shù)據(jù)恢復方面:到底選擇什么呢?下面是來自官方的建議:

通常茸塞,如果你要想提供很高的數(shù)據(jù)保障性躲庄,那么建議你同時使用兩種持久化方式。

如果你可以接受災(zāi)難帶來的幾分鐘的數(shù)據(jù)丟失钾虐,那么你可以僅使用RDB噪窘。

很多用戶僅使用了AOF,但是我們建議效扫,既然RDB可以時不時的給數(shù)據(jù)做個完整的快照倔监,并且提供更快的重啟,所以最好還是也使用RDB菌仁。

因此浩习,希望可以在未來(長遠計劃)統(tǒng)一AOF和RDB成一種持久化模式。

RDB的啟動時間會更短济丘,原因有兩個:

- RDB文件中每一條數(shù)據(jù)只有一條記錄谱秽,不會像AOF日志那樣可能有一條數(shù)據(jù)的多次操作記錄洽蛀。所以每條數(shù)據(jù)只需要寫一次就行了。

- RDB文件的存儲格式和Redis數(shù)據(jù)在內(nèi)存中的編碼格式是一致的疟赊,不需要再進行數(shù)據(jù)編碼工作郊供,所以在CPU消耗上要遠小于AOF日志的加載。

2)災(zāi)難恢復模擬

既然持久化的數(shù)據(jù)的作用是用于重啟后的數(shù)據(jù)恢復近哟,那么我們就非常有必要進行一次這樣的災(zāi)難恢復模擬了驮审。據(jù)稱如果數(shù)據(jù)要做持久化又想保證穩(wěn)定性,則建議留空一半的物理內(nèi)存椅挣。因為在進行快照的時候头岔,fork出來進行dump操作的子進程會占用與父進程一樣的內(nèi)存,真正的copy-on-write鼠证,對性能的影響和內(nèi)存的耗用都是比較大的峡竣。目前,通常的設(shè)計思路是利用Replication機制來彌補aof量九、snapshot性能上的不足适掰,達到了數(shù)據(jù)可持久化。即Master上Snapshot和AOF都不做荠列,來保證Master的讀寫性能类浪,而Slave上則同時開啟Snapshot和AOF來進行持久化,保證數(shù)據(jù)的安全性肌似。首先费就,修改Master上的如下配置:

# vim /opt/redis/etc/redis_6379.conf

#save 900 1 #禁用Snapshot

#save 300 10

#save 60 10000

appendonlyno#禁用AOF

接著,修改Slave上的如下配置:

# vim /opt/redis/etc/redis_6379.conf

save9001#啟用Snapshot

save30010

save6010000

appendonly yes#啟用AOF

appendfilename appendonly.aof#AOF文件的名稱

# appendfsync always

appendfsync everysec#每秒鐘強制寫入磁盤一次

# appendfsync no

no-appendfsync-on-rewrite yes#在日志重寫時川队,不進行命令追加操作

auto-aof-rewrite-percentage100#自動啟動新的日志重寫過程

auto-aof-rewrite-min-size64mb#啟動新的日志重寫過程的最小值

分別啟動Master與Slave

# /etc/init.d/redis start

啟動完成后在Master中確認未啟動Snapshot參數(shù)

redis 127.0.0.1:6379> CONFIG GET save

1) "save"

2) ""

然后通過以下腳本在Master中生成25萬條數(shù)據(jù):

# cat redis-cli-generate.temp.sh


#!/bin/bash

REDISCLI="redis-cli -a slavepass -n 1 SET"

ID=1

while(($ID<50001))

do

INSTANCE_NAME="i-2-$ID-VM"

UUID=`cat /proc/sys/kernel/random/uuid`

PRIVATE_IP_ADDRESS=10.`echo"$RANDOM% 255 + 1"| bc`.`echo"$RANDOM% 255 + 1"| bc`.`echo"$RANDOM% 255 + 1"| bc`\

CREATED=`date"+%Y-%m-%d %H:%M:%S"`

$REDISCLIvm_instance:$ID:instance_name"$INSTANCE_NAME"

$REDISCLIvm_instance:$ID:uuid"$UUID"

$REDISCLIvm_instance:$ID:private_ip_address"$PRIVATE_IP_ADDRESS"

$REDISCLIvm_instance:$ID:created"$CREATED"

$REDISCLIvm_instance:$INSTANCE_NAME:id"$ID"

ID=$(($ID+1))

done

接著執(zhí)行該腳本

# chmod 755 redis-cli-generate.temp.sh

# ./redis-cli-generate.temp.sh

在數(shù)據(jù)的生成過程中力细,可以很清楚的看到Master上僅在第一次做Slave同步時創(chuàng)建了dump.rdb文件,之后就通過增量傳輸命令的方式給Slave了固额。

dump.rdb文件沒有再增大眠蚂。

#ls-lh

total4.0K

-rw-r--r--1rootroot10Sep27 00:40dump.rdb

而Slave上則可以看到dump.rdb文件和AOF文件在不斷的增大,并且AOF文件的增長速度明顯大于dump.rdb文件斗躏。


#ls-lh

total24M

-rw-r--r--1rootroot15MSep27 12:06appendonly.aof

-rw-r--r--1rootroot9.2MSep27 12:06dump.rdb

等待數(shù)據(jù)插入完成以后逝慧,首先確認當前的數(shù)據(jù)量。


redis127.0.0.1:6379> info

redis_version:2.4.17

redis_git_sha1:00000000

redis_git_dirty:0

arch_bits:64

multiplexing_api:epoll

gcc_version:4.4.5

process_id:27623

run_id:e00757f7b2d6885fa9811540df9dfed39430b642

uptime_in_seconds:1541

uptime_in_days:0

lru_clock:650187

used_cpu_sys:69.28

used_cpu_user:7.67

used_cpu_sys_children:0.00

used_cpu_user_children:0.00

connected_clients:1

connected_slaves:1

client_longest_output_list:0

client_biggest_input_buf:0

blocked_clients:0

used_memory:33055824

used_memory_human:31.52M

used_memory_rss:34717696

used_memory_peak:33055800

used_memory_peak_human:31.52M

mem_fragmentation_ratio:1.05

mem_allocator:jemalloc-3.0.0

loading:0

aof_enabled:0

changes_since_last_save:250000

bgsave_in_progress:0

last_save_time:1348677645

bgrewriteaof_in_progress:0

total_connections_received:250007

total_commands_processed:750019

expired_keys:0

evicted_keys:0

keyspace_hits:0

keyspace_misses:0

pubsub_channels:0

pubsub_patterns:0

latest_fork_usec:246

vm_enabled:0

role:master

slave0:10.6.1.144,6379,online

db1:keys=250000,expires=0

當前的數(shù)據(jù)量為25萬條key啄糙,占用內(nèi)存31.52M笛臣。然后直接Kill掉Master的Redis進程,模擬災(zāi)難隧饼。

# killall -9 redis-server

接著到Slave中查看狀態(tài):


redis127.0.0.1:6379> info

redis_version:2.4.17

redis_git_sha1:00000000

redis_git_dirty:0

arch_bits:64

multiplexing_api:epoll

gcc_version:4.4.5

process_id:13003

run_id:9b8b398fc63a26d160bf58df90cf437acce1d364

uptime_in_seconds:1627

uptime_in_days:0

lru_clock:654181

used_cpu_sys:29.69

used_cpu_user:1.21

used_cpu_sys_children:1.70

used_cpu_user_children:1.23

connected_clients:1

connected_slaves:0

client_longest_output_list:0

client_biggest_input_buf:0

blocked_clients:0

used_memory:33047696

used_memory_human:31.52M

used_memory_rss:34775040

used_memory_peak:33064400

used_memory_peak_human:31.53M

mem_fragmentation_ratio:1.05

mem_allocator:jemalloc-3.0.0

loading:0

aof_enabled:1

changes_since_last_save:3308

bgsave_in_progress:0

last_save_time:1348718951

bgrewriteaof_in_progress:0

total_connections_received:4

total_commands_processed:250308

expired_keys:0

evicted_keys:0

keyspace_hits:0

keyspace_misses:0

pubsub_channels:0

pubsub_patterns:0

latest_fork_usec:694

vm_enabled:0

role:slave

aof_current_size:17908619

aof_base_size:16787337

aof_pending_rewrite:0

aof_buffer_length:0

aof_pending_bio_fsync:0

master_host:10.6.1.143

master_port:6379

master_link_status:down

master_last_io_seconds_ago:-1

master_sync_in_progress:0

master_link_down_since_seconds:25

slave_priority:100

db1:keys=250000,expires=0

可以看到master_link_status的狀態(tài)已經(jīng)是down了沈堡,Master已經(jīng)不可訪問了。而此時桑李,Slave依然運行良好踱蛀,并且保留有AOF與RDB文件。下面將通過Slave上保存好的AOF與RDB文件來恢復Master上的數(shù)據(jù)贵白。首先率拒,將Slave上的同步狀態(tài)取消,避免主庫在未完成數(shù)據(jù)恢復前就重啟禁荒,進而直接覆蓋掉從庫上的數(shù)據(jù)猬膨,導致所有的數(shù)據(jù)丟失。

redis127.0.0.1:6379>SLAVEOFNOONE

OK

確認一下已經(jīng)沒有了master相關(guān)的配置信息:


redis127.0.0.1:6379> INFO

redis_version:2.4.17

redis_git_sha1:00000000

redis_git_dirty:0

arch_bits:64

multiplexing_api:epoll

gcc_version:4.4.5

process_id:13003

run_id:9b8b398fc63a26d160bf58df90cf437acce1d364

uptime_in_seconds:1961

uptime_in_days:0

lru_clock:654215

used_cpu_sys:29.98

used_cpu_user:1.22

used_cpu_sys_children:1.76

used_cpu_user_children:1.42

connected_clients:1

connected_slaves:0

client_longest_output_list:0

client_biggest_input_buf:0

blocked_clients:0

used_memory:33047696

used_memory_human:31.52M

used_memory_rss:34779136

used_memory_peak:33064400

used_memory_peak_human:31.53M

mem_fragmentation_ratio:1.05

mem_allocator:jemalloc-3.0.0

loading:0

aof_enabled:1

changes_since_last_save:0

bgsave_in_progress:0

last_save_time:1348719252

bgrewriteaof_in_progress:0

total_connections_received:4

total_commands_processed:250311

expired_keys:0

evicted_keys:0

keyspace_hits:0

keyspace_misses:0

pubsub_channels:0

pubsub_patterns:0

latest_fork_usec:1119

vm_enabled:0

role:master

aof_current_size:17908619

aof_base_size:16787337

aof_pending_rewrite:0

aof_buffer_length:0

aof_pending_bio_fsync:0

db1:keys=250000,expires=0

在Slave上復制數(shù)據(jù)文件:

# tar cvf /home/kevin/data.tar *

appendonly.aof

dump.rdb

將data.tar上傳到Master上呛伴,嘗試恢復數(shù)據(jù):可以看到Master目錄下有一個初始化Slave的數(shù)據(jù)文件勃痴,很小,將其刪除热康。


#ls-l

total4

-rw-r--r--1rootroot10Sep27 00:40dump.rdb

#rm-fdump.rdb

然后解壓縮數(shù)據(jù)文件:


# tar xf /home/kevin/data.tar

# ls -lh

total29M

-rw-r--r--1root root18M Sep2701:22appendonly.aof

-rw-r--r--1root root12M Sep2701:22dump.rdb

啟動Master上的Redis

# /etc/init.d/redis start

查看數(shù)據(jù)是否恢復:


redis127.0.0.1:6379> INFO

redis_version:2.4.17

redis_git_sha1:00000000

redis_git_dirty:0

arch_bits:64

multiplexing_api:epoll

gcc_version:4.4.5

process_id:16959

run_id:6e5ba6c053583414e75353b283597ea404494926

uptime_in_seconds:22

uptime_in_days:0

lru_clock:650292

used_cpu_sys:0.18

used_cpu_user:0.20

used_cpu_sys_children:0.00

used_cpu_user_children:0.00

connected_clients:1

connected_slaves:0

client_longest_output_list:0

client_biggest_input_buf:0

blocked_clients:0

used_memory:33047216

used_memory_human:31.52M

used_memory_rss:34623488

used_memory_peak:33047192

used_memory_peak_human:31.52M

mem_fragmentation_ratio:1.05

mem_allocator:jemalloc-3.0.0

loading:0

aof_enabled:0

changes_since_last_save:0

bgsave_in_progress:0

last_save_time:1348680180

bgrewriteaof_in_progress:0

total_connections_received:1

total_commands_processed:1

expired_keys:0

evicted_keys:0

keyspace_hits:0

keyspace_misses:0

pubsub_channels:0

pubsub_patterns:0

latest_fork_usec:0

vm_enabled:0

role:master

db1:keys=250000,expires=0

可以看到25萬條數(shù)據(jù)已經(jīng)完整恢復到了Master上沛申。此時,可以放心的恢復Slave的同步設(shè)置了姐军。

redis 127.0.0.1:6379> SLAVEOF 192.168.10.10 6379

OK

查看同步狀態(tài):


redis127.0.0.1:6379> INFO

redis_version:2.4.17

redis_git_sha1:00000000

redis_git_dirty:0

arch_bits:64

multiplexing_api:epoll

gcc_version:4.4.5

process_id:13003

run_id:9b8b398fc63a26d160bf58df90cf437acce1d364

uptime_in_seconds:2652

uptime_in_days:0

lru_clock:654284

used_cpu_sys:30.01

used_cpu_user:2.12

used_cpu_sys_children:1.76

used_cpu_user_children:1.42

connected_clients:2

connected_slaves:0

client_longest_output_list:0

client_biggest_input_buf:0

blocked_clients:0

used_memory:33056288

used_memory_human:31.52M

used_memory_rss:34766848

used_memory_peak:33064400

used_memory_peak_human:31.53M

mem_fragmentation_ratio:1.05

mem_allocator:jemalloc-3.0.0

loading:0

aof_enabled:1

changes_since_last_save:0

bgsave_in_progress:0

last_save_time:1348719252

bgrewriteaof_in_progress:1

total_connections_received:6

total_commands_processed:250313

expired_keys:0

evicted_keys:0

keyspace_hits:0

keyspace_misses:0

pubsub_channels:0

pubsub_patterns:0

latest_fork_usec:12217

vm_enabled:0

role:slave

aof_current_size:17908619

aof_base_size:16787337

aof_pending_rewrite:0

aof_buffer_length:0

aof_pending_bio_fsync:0

master_host:10.6.1.143

master_port:6379

master_link_status:up

master_last_io_seconds_ago:0

master_sync_in_progress:0

slave_priority:100

db1:keys=250000,expires=0

在此次恢復的過程中铁材,同時復制了AOF與RDB文件,那么到底是哪一個文件完成了數(shù)據(jù)的恢復呢奕锌?master_link_status顯示為up著觉,同步狀態(tài)正常。

實際上惊暴,當Redis服務(wù)器掛掉時饼丘,重啟時將按照以下優(yōu)先級恢復數(shù)據(jù)到內(nèi)存:

a)如果只配置AOF,重啟時加載AOF文件恢復數(shù)據(jù);

b)如果同時 配置了RDB和AOF,啟動是只加載AOF文件恢復數(shù)據(jù);

c)如果只配置RDB,啟動是將加載dump文件恢復數(shù)據(jù)辽话。

也就是說肄鸽,AOF的優(yōu)先級要高于RDB,這也很好理解屡穗,因為AOF本身對數(shù)據(jù)的完整性保障要高于RDB贴捡。

在此次的案例中,通過在Slave上啟用了AOF與RDB來保障了數(shù)據(jù)村砂,并恢復了Master烂斋。但在實際的線上環(huán)境中,可能由于數(shù)據(jù)都設(shè)置有過期時間础废,采用AOF的方式會不太實用汛骂,過于頻繁的寫操作會使AOF文件增長到異常的龐大,大大超過了我們實際的數(shù)據(jù)量评腺,這也會導致在進行數(shù)據(jù)恢復時耗用大量的時間帘瞭。因此,可以在Slave上僅開啟Snapshot來進行本地化蒿讥,同時可以考慮將save中的頻率調(diào)高一些或者調(diào)用一個計劃任務(wù)來進行定期bgsave的快照存儲蝶念,來盡可能的保障本地化數(shù)據(jù)的完整性抛腕。在這樣的架構(gòu)下,如果僅僅是Master掛掉媒殉,Slave完整担敌,數(shù)據(jù)恢復可達到100%。如果Master與Slave同時掛掉的話廷蓉,數(shù)據(jù)的恢復也可以達到一個可接受的程度全封。

***************當你發(fā)現(xiàn)自己的才華撐不起野心時,就請安靜下來學習吧***************

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末桃犬,一起剝皮案震驚了整個濱河市刹悴,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌攒暇,老刑警劉巖土匀,帶你破解...
    沈念sama閱讀 212,222評論 6 493
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異形用,居然都是意外死亡恒削,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,455評論 3 385
  • 文/潘曉璐 我一進店門尾序,熙熙樓的掌柜王于貴愁眉苦臉地迎上來钓丰,“玉大人,你說我怎么就攤上這事每币⌒。” “怎么了?”我有些...
    開封第一講書人閱讀 157,720評論 0 348
  • 文/不壞的土叔 我叫張陵兰怠,是天一觀的道長梦鉴。 經(jīng)常有香客問我,道長揭保,這世上最難降的妖魔是什么肥橙? 我笑而不...
    開封第一講書人閱讀 56,568評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮秸侣,結(jié)果婚禮上存筏,老公的妹妹穿的比我還像新娘。我一直安慰自己味榛,他們只是感情好椭坚,可當我...
    茶點故事閱讀 65,696評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著搏色,像睡著了一般善茎。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上频轿,一...
    開封第一講書人閱讀 49,879評論 1 290
  • 那天垂涯,我揣著相機與錄音烁焙,去河邊找鬼。 笑死耕赘,一個胖子當著我的面吹牛考阱,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播鞠苟,決...
    沈念sama閱讀 39,028評論 3 409
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼秽之!你這毒婦竟也來了当娱?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,773評論 0 268
  • 序言:老撾萬榮一對情侶失蹤考榨,失蹤者是張志新(化名)和其女友劉穎跨细,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體河质,經(jīng)...
    沈念sama閱讀 44,220評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡冀惭,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,550評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了掀鹅。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片散休。...
    茶點故事閱讀 38,697評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖乐尊,靈堂內(nèi)的尸體忽然破棺而出戚丸,到底是詐尸還是另有隱情,我是刑警寧澤扔嵌,帶...
    沈念sama閱讀 34,360評論 4 332
  • 正文 年R本政府宣布限府,位于F島的核電站,受9級特大地震影響痢缎,放射性物質(zhì)發(fā)生泄漏胁勺。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 40,002評論 3 315
  • 文/蒙蒙 一独旷、第九天 我趴在偏房一處隱蔽的房頂上張望署穗。 院中可真熱鬧,春花似錦嵌洼、人聲如沸蛇捌。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,782評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽络拌。三九已至,卻和暖如春回溺,著一層夾襖步出監(jiān)牢的瞬間春贸,已是汗流浹背混萝。 一陣腳步聲響...
    開封第一講書人閱讀 32,010評論 1 266
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留萍恕,地道東北人逸嘀。 一個月前我還...
    沈念sama閱讀 46,433評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像允粤,于是被迫代替她去往敵國和親崭倘。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,587評論 2 350

推薦閱讀更多精彩內(nèi)容