??高可用和高并發(fā)是互聯(lián)網(wǎng)應(yīng)用的基本要求监右,redis在早起版本提供了主從復(fù)制的方案給我們實(shí)現(xiàn)讀寫(xiě)分離,但該方案若出現(xiàn)節(jié)點(diǎn)宕機(jī)潦牛,需要人工介入進(jìn)行恢復(fù)眶掌,可用性并不高。哨兵模式在主從復(fù)制的基礎(chǔ)上實(shí)現(xiàn)了自動(dòng)故障轉(zhuǎn)移巴碗,是一種更為自動(dòng)的高可用方案朴爬。
??伴隨業(yè)務(wù)發(fā)展,用戶數(shù)量增多橡淆,對(duì)并發(fā)要求越來(lái)越高召噩,我們還希望服務(wù)能提供更高的QPS,更大的數(shù)據(jù)存儲(chǔ)逸爵,集群模式應(yīng)勢(shì)而生具滴。redis采用虛擬槽方案實(shí)現(xiàn)分片集群,以突破單機(jī)瓶頸獲得更高的性能师倔。
??redis提供主從復(fù)制方案支持讀寫(xiě)分離构韵,以提高系統(tǒng)的讀并發(fā),當(dāng)該方案不能保證集群的可用性溯革,因此在實(shí)際生產(chǎn)環(huán)境并不推薦使用贞绳。但主從復(fù)制作為哨兵模式的基礎(chǔ),我們還是有必要了解其使用方式及工作原理致稀。
1 主從架構(gòu)集群搭建
??開(kāi)啟主從復(fù)制模式的方式并不復(fù)雜冈闭,我們只需要修改配置文件并啟動(dòng)相對(duì)應(yīng)的多個(gè)從節(jié)點(diǎn)實(shí)例,即可搭建一個(gè)主從復(fù)制架構(gòu)的redis集群抖单。本節(jié)我們以一主一從的方式萎攒,搭建一個(gè)主從架構(gòu)集群。
??為了便于管理矛绘,我們建議將集群配置文件放到同一的文件夾下進(jìn)行管理耍休。本文將在同臺(tái)機(jī)器上啟動(dòng)6379(主節(jié)點(diǎn))和6380(從節(jié)點(diǎn))兩個(gè)實(shí)例,配置文件存放位置規(guī)劃如下:
.
└── conf
└── replication
├── 6379.conf
└── 6380.conf
1.1 啟動(dòng)主節(jié)點(diǎn)
??主節(jié)點(diǎn)的啟動(dòng)和redis單機(jī)啟動(dòng)一致货矮,只需要修改官方提供redis.conf配置文件羊精,然后使用啟動(dòng)命令啟動(dòng)即可。reids主節(jié)點(diǎn)主要配置項(xiàng)如下:
#端口
port 6379
#后臺(tái)運(yùn)行
daemonize yes
#工作空間路徑囚玫,RDB和AOF文件均會(huì)存放在該目錄下
dir /data/redis/6379
#開(kāi)啟AOF持久化
appendonly yes
#配置fsync策略為每秒fsync一次
appendfsync everysec
#pid文件位置
pidfile /var/run/redis_6379.pid
#日志文件位置
logfile /var/logs/redis/redis_6379.log
??使用啟動(dòng)命令啟動(dòng)主節(jié)點(diǎn)
redis-server conf/replication/6379.conf
1.2 啟動(dòng)從節(jié)點(diǎn)
redis主從復(fù)制架構(gòu)從節(jié)點(diǎn)的啟動(dòng)也比較簡(jiǎn)單喧锦,只需要對(duì)原redis配置文件進(jìn)行簡(jiǎn)單的修改即可。主要修改的配置項(xiàng)如下:
#端口
port 6380
#后臺(tái)運(yùn)行
daemonize yes
#工作空間路徑抓督,RDB和AOF文件均會(huì)存放在該目錄下
dir /data/redis/6380
#pid文件位置
pidfile /var/run/redis_6380.pid
#日志文件位置
logfile /var/logs/redis/redis_6380.log
#指定主節(jié)點(diǎn)信息燃少,從節(jié)點(diǎn)實(shí)例將從主節(jié)點(diǎn)復(fù)制數(shù)據(jù)
replicaof 192.168.0.60 6379
#設(shè)置本從節(jié)點(diǎn)只能進(jìn)行讀操作(建議此項(xiàng)設(shè)置為yes,設(shè)置允許寫(xiě)操作铃在,僅限在數(shù)據(jù)生命周期很短的情況下使用阵具,因?yàn)楫?dāng)從節(jié)點(diǎn)從主節(jié)點(diǎn)同步數(shù)據(jù)時(shí)碍遍,通過(guò)命令在從節(jié)點(diǎn)設(shè)置的數(shù)據(jù)將丟失,很容易出現(xiàn)數(shù)據(jù)不一致問(wèn)題)
replica-read-only yes
??注意如果主節(jié)點(diǎn)啟用了密碼認(rèn)證阳液,需要在配置文件中指定master的密碼:
masterauth 主節(jié)點(diǎn)密碼
??然后使用啟動(dòng)命令指定配置文件怕敬,即可啟動(dòng)從節(jié)點(diǎn)
redis-server conf/replication/6380.conf
1.3 驗(yàn)證集群
??至此,我們已經(jīng)搭建好了一個(gè)主從架構(gòu)的redis集群帘皿。我們使用redis-cli命令進(jìn)入主節(jié)點(diǎn)赖捌,然后執(zhí)行set操作,再到從節(jié)點(diǎn)查看是否有相同的數(shù)據(jù)以驗(yàn)證集群效果矮烹。
??進(jìn)入主節(jié)點(diǎn)設(shè)置數(shù)據(jù):
root:# redis-cli -h localhost -p 6379
127.0.0.1:6379> set everlin 1
OK
127.0.0.1:6379> get everlin
"1"
??進(jìn)入從節(jié)點(diǎn)可以看到everlin這個(gè)key的值已經(jīng)同步過(guò)來(lái)了:
root:# redis-cli -h localhost -p 6380
127.0.0.1:6379> get everlin
"1"
2 主從復(fù)制工作原理
2.1 sync全量復(fù)制(舊版本)
??redis2.8版本之前,主從復(fù)制是通過(guò)sync命令進(jìn)行全量復(fù)制的罩锐。當(dāng)從節(jié)點(diǎn)啟動(dòng)時(shí)奉狈,其會(huì)建立一個(gè)連接到主節(jié)點(diǎn),并發(fā)送sync命令從主節(jié)點(diǎn)同步數(shù)據(jù)涩惑。主節(jié)點(diǎn)在收到sync命令后仁期,會(huì)使用bgsave命令在后臺(tái)異步生成當(dāng)前內(nèi)存中的RDB快照。在此期間竭恬,主節(jié)點(diǎn)依舊可對(duì)外提供正常服務(wù)跛蛋,期間的寫(xiě)操作會(huì)記錄到緩存中。當(dāng)RDB快照生成完成之后痊硕,主節(jié)點(diǎn)會(huì)將RDB文件通過(guò)網(wǎng)絡(luò)傳輸給從節(jié)點(diǎn)赊级。從節(jié)點(diǎn)會(huì)將數(shù)據(jù)暫時(shí)存放到一個(gè)臨時(shí)文件中,當(dāng)RDB快照接收完成后岔绸,再將其覆蓋到從節(jié)點(diǎn)的RDB路徑理逊,并通過(guò)rdbLoad方法將數(shù)據(jù)載入內(nèi)存中,完成之后會(huì)將節(jié)點(diǎn)的repl_state設(shè)置為REDIS_REPL_CONNECTED并進(jìn)入命令傳播模式盒揉,主節(jié)點(diǎn)會(huì)將bgsave之后在主節(jié)點(diǎn)上執(zhí)行的命令傳輸給從節(jié)點(diǎn)晋被,以保證從節(jié)點(diǎn)數(shù)據(jù)與主節(jié)點(diǎn)數(shù)據(jù)的一致性。
時(shí)間點(diǎn) | 主節(jié)點(diǎn)狀態(tài) | 從節(jié)點(diǎn)狀態(tài) |
---|---|---|
t0 | 發(fā)起sync命令 | |
t1 | 使用bgsave命令異步生成RDB快照 | 等待同步 |
t2 | 等待同步 | |
t3 | 收到客戶端寫(xiě)命令1 | 等待同步 |
t4 | 收到客戶端寫(xiě)命令2 | 等待同步 |
t5 | RDB快照生成完成 | 等待同步 |
t6 | 向從節(jié)點(diǎn)發(fā)送RDB快照大小 | 準(zhǔn)備接收RDB文件 |
t7 | 向從節(jié)點(diǎn)發(fā)送RDB快照 | 接收RDB并寫(xiě)入臨時(shí)文件 |
t8 | RDB文件發(fā)送完成 | 將臨時(shí)文件覆蓋到RDB路徑刚盈,并加載RDB |
t9 | 加載RDB成功羡洛,將repl_state設(shè)置為REDIS_REPL_CONNECTED,進(jìn)入命令傳播模式 | |
t10 | 發(fā)送緩存區(qū)中的寫(xiě)命令 | 執(zhí)行寫(xiě)命令 |
注意:
【1】若需要slave節(jié)點(diǎn)在同步期間停止對(duì)外服務(wù)(保證數(shù)據(jù)一致性)藕漱,可關(guān)閉slave配置文件中的replica-serve-stale-data即可欲侮。
# 默認(rèn)為yes
replica-serve-stale-data no
2.2 psync增量同步(新版本)
??在redis2.8版本之前,每次slave與master連接后谴分,包括slave斷線重連之后锈麸,都是使用sync進(jìn)行全量同步。網(wǎng)絡(luò)是個(gè)很復(fù)雜的環(huán)境牺蹄,因網(wǎng)絡(luò)波動(dòng)造成連接斷開(kāi)是很常見(jiàn)的事情忘伞。而redis在每次斷線之后,都仍采用全量同步的方式進(jìn)行數(shù)據(jù)同步,效率十分低下氓奈。在2.8版本之后翘魄,redis開(kāi)始支持slave斷線重連后采用增量同步的方式進(jìn)行數(shù)據(jù)復(fù)制,大大降低了網(wǎng)絡(luò)開(kāi)銷(xiāo)舀奶,也提高了redis的性能暑竟。
??slave初次與master連接時(shí),psync與sync一樣會(huì)通過(guò)bgsave在master生成RDB快照并進(jìn)行全量同步育勺,區(qū)別在于全量同步完成之后但荤,slave會(huì)保存一個(gè)offset值記錄當(dāng)前數(shù)據(jù)的偏移量,并在發(fā)生斷線之后涧至,將該偏移量給到master腹躁,master將根據(jù)情況開(kāi)啟增量同步。而master會(huì)將客戶端操作的命令記錄在repl_backlog(緩沖區(qū))中南蓬,并記錄該backlog的數(shù)據(jù)偏移值repl_backlog_off纺非,當(dāng)slave發(fā)起psync時(shí),master會(huì)判斷slave傳來(lái)的offset是否在backlog中赘方,若存在則開(kāi)啟增量同步烧颖,若不存在則使用全量同步。
??整體流程大致如下:
時(shí)間點(diǎn) | 主節(jié)點(diǎn)狀態(tài) | 從節(jié)點(diǎn)狀態(tài) |
---|---|---|
tn+0 | repl_backlog_off=500,repl_backlog_histlen=500(注:repl_backlog_off到repl_backlog_off+repl_backlog_histlen為master緩沖區(qū)中命令的偏移范圍) | 全量同步完成,offset=1000 |
tn+1 | 客戶端操作窄陡,repl_backlog_histlen=501 | 命令傳播:同步master操作炕淮,repl_backlog_off=1001 |
tn+2 | 連接斷開(kāi),嘗試重連 | |
tn+3 | 客戶端操作泳梆,repl_backlog_histlen=502 | 連接斷開(kāi)鳖悠,嘗試重連 |
tn+4 | 連接斷開(kāi),嘗試重連 | |
tn+5 | 重連成功优妙,發(fā)送命令:psync(offset=1001) | |
tn+6 | offset=1001在緩沖區(qū)中乘综,開(kāi)啟增量同步 | |
tn+7 | 將offset之后的命令,以RESP協(xié)議格式同步給slave | 接收命令并執(zhí)行 |
tn+8 | 完成同步套硼,進(jìn)入命令傳播模式 |