1.run_id(服務(wù)器運(yùn)行的唯一ID)
每個(gè)redis實(shí)例在啟動(dòng)時(shí)候,都會(huì)隨機(jī)生成一個(gè)長(zhǎng)度為40的唯一字符串來(lái)標(biāo)識(shí)當(dāng)前運(yùn)行的redis節(jié)點(diǎn)经柴,查看此id可通過(guò)命令info server查看。
當(dāng)主從復(fù)制在初次復(fù)制時(shí)茬底,主節(jié)點(diǎn)將自己的runid發(fā)送給從節(jié)點(diǎn)征绎,從節(jié)點(diǎn)將這個(gè)runid保存起來(lái),當(dāng)斷線重連時(shí),從節(jié)點(diǎn)會(huì)將這個(gè)runid發(fā)送給主節(jié)點(diǎn)昔善。主節(jié)點(diǎn)根據(jù)runid判斷能否進(jìn)行部分復(fù)制:
如果從節(jié)點(diǎn)保存的runid與主節(jié)點(diǎn)現(xiàn)在的runid相同绍些,說(shuō)明主從節(jié)點(diǎn)之前同步過(guò),主節(jié)點(diǎn)會(huì)更具offset偏移量之后的數(shù)據(jù)判斷是否執(zhí)行部分復(fù)制耀鸦,如果offset偏移量之后的數(shù)據(jù)仍然都在復(fù)制積壓緩沖區(qū)里柬批,則執(zhí)行部分復(fù)制,否則執(zhí)行全量復(fù)制袖订;
如果從節(jié)點(diǎn)保存的runid與主節(jié)點(diǎn)現(xiàn)在的runid不同氮帐,說(shuō)明從節(jié)點(diǎn)在斷線前同步的redis節(jié)點(diǎn)并不是當(dāng)前的主節(jié)點(diǎn),只能進(jìn)行全量復(fù)制;
下圖為redis2.8之后的提供的psync命令執(zhí)行過(guò)程:
圖文說(shuō)明:
如果從服務(wù)器以前沒(méi)有復(fù)制過(guò)任何主服務(wù)器洛姑,或者之前執(zhí)行過(guò)SLAVEOF no one命令上沐,那么從服務(wù)器在開(kāi)始一次新的復(fù)制時(shí)將向主服務(wù)器發(fā)送PSYNC ? -1命令,主動(dòng)請(qǐng)求主服務(wù)器進(jìn)行完整重同步(因?yàn)檫@時(shí)不可能執(zhí)行部分重同步)楞艾;
相反地参咙,如果從服務(wù)器已經(jīng)復(fù)制過(guò)某個(gè)主服務(wù)器,那么從服務(wù)器在開(kāi)始一次新的復(fù)制時(shí)將向主服務(wù)器發(fā)送PSYNC <runid> <offset>命令:其中runid是上一次復(fù)制的主服務(wù)器的運(yùn)行ID硫眯,而offset則是從服務(wù)器當(dāng)前的復(fù)制偏移量蕴侧,接收到這個(gè)命令的主服務(wù)器會(huì)通過(guò)這兩個(gè)參數(shù)來(lái)判斷應(yīng)該對(duì)從服務(wù)器執(zhí)行哪種同步操作,如何判斷已經(jīng)在介紹runid時(shí)進(jìn)行詳細(xì)說(shuō)明两入。
根據(jù)情況净宵,接收到PSYNC命令的主服務(wù)器會(huì)向從服務(wù)器返回以下三種回復(fù)的其中一種:
如果主服務(wù)器返回+FULLRESYNC <runid> <offset>回復(fù),那么表示主服務(wù)器將與從服務(wù)器執(zhí)行完整重同步操作:其中runid是這個(gè)主服務(wù)器的運(yùn)行ID裹纳,從服務(wù)器會(huì)將這個(gè)ID保存起來(lái)择葡,在下一次發(fā)送PSYNC命令時(shí)使用;而offset則是主服務(wù)器當(dāng)前的復(fù)制偏移量剃氧,從服務(wù)器會(huì)將這個(gè)值作為自己的初始化偏移量敏储;
如果主服務(wù)器返回+CONTINUE回復(fù),那么表示主服務(wù)器將與從服務(wù)器執(zhí)行部分同步操作朋鞍,從服務(wù)器只要等著主服務(wù)器將自己缺少的那部分?jǐn)?shù)據(jù)發(fā)送過(guò)來(lái)就可以了已添;
如果主服務(wù)器返回-ERR回復(fù)迫横,那么表示主服務(wù)器的版本低于Redis 2.8,它識(shí)別不了PSYNC命令酝碳,從服務(wù)器將向主服務(wù)器發(fā)送SYNC命令矾踱,并與主服務(wù)器執(zhí)行完整同步操作。
?由此可見(jiàn)psync也有不足之處疏哗,當(dāng)從庫(kù)重啟以后runid發(fā)生變化呛讲,也就意味者從庫(kù)還是會(huì)進(jìn)行全量復(fù)制,而在實(shí)際的生產(chǎn)中進(jìn)行從庫(kù)的維護(hù)很多時(shí)候會(huì)進(jìn)行重啟返奉,而正是有由于全量同步需要主庫(kù)執(zhí)行快照贝搁,以及數(shù)據(jù)傳輸會(huì)帶不小的影響。因此在4.0版本芽偏,psync命令做了改進(jìn)雷逆,以下說(shuō)明。
2.psync2
redis4.0新版本除了增加混合持久化污尉,還優(yōu)化了psync(以下稱psync2)并實(shí)現(xiàn)即使redis實(shí)例重啟的情況下也能實(shí)現(xiàn)部分同步膀哲,下面主要介紹psync2實(shí)現(xiàn)過(guò)程。psync2在psync1基礎(chǔ)上新增兩個(gè)復(fù)制id(可使用info replication 查看如下圖):
master_replid: 復(fù)制id1(后文簡(jiǎn)稱:replid1)被碗,一個(gè)長(zhǎng)度為41個(gè)字節(jié)(40個(gè)隨機(jī)串+’0’)的字符串某宪,每個(gè)redis實(shí)例都有,和runid沒(méi)有直接關(guān)聯(lián)锐朴,但和runid生成規(guī)則相同兴喂。當(dāng)實(shí)例變?yōu)閺膶?shí)例后,自己的replid1會(huì)被主實(shí)例的replid1覆蓋焚志。
master_replid2:復(fù)制id2(后文簡(jiǎn)稱:replid2),默認(rèn)初始化為全0衣迷,用于存儲(chǔ)上次主實(shí)例的replid1。
在4.0之前的版本酱酬,redis復(fù)制信息完全丟失壶谒,所以每個(gè)實(shí)例重啟后只能進(jìn)行全量復(fù)制,到了4.0版本岳悟,主要解決了兩種情況下不能進(jìn)行增量復(fù)制的問(wèn)題:
第一種情況:redis重啟
第一步:存儲(chǔ)復(fù)制信息
redis在關(guān)閉時(shí)佃迄,通過(guò)shutdown save,都會(huì)調(diào)用rdbSaveInfoAuxFields函數(shù)泼差,把當(dāng)前實(shí)例的repl-id和repl-offset保存到RDB文件中,當(dāng)前的RDB存儲(chǔ)的數(shù)據(jù)內(nèi)容和復(fù)制信息是一致性的可通過(guò)redis-check-rdb命令查看贵少。如下圖所示:
第二步:重啟后加載RDB文件中的復(fù)制信息
redis加載RDB文件,會(huì)專門(mén)處理文件中輔助字段(AUX fields)信息堆缘,把其中repl_id和repl_offset加載到實(shí)例中滔灶,分別賦給master_replid和master_repl_offset兩個(gè)變量值,特別注意當(dāng)從庫(kù)開(kāi)啟了AOF持久化吼肥,redis加載順序發(fā)生變化優(yōu)先加載AOF文件录平,但是由于aof文件中沒(méi)有復(fù)制信息麻车,所以導(dǎo)致重啟后從實(shí)例依舊使用全量復(fù)制!
第三步:向主庫(kù)上報(bào)復(fù)制信息斗这,判斷是否進(jìn)行部分同步
從實(shí)例向主庫(kù)上報(bào)master_replid和master_repl_offset+1动猬;從實(shí)例同時(shí)滿足以下兩條件,就可以部分重新同步表箭,否則執(zhí)行全量同步:
從實(shí)例上報(bào)master_replid串赁咙,與主實(shí)例的master_replid1或replid2有一個(gè)相等,用于判斷主從未發(fā)生改變免钻;
從實(shí)例上報(bào)的master_repl_offset+1字節(jié)彼水,還存在于主實(shí)例的復(fù)制積壓緩沖區(qū)中,用于判斷從庫(kù)丟失部分是否在復(fù)制緩沖區(qū)中极舔;
第二種情況:故障切換
psync2除了解決redis重啟使用部分同步外凤覆,還為解決在主庫(kù)故障時(shí)候從庫(kù)切換為主庫(kù)時(shí)候使用部分同步機(jī)制。redis從庫(kù)默認(rèn)開(kāi)啟復(fù)制積壓緩沖區(qū)功能拆魏,以便從庫(kù)故障切換變化master后盯桦,其他落后該從庫(kù)可以從緩沖區(qū)中獲取缺少的命令。該過(guò)程的實(shí)現(xiàn)通過(guò)兩組replid渤刃、offset替換原來(lái)的master runid和offset變量實(shí)現(xiàn):
第一組:master_replid和master_repl_offset:如果redis是主實(shí)例俺附,則表示為自己的replid和復(fù)制偏移量; 如果redis是從實(shí)例溪掀,則表示為自己主實(shí)例的replid1和同步主實(shí)例的復(fù)制偏移量事镣。
第二組:master_replid2和second_repl_offset:無(wú)論主從,都表示自己上次主實(shí)例repid1和復(fù)制偏移量揪胃;用于兄弟實(shí)例或級(jí)聯(lián)復(fù)制璃哟,主庫(kù)故障切換psync。
判斷是否使用部分復(fù)制條件:如果從庫(kù)提供的master_replid與master的replid不同喊递,且與master的replid2不同随闪,或同步速度快于master; 就必須進(jìn)行全量復(fù)制骚勘,否則執(zhí)行部分復(fù)制庶橱。
實(shí)驗(yàn)如下:
啟動(dòng)三個(gè)實(shí)例172.20.170.155:6379(主) ,172.20.170.155:6380(從) ,172.20.170.155:6381(從)
在6379上執(zhí)行info replication, 如下:
在6380上執(zhí)行info replication, 如下:
在6381上執(zhí)行info replication, 如下:
由上圖可知, 此時(shí)6381和6380的master_replid都存的是6379的master_replid.
然后執(zhí)行shutdown關(guān)閉6379實(shí)例, 在6380上執(zhí)行slaveof no one, 6381上執(zhí)行slaveof 172.20.170.155 6380;
此時(shí)通過(guò)info replication命令查看6380和6381的信息如下:
由上圖可知6379的master_replid都被存到了master_replid2上, 表示為上一次主實(shí)例的master_replid,
這時(shí)再去查看6381的日志, 如下圖:
可以看出6381切換master到6380成功, 并且增量復(fù)制也是成功的.
這就完成了故障切換下增量復(fù)制功能.