原文地址:https://www.cnblogs.com/itplay/p/11098990.html
哨兵模式#
哨兵模式是redis高可用的實(shí)現(xiàn)方式之一
使用一個(gè)或者多個(gè)哨兵(Sentinel)實(shí)例組成的系統(tǒng)勺美,對(duì)redis節(jié)點(diǎn)進(jìn)行監(jiān)控皆警,在主節(jié)點(diǎn)出現(xiàn)故障的情況下推溃,能將從節(jié)點(diǎn)中的一個(gè)升級(jí)為主節(jié)點(diǎn),進(jìn)行故障轉(zhuǎn)義袱巨,保證系統(tǒng)的可用性。
哨兵們是怎么感知整個(gè)系統(tǒng)中的所有節(jié)點(diǎn)(主節(jié)點(diǎn)/從節(jié)點(diǎn)/哨兵節(jié)點(diǎn))的#
首先主節(jié)點(diǎn)的信息是配置在哨兵(Sentinel)的配置文件中
哨兵節(jié)點(diǎn)會(huì)和配置的主節(jié)點(diǎn)建立起兩條連接命令連接和訂閱連接
哨兵會(huì)通過命令連接每10s發(fā)送一次INFO命令碳抄,通過INFO命令愉老,主節(jié)點(diǎn)會(huì)返回自己的run_id和自己的從節(jié)點(diǎn)信息
哨兵會(huì)對(duì)這些從節(jié)點(diǎn)也建立兩條連接命令連接和訂閱連接
哨兵通過命令連接向從節(jié)點(diǎn)發(fā)送INFO命令,獲取到他的一些信息
a. run_id
b. role
c. 從服務(wù)器的復(fù)制偏移量 offset
d. 等
因?yàn)樯诒鴮?duì)與集群中的其他節(jié)點(diǎn)(主從節(jié)點(diǎn))當(dāng)前都有兩條連接纳鼎,命令連接和訂閱連接
a. 通過命令連接向服務(wù)器的_sentinel:hello頻道發(fā)送一條消息俺夕,內(nèi)容包括自己的ip端口、run_id贱鄙、配置紀(jì)元(后續(xù)投票的時(shí)候會(huì)用到)等
b. 通過訂閱連接對(duì)服務(wù)器的_sentinel:hello頻道做了監(jiān)聽劝贸,所以所有的向該頻道發(fā)送的哨兵的消息都能被接受到
c. 解析監(jiān)聽到的消息,進(jìn)行分析提取逗宁,就可以知道還有那些別的哨兵服務(wù)節(jié)點(diǎn)也在監(jiān)聽這些主從節(jié)點(diǎn)了映九,更新結(jié)構(gòu)體將這些哨兵節(jié)點(diǎn)記錄下來
d. 向觀察到的其他的哨兵節(jié)點(diǎn)建立命令連接----沒有訂閱連接
哨兵模式下的故障遷移#
主觀下線
哨兵(Sentinel)節(jié)點(diǎn)會(huì)每秒一次的頻率向建立了命令連接的實(shí)例發(fā)送PING命令,如果在down-after-milliseconds毫秒內(nèi)沒有做出有效響應(yīng)包括(PONG/LOADING/MASTERDOWN)以外的響應(yīng)瞎颗,哨兵就會(huì)將該實(shí)例在本結(jié)構(gòu)體中的狀態(tài)標(biāo)記為SRI_S_DOWN主觀下線
客觀下線
當(dāng)一個(gè)哨兵節(jié)點(diǎn)發(fā)現(xiàn)主節(jié)點(diǎn)處于主觀下線狀態(tài)是件甥,會(huì)向其他的哨兵節(jié)點(diǎn)發(fā)出詢問,該節(jié)點(diǎn)是不是已經(jīng)主觀下線了哼拔。如果超過配置參數(shù)quorum個(gè)節(jié)點(diǎn)認(rèn)為是主觀下線時(shí)引有,該哨兵節(jié)點(diǎn)就會(huì)將自己維護(hù)的結(jié)構(gòu)體中該主節(jié)點(diǎn)標(biāo)記為SRI_O_DOWN客觀下線
詢問命令SENTINEL is-master-down-by-addr <ip> <port> <current_epoch> <run_id>
參數(shù)意義
ip/port當(dāng)前認(rèn)為下線的主節(jié)點(diǎn)的ip和端口
current_epoch配置紀(jì)元
run_id*標(biāo)識(shí)僅用于詢問是否下線
有值標(biāo)識(shí)該哨兵節(jié)點(diǎn)希望對(duì)方將自己設(shè)置為leader
詢問時(shí)用*,選舉時(shí)用run_id
leader選舉
在認(rèn)為主節(jié)點(diǎn)客觀下線的情況下,哨兵節(jié)點(diǎn)節(jié)點(diǎn)間會(huì)發(fā)起一次選舉倦逐,命令還是上面的命令SENTINEL is-master-down-by-addr <ip> <port> <current_epoch> <run_id>,只是run_id這次會(huì)將自己的run_id帶進(jìn)去譬正,希望接受者將自己設(shè)置為主節(jié)點(diǎn)。如果超過半數(shù)以上的節(jié)點(diǎn)返回將該節(jié)點(diǎn)標(biāo)記為leader的情況下檬姥,會(huì)有該leader對(duì)故障進(jìn)行遷移
故障遷移
在從節(jié)點(diǎn)中挑選出新的主節(jié)點(diǎn)
a. 通訊正常
b. 優(yōu)先級(jí)排序
c. 優(yōu)先級(jí)相同是選擇offset最大的
將該節(jié)點(diǎn)設(shè)置成新的主節(jié)點(diǎn)?SLAVEOF no one,并確保在后續(xù)的INGO命令時(shí)曾我,該節(jié)點(diǎn)返回狀態(tài)為master
將其他的從節(jié)點(diǎn)設(shè)置成從新的主節(jié)點(diǎn)復(fù)制,?SLAVEOF命令
將舊的主節(jié)點(diǎn)變成新的主節(jié)點(diǎn)的從節(jié)點(diǎn)
優(yōu)缺點(diǎn)#
優(yōu)點(diǎn)
高可用,在主節(jié)點(diǎn)故障時(shí)能實(shí)現(xiàn)故障的轉(zhuǎn)移
缺點(diǎn):好像沒辦法做到水平拓展健民,如果內(nèi)容很大的情況下
集群模式#
官方提供的分布式方案(槽指派/重新分片/故障轉(zhuǎn)移)
集群內(nèi)的節(jié)點(diǎn)抒巢,都會(huì)有個(gè)數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)整個(gè)集群內(nèi)的節(jié)點(diǎn)信息
//整體structclusterState{clusterNode *mySelf;? ....? dict *nodes;//集群內(nèi)的所有節(jié)點(diǎn)}// 單個(gè)節(jié)點(diǎn)structclusterNode{charname[];charip[];intport;? clusterLink *link;//保存節(jié)點(diǎn)間,連接的信息intflags;//狀態(tài)標(biāo)記}//節(jié)點(diǎn)間連接的信息structclusterLink{mstime_tctime;//創(chuàng)建時(shí)間intfd;//tcp套接字描述符sds sndbuf;// 輸出緩存區(qū)sds rcvbuf;//輸入緩存區(qū)structclusterNode*node;}
槽指派#
redis集群可以被分為16384個(gè)槽秉犹,只有這些槽全被指派了處理的節(jié)點(diǎn)的情況下蛉谜,集群的狀態(tài)才能是上線狀態(tài)(ok)
操作redis集群的時(shí)候,將key作為參數(shù)崇堵,就可以計(jì)算出對(duì)應(yīng)的處理槽上型诚,所以存儲(chǔ)等操作都應(yīng)該在該槽對(duì)應(yīng)的節(jié)點(diǎn)上。通過這種方式筑辨,可以完美的實(shí)現(xiàn)集群存儲(chǔ)的水平拓展。
defslot_number(key):returnCRC16(key) &16383//得到的結(jié)果就是槽的序號(hào)
槽指派的信息是怎么存儲(chǔ)的
structclusterState{clusterNode *slots[16384] }structclusterNode{unsignedcharslots[16384/8]}
通過上面兩個(gè)結(jié)構(gòu)體中的定義可以看出幸逆,槽指派的信息是分了兩種方式棍辕,保存在結(jié)構(gòu)體里面暮现。
分兩種存儲(chǔ)的好處
1. 如果需要判斷某一個(gè)節(jié)點(diǎn)負(fù)責(zé)的槽,只需要獲取方式二中的數(shù)組做判斷就可以
2.如果找某個(gè)槽是哪個(gè)節(jié)點(diǎn)負(fù)責(zé)楚昭,只需要獲取方式一的列表栖袋,一查就知道
重新分片#
將已經(jīng)指派給節(jié)點(diǎn)的槽,重新執(zhí)行新的節(jié)點(diǎn)抚太。
故障轉(zhuǎn)移#
發(fā)現(xiàn)故障節(jié)點(diǎn)
集群內(nèi)的節(jié)點(diǎn)會(huì)向其他節(jié)點(diǎn)發(fā)送PING命令塘幅,檢查是否在線
如果未能在規(guī)定時(shí)間內(nèi)做出PONG響應(yīng),則會(huì)把對(duì)應(yīng)的節(jié)點(diǎn)標(biāo)記為疑似下線
集群中一半以上負(fù)責(zé)處理槽的主節(jié)點(diǎn)都將主節(jié)點(diǎn)X標(biāo)記為疑似下線的話尿贫,那么這個(gè)主節(jié)點(diǎn)X就會(huì)被認(rèn)為是已下線
向集群廣播主節(jié)點(diǎn)X已下線,大家收到消息后都會(huì)把自己維護(hù)的結(jié)構(gòu)體里的主節(jié)點(diǎn)X標(biāo)記為已下線
從節(jié)點(diǎn)選舉
當(dāng)從節(jié)點(diǎn)發(fā)現(xiàn)自己復(fù)制的主節(jié)點(diǎn)已下線了电媳,會(huì)向集群里面廣播一條消息,要求所有有投票權(quán)的節(jié)點(diǎn)給自己投票(所有負(fù)責(zé)處理槽的主節(jié)點(diǎn)都有投票權(quán))
主節(jié)點(diǎn)會(huì)向第一個(gè)給他發(fā)選舉消息的從節(jié)點(diǎn)回復(fù)支持
當(dāng)支持?jǐn)?shù)量超過N/2+1的情況下庆亡,該從節(jié)點(diǎn)當(dāng)選新的主節(jié)點(diǎn)
故障的遷移
新當(dāng)選的從節(jié)點(diǎn)執(zhí)行?SLAVEOF no one,修改成主節(jié)點(diǎn)
新的主節(jié)點(diǎn)會(huì)撤銷所有已下線的老的主節(jié)點(diǎn)的槽指派匾乓,指派給自己
新的主節(jié)點(diǎn)向集群發(fā)送命令,通知其他節(jié)點(diǎn)自己已經(jīng)變成主節(jié)點(diǎn)了又谋,負(fù)責(zé)哪些槽指派
新的主節(jié)點(diǎn)開始處理自己負(fù)責(zé)的槽的命令
集群模式和哨兵模式的區(qū)別#
哨兵模式監(jiān)控權(quán)交給了哨兵系統(tǒng)拼缝,集群模式中是工作節(jié)點(diǎn)自己做監(jiān)控
哨兵模式發(fā)起選舉是選舉一個(gè)leader哨兵節(jié)點(diǎn)來處理故障轉(zhuǎn)移,集群模式是在從節(jié)點(diǎn)中選舉一個(gè)新的主節(jié)點(diǎn)彰亥,來處理故障的轉(zhuǎn)移
轉(zhuǎn)自:http://www.reibang.com/p/d6d2325a5ec7