作者:10pcm
鏈接:https://blog.51cto.com/superpcm/2095395
1. Keepalived高可用軟件
Keepalived軟件起初是專為LVS負(fù)載均衡軟件設(shè)計(jì)的,用來管理并監(jiān)控LVS集群系統(tǒng)中各個服務(wù)節(jié)點(diǎn)的狀態(tài)辩涝,后來又加入了可以實(shí)現(xiàn)高可用的VRRP功能。因此,keepalived除了能夠管理LVS軟件外,還可以作為其他服務(wù)的高可用解決方案軟件燎竖。
keepalived軟件主要是通過VRRP協(xié)議實(shí)現(xiàn)高可用功能的假瞬。VRRP是Virtual Router Redundancy Protocol(虛擬路由冗余協(xié)議)的縮寫,VRRP出現(xiàn)的目的就是為了解決靜態(tài)路由的單點(diǎn)故障問題的蝶柿,它能保證當(dāng)個別節(jié)點(diǎn)宕機(jī)時(shí),整個網(wǎng)絡(luò)可以不間斷地運(yùn)行非驮。所以交汤,keepalived一方面具有配置管理LVS的功能,同時(shí)還具有對LVS下面節(jié)點(diǎn)進(jìn)行健康檢查的功能劫笙,另一方面也可以實(shí)現(xiàn)系統(tǒng)網(wǎng)絡(luò)服務(wù)的高可用功能芙扎。
2. Keepalived高可用故障切換轉(zhuǎn)移原理
Keepalived高可用服務(wù)對之間的故障切換轉(zhuǎn)移,是通過VRRP來實(shí)現(xiàn)的填大。在keepalived服務(wù)工作時(shí)戒洼,主Master節(jié)點(diǎn)會不斷地向備節(jié)點(diǎn)發(fā)送(多播的方式)心跳消息,用來告訴備Backup節(jié)點(diǎn)自己還活著允华。當(dāng)主節(jié)點(diǎn)發(fā)生故障時(shí)圈浇,就無法發(fā)送心跳的消息了,備節(jié)點(diǎn)也因此無法繼續(xù)檢測到來自主節(jié)點(diǎn)的心跳了靴寂。于是就會調(diào)用自身的接管程序磷蜀,接管主節(jié)點(diǎn)的IP資源和服務(wù)。當(dāng)主節(jié)點(diǎn)恢復(fù)時(shí)榨汤,備節(jié)點(diǎn)又會釋放主節(jié)點(diǎn)故障時(shí)自身接管的IP資源和服務(wù)蠕搜,恢復(fù)到原來的備用角色。
3. Keepalived高可用實(shí)驗(yàn)環(huán)境說明
如下圖所示收壕,前端有兩臺的Nginx負(fù)載均衡器妓灌,用來分發(fā)接收到客戶端的請求轨蛤。在前文已經(jīng)配置好了Nginx01,Nginx02也是一樣的配置〕婀。現(xiàn)在要在兩個Nginx負(fù)載均衡器上做高可用配置祥山,Nginx01作為主節(jié)點(diǎn),Nginx02作為備節(jié)點(diǎn)掉伏。
4.安裝并啟用keepalived
keepalived的安裝非常簡單缝呕,直接使用yum來安裝即可。
yum install keepalived -y
安裝之后斧散,啟動keepalived服務(wù)供常,順便把keepalived寫入開機(jī)啟動的腳本里面去。。
/etc/init.d/keepalived star
echo "/etc/init.d/keepalived start" >>/etc/rc.local
啟動之后會有三個進(jìn)程,沒問題之后可以關(guān)閉keepalived軟件脾猛,接下來要修改keepalived的配置文件。
5.修改keepalived配置文件并且重啟keepalived服務(wù)
/etc/init.d/keepalived stop #關(guān)閉keepalived服務(wù)
vim /etc/keepalived/keepalived.conf #用vim打開編輯
主節(jié)點(diǎn)的配置文件
! Configuration File for keepalived
global_defs {
notification_email {
acassen@firewall.loc
failover@firewall.loc
sysadmin@firewall.loc
}
notification_email_from Alexandre.Cassen@firewall.loc
smtp_server 192.168.200.1
smtp_connect_timeout 30
router_id lb01
}
vrrp_instance VI_1 {
state MASTER
interface eth1
virtual_router_id 55
priority 150
advert_int 1
authentication {
auth_type PASS
auth_pass 123456
}
virtual_ipaddress {
192.168.31.5/24 dev eth1 label eth1:1
}
}
......
備節(jié)點(diǎn)的配置文件
! Configuration File for keepalived
global_defs {
notification_email {
acassen@firewall.loc
failover@firewall.loc
sysadmin@firewall.loc
}
notification_email_from Alexandre.Cassen@firewall.loc
smtp_server 192.168.200.1
smtp_connect_timeout 30
router_id lb02
}
vrrp_instance VI_1 {
state BACKUP
interface eth1
virtual_router_id 55
priority 100
advert_int 1
authentication {
auth_type PASS
auth_pass 123456
}
virtual_ipaddress {
192.168.31.5 dev eth1 label eth1:1
}
}
......
注解:修改配置文件主要就是上面加粗的幾個地方源祈,下面說明一下那幾個參數(shù)的意思:
router_id 是路由標(biāo)識,在一個局域網(wǎng)里面應(yīng)該是唯一的色迂;
vrrp_instance VI_1{…}這是一個VRRP實(shí)例香缺,里面定義了keepalived的主備狀態(tài)、接口歇僧、優(yōu)先級图张、認(rèn)證和IP信息;
state 定義了VRRP的角色馏慨,interface定義使用的接口埂淮,這里我的服務(wù)器用的網(wǎng)卡都是eth1,根據(jù)實(shí)際來填寫姑隅,virtual_router_id是虛擬路由ID標(biāo)識写隶,一組的keepalived配置中主備都是設(shè)置一致,priority是優(yōu)先級讲仰,數(shù)字越大慕趴,優(yōu)先級越大,auth_type是認(rèn)證方式鄙陡,auth_pass是認(rèn)證的密碼
virtual_ipaddress {…}定義虛擬IP地址冕房,可以配置多個IP地址,這里我定義為192.168.31.5趁矾,綁定了eth1的網(wǎng)絡(luò)接口耙册,虛擬接口eth1:1
修改好主節(jié)點(diǎn)之后,保存退出毫捣,然后啟動keepalived详拙,幾分鐘內(nèi)會生成一個虛擬IP:192.168.31.5
然后修改備節(jié)點(diǎn)的配置文件帝际,保存退出后啟動keepalived,不會生成虛擬IP饶辙,如果生成那就是配置文件出現(xiàn)了錯誤蹲诀。備節(jié)點(diǎn)和主節(jié)點(diǎn)爭用IP資源,這個現(xiàn)象叫做“裂腦”弃揽。
6.進(jìn)行高可用的主備服務(wù)器切換實(shí)驗(yàn)
停掉主節(jié)點(diǎn)的keepalived服務(wù)脯爪,查看備節(jié)點(diǎn)會不會生成VIP:192.168.31.5
啟動主節(jié)點(diǎn)的keepalived服務(wù),然后查看主節(jié)點(diǎn)和備節(jié)點(diǎn)的VIP矿微,主節(jié)點(diǎn)應(yīng)該會搶奪回來VIP:
7.搭配Nginx負(fù)載均衡來測試
修改windows的hosts文件痕慢,把域名指向到VIP上
然后用瀏覽器打開www.pcm.com的頁面,在web01上查看access.log日志記錄到的客戶端IP地址
可以看到日志記錄到的客戶端的IP地址是192.168.31.1涌矢,反向代理服務(wù)器是主服務(wù)器192.168.31.3.下面我們停止keepalived服務(wù)守屉,看備節(jié)點(diǎn)會不會接替主節(jié)點(diǎn)的VIP和服務(wù)。
可以看到蒿辙,備節(jié)點(diǎn)確實(shí)接替了主節(jié)點(diǎn)的工作拇泛。重新啟用主節(jié)點(diǎn),實(shí)驗(yàn)的結(jié)果就不驗(yàn)證了思灌。
8.編寫Nginx Web服務(wù)的守護(hù)腳本
上面的實(shí)驗(yàn)測試有一個問題就是俺叭,我們是用Nginx做負(fù)載均衡分發(fā)請求的數(shù)據(jù)包的。如果主節(jié)點(diǎn)的Keepalived服務(wù)正常運(yùn)行泰偿,而Nginx運(yùn)行異常熄守,那么將會出現(xiàn)Nginx負(fù)載均衡服務(wù)失靈,無法切換到Nginx負(fù)載均衡器02上耗跛,后端的Web服務(wù)器無法收到請求裕照。所以,我們應(yīng)該要檢測Nginx的服務(wù)是否正常運(yùn)行调塌,如果不是正常運(yùn)行晋南,應(yīng)該停掉Keepalived的服務(wù),這樣才能自動切換到備節(jié)點(diǎn)上羔砾。
我們可以通過檢測80端口是否開啟來判定Nginx的運(yùn)行情況负间,2秒鐘檢測一次,腳本如下
#!/bin/bash
while true
do
if [ $(netstat -tlnp|grep nginx|wc -l) -ne 1 ]
then
/etc/init.d/keepalived stop
fi
sleep 2
done
實(shí)驗(yàn)的結(jié)果可以后臺執(zhí)行命令之后然后停止Nginx服務(wù)檢驗(yàn)