LVS 之 高可用性

1? 概述

在lvs的集群設(shè)計中龟梦,存在兩個地方不可用的問題全陨,Director不可用 和RS不可用

A)Director不可用

Director不可用整個系統(tǒng)將不可用看疙;SPoF? Single Point of Failure,單點故障導(dǎo)致

解決方案:

通過keepalived? heartbeat/corosync實現(xiàn)高可用

B)某RS不可用時

當(dāng)后端服務(wù)器存在某一臺RS不可用,Director依然會調(diào)度請求至此RS源葫,導(dǎo)致請求不能被處理痢掠,服務(wù)失敗

解決方案:由Director對各RS健康狀態(tài)進行檢查驱犹,失敗時禁用,成功時啟用

工具有keepalived?? heartbeat/corosync, ldirectord

同時足画,也可以通過腳本對后端RS監(jiān)控狀態(tài)進行監(jiān)控

檢測方式:

(a)網(wǎng)絡(luò)層檢測着绷,icmp

(b)傳輸層檢測,端口探測

(c)應(yīng)用層檢測锌云,請求某關(guān)鍵資源

RS全不可用時,可以通過back server或者sorryserver來提示用戶

本文將介紹ldirectord軟件和通過腳本的方式來實現(xiàn)對后端服務(wù)器的監(jiān)控

2? ldirectord

ldirectord:監(jiān)控和控制LVS守護進程吁脱,可管理LVS規(guī)則桑涎,該軟件解決了ipvs不能監(jiān)控后端服務(wù)器的狀態(tài)的問題。

原理是根據(jù)配置文件設(shè)定好的規(guī)則兼贡,去檢查服務(wù)器端的應(yīng)用是否正常攻冷。通過配置文件配置服務(wù)后,只要啟動該軟件就會按設(shè)定的規(guī)則進行配置和監(jiān)測

service?ldirectord??start

那么該軟件就會根據(jù)配置文件的規(guī)則創(chuàng)建lvs集群類型遍希,添加RS服務(wù)器等曼,并進行監(jiān)控,如果后端服務(wù)失敗凿蒜,就移除對應(yīng)的RS禁谦,如果RS服務(wù)恢復(fù)正常,會自動將RS加入調(diào)度計劃里废封。

如后端監(jiān)控http服務(wù)時州泊,該軟件會通過抓取后端服務(wù)器指定頁面的關(guān)鍵字來決定后端http服務(wù)是否正常運行。

.包名:ldirectord-3.9.6-0rc1.1.1.x86_64.rpm漂洋,該服務(wù)包在base源中沒有遥皂,要另外下載力喷,存在依賴性,下載后用yum安裝演训,解決依賴性弟孟。

.軟件相關(guān)文件:

/etc/ha.d/ldirectord.cf主配置文件

/usr/share/doc/ldirectord-3.9.6/ldirectord.cf配置模版

/usr/lib/systemd/system/ldirectord.service服務(wù)

/usr/sbin/ldirectord主程序

/var/log/ldirectord.log?日志

/var/run/ldirectord.ldirectord.pidpid文件

Ldirectord配置文件示例

checktimeout=3?#多長時間為超時時間,如3s沒回應(yīng)样悟,表示超時

checkinterval=1?#?檢查的間隔

autoreload=yes?#更改策略后拂募,不需要重啟服務(wù)就自動生效

fallback=127.0.0.1:80?#這里是定義sorry?server,當(dāng)后端的RS都宕機了,本機給用戶提示信息

logfile=“/var/log/ldirectord.log“#日志文件

quiescent=no?#down時yes權(quán)重為0乌奇,no為刪除

virtual=5#指定VS的FWM或IP:port

real=172.16.0.7:80?gate?2?#?gate表示dr模式没讲,2是權(quán)重

real=172.16.0.8:80?gate?1

fallback=127.0.0.1:80?gate#sorryserver

service=http

scheduler=wrr?#調(diào)度算法

checktype=negotiate?#默認就可以

checkport=80?#檢查端口,這樣會給服務(wù)器的負載加大礁苗。因為對外提供服務(wù)是80端口爬凑。可以另外在監(jiān)聽一個http的端口试伙,如listen8080但是這里有個矛盾嘁信,萬一80異常了,但是8080還是正常的疏叨,所以就導(dǎo)致了檢查結(jié)果不準確

request="index.html"?#監(jiān)控的主頁面

receive=“Test?Ldirectord"?#抓到默認的幾個字符潘靖,就認為服務(wù)是正常的。大小寫敏感

例子

#監(jiān)控后端的http服務(wù)是否正常蚤蔓,通過抓取后端服務(wù)器index.html頁面的關(guān)鍵字centos

cp??/usr/share/doc/ldirectord-3.9.6/ldirectord.cf?/etc/ha.d/ldirectord.cf

vim?/etc/ha.d/ldirectord.cf

virtual=192.168.32.66:80

real=192.168.32.63:80?gate

real=192.168.32.73:80?gate

fallback=127.0.0.1:80?gate

service=http

scheduler=wrr

#persistent=600

#netmask=255.255.255.255

protocol=tcp

checktype=negotiate

checkport=80

request="index.html"

receive="centos"

3? 自動化腳本

腳本使用需要注意事項

腳本中的VIP,RIP,RW(權(quán)重)監(jiān)控端口VPORT和RPORT這些變量需要根據(jù)實際情況進行調(diào)整

腳本設(shè)置了循環(huán)監(jiān)測卦溢,建議使用如下語句執(zhí)行腳本

nohup /PATH/TO/script/monitorRS.sh > /root/RSout.file 2>&1 &

腳本默認是3s對后端的RS進行一次監(jiān)測,該值可以根據(jù)實際情況調(diào)整秀又,命令在腳本后sleep 3.調(diào)整數(shù)字3即可单寂。

一鍵監(jiān)控腳本如下

?#!/bin/bash

#

#******************************************************************************

#Author:? ? ? ? ? ? ? Sunny

#Date:? ? ? ? ? ? ? ? 2017-10-23

#FileName:? ? ? ? ? ? monitorRS.sh

#version:? ? ? ? ? ? ? 1.0

#Your change info:

#Description:? ? ? ? ? For auto monitor RS status

#Copyright(C):? ? ? ? 2017? All rights reserved

#*****************************************************************************

echo "This is a script to auto monitor RS status,if you want to run the scirpt ,suggest you to excute cmd below"

echo

echo " nohup /PATH/TO/script/monitorRS.sh > /root/RSout.file 2>&1 & "

echo

echo "If you want to stop the script,you should run two cmds below,first you find the PID,then kill it"

echo

echo "ps -ef | grep monitorRS.sh"

echo? "kill -9 PID"

VIP=10.10.10.10

VPORT=80

RS=("192.168.32.63" "192.168.32.73")

RW=("3" "1")

RPORT=80

TYPE=g

LOG=/var/log/monitorRS.log

[ -e /var/log/monitorRS.log ] || touch /var/log/monitorRS.log

addrs() {

ipvsadm -a -t $VIP:$VPORT -r $1:$RPORT -$TYPE -w $2

[ $? -eq 0 ] && return 0 || return 1

}

delrs() {

ipvsadm -d -t $VIP:$VPORT -r $1:$RPORT

[ $? -eq 0 ] && return 0 || return 1

}

while true; do

let COUNT=0

for rip in ${RS[*]}; do

if ipvsadm -Ln | grep "$rip:$RPORT" &> /dev/null ; then

RS_status=online

else

RS_status=offline

fi

if $(curl --connect-timeout 1 http://$rip &>/dev/null) ; then

RS_test=yes

else

RS_test=no

fi

case $RS_test in

yes)

case ${RS_status} in

online)

echo "`date +'%F %H:%M:%S'`, $rip is work nice now." >> $LOG

;;

offline)

addrs $rip ${RW[$COUNT]} &>/dev/null;

addstatus=$?

if? [ $? -eq 0 ] && RS_status=online ;

then

echo "`date +'%F %H:%M:%S'`, $rip has been added to work." >> $LOG

else

echo "something wrong when add $rip back to work,please check,maybe your should do it manual"

echo "`date +'%F %H:%M:%S'`, $rip is added failed." >> $LOG

fi

;;

*)

echo "Something wrong when read RS_status"

;;

esac

;;

no)

case ${RS_status} in

online)

delrs $rip &>/dev/null;

[ $? -eq 0 ] && RS_status=offline && echo "`date +'%F %H:%M:%S'`, $rip is out of work,it is delete." >> $LOG

;;

offline)

echo "`date +'%F %H:%M:%S'`,$rip is still out of? work" >> $LOG

;;

*)

echo "Something wrong when read RS_status"

;;

esac

;;

*)

echo "Something wrong when read RS_test"

;;

esac

let COUNT++

done

sleep 3

done

4? 總結(jié)

本文通過介紹工具ldirectord 和 編寫了自己設(shè)計的腳本對后端的RS進行監(jiān)控,但是監(jiān)控的方式都是對后端RS進行輪詢訪問吐辙,這種方式會對服務(wù)器造成一定的壓力宣决,因此,使用時要權(quán)衡昏苏∽鸱校總體來說,如果要使用LVS進行調(diào)度贤惯,建議是要對后端RS進行監(jiān)控洼专,否則當(dāng)RS異常時,將導(dǎo)致服務(wù)不可用救巷。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末壶熏,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子浦译,更是在濱河造成了極大的恐慌棒假,老刑警劉巖溯职,帶你破解...
    沈念sama閱讀 212,599評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異帽哑,居然都是意外死亡谜酒,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,629評論 3 385
  • 文/潘曉璐 我一進店門妻枕,熙熙樓的掌柜王于貴愁眉苦臉地迎上來围段,“玉大人客年,你說我怎么就攤上這事氛赐〖眨” “怎么了?”我有些...
    開封第一講書人閱讀 158,084評論 0 348
  • 文/不壞的土叔 我叫張陵愕掏,是天一觀的道長度秘。 經(jīng)常有香客問我,道長饵撑,這世上最難降的妖魔是什么剑梳? 我笑而不...
    開封第一講書人閱讀 56,708評論 1 284
  • 正文 為了忘掉前任,我火速辦了婚禮滑潘,結(jié)果婚禮上垢乙,老公的妹妹穿的比我還像新娘。我一直安慰自己语卤,他們只是感情好追逮,可當(dāng)我...
    茶點故事閱讀 65,813評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著粹舵,像睡著了一般羊壹。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上齐婴,一...
    開封第一講書人閱讀 50,021評論 1 291
  • 那天,我揣著相機與錄音稠茂,去河邊找鬼柠偶。 笑死,一個胖子當(dāng)著我的面吹牛睬关,可吹牛的內(nèi)容都是我干的诱担。 我是一名探鬼主播,決...
    沈念sama閱讀 39,120評論 3 410
  • 文/蒼蘭香墨 我猛地睜開眼电爹,長吁一口氣:“原來是場噩夢啊……” “哼蔫仙!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起丐箩,我...
    開封第一講書人閱讀 37,866評論 0 268
  • 序言:老撾萬榮一對情侶失蹤摇邦,失蹤者是張志新(化名)和其女友劉穎恤煞,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體施籍,經(jīng)...
    沈念sama閱讀 44,308評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡居扒,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,633評論 2 327
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了丑慎。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片喜喂。...
    茶點故事閱讀 38,768評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖竿裂,靈堂內(nèi)的尸體忽然破棺而出玉吁,到底是詐尸還是另有隱情,我是刑警寧澤腻异,帶...
    沈念sama閱讀 34,461評論 4 333
  • 正文 年R本政府宣布进副,位于F島的核電站,受9級特大地震影響捂掰,放射性物質(zhì)發(fā)生泄漏敢会。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 40,094評論 3 317
  • 文/蒙蒙 一这嚣、第九天 我趴在偏房一處隱蔽的房頂上張望鸥昏。 院中可真熱鬧,春花似錦姐帚、人聲如沸吏垮。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,850評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽膳汪。三九已至,卻和暖如春九秀,著一層夾襖步出監(jiān)牢的瞬間遗嗽,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,082評論 1 267
  • 我被黑心中介騙來泰國打工鼓蜒, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留痹换,地道東北人。 一個月前我還...
    沈念sama閱讀 46,571評論 2 362
  • 正文 我出身青樓都弹,卻偏偏與公主長得像娇豫,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子畅厢,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 43,666評論 2 350

推薦閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理冯痢,服務(wù)發(fā)現(xiàn),斷路器,智...
    卡卡羅2017閱讀 134,637評論 18 139
  • 本文部分觀點圖片采用于:http://chenx1242.blog.51cto.com 隨著智能機的逐漸普及浦楣,大量...
    BossHuang閱讀 3,146評論 0 16
  • 1.Cluster(集群)概念 (1)系統(tǒng)擴展方式: Scale UP:向上擴展,增強Scale Out:向外擴展...
    尛尛大尹閱讀 1,096評論 0 4
  • 一袖肥、高可用集群 (一)提升系統(tǒng)高可用性的解決方案:冗余(redundant) 工作模式active/passive...
    哈嘍別樣閱讀 1,719評論 2 5
  • 1 概述 本文將介紹三個Keepalive高可用的實現(xiàn)案例,分別是keepalive實現(xiàn)LVS高可用椒振,keepal...
    ghbsunny閱讀 10,399評論 0 3