當(dāng)前大多數(shù)的互聯(lián)網(wǎng)系統(tǒng)都使用了服務(wù)器集群技術(shù)刨摩,集群是將相同服務(wù)部署在多臺(tái)服務(wù)器上構(gòu)成一個(gè)集群整體對(duì)外提供服務(wù)跟狱,這些集群可以是?Web?應(yīng)用服務(wù)器集群俭厚,也可以是數(shù)據(jù)庫服務(wù)器集群,還可以是分布式緩存服務(wù)器集群等等驶臊。
在實(shí)際應(yīng)用中挪挤,在?Web?服務(wù)器集群之前總會(huì)有一臺(tái)負(fù)載均衡服務(wù)器,負(fù)載均衡設(shè)備的任務(wù)就是作為?Web?服務(wù)器流量的入口关翎,挑選最合適的一臺(tái)?Web?服務(wù)器扛门,將客戶端的請(qǐng)求轉(zhuǎn)發(fā)給它處理,實(shí)現(xiàn)客戶端到真實(shí)服務(wù)端的透明轉(zhuǎn)發(fā)纵寝。
最近幾年很火的「云計(jì)算」以及分布式架構(gòu)论寨,本質(zhì)上也是將后端服務(wù)器作為計(jì)算資源、存儲(chǔ)資源爽茴,由某臺(tái)管理服務(wù)器封裝成一個(gè)服務(wù)對(duì)外提供葬凳,客戶端不需要關(guān)心真正提供服務(wù)的是哪臺(tái)機(jī)器,在它看來室奏,就好像它面對(duì)的是一臺(tái)擁有近乎無限能力的服務(wù)器火焰,而本質(zhì)上,真正提供服務(wù)的窍奋,是后端的集群荐健。
LVS酱畅、Nginx、HAProxy?是目前使用最廣泛的三種軟件負(fù)載均衡軟件江场。
一般對(duì)負(fù)載均衡的使用是隨著網(wǎng)站規(guī)模的提升根據(jù)不同的階段來使用不同的技術(shù)纺酸。具體的應(yīng)用需求還得具體分析,如果是中小型的?Web?應(yīng)用址否,比如日?PV?小于1000萬餐蔬,用?Nginx?就完全可以了;如果機(jī)器不少佑附,可以用?DNS?輪詢樊诺,LVS?所耗費(fèi)的機(jī)器還是比較多的;大型網(wǎng)站或重要的服務(wù)音同,且服務(wù)器比較多時(shí)词爬,可以考慮用?LVS。
目前關(guān)于網(wǎng)站架構(gòu)一般比較合理流行的架構(gòu)方案:Web?前端采用?Nginx/HAProxy+Keepalived?作負(fù)載均衡器权均;后端采用?MySQ?L數(shù)據(jù)庫一主多從和讀寫分離顿膨,采用?LVS+Keepalived?的架構(gòu)。
LVS
LVS?是?Linux?Virtual?Server?的簡(jiǎn)稱叽赊,也就是?Linux?虛擬服務(wù)器×滴郑現(xiàn)在?LVS?已經(jīng)是?Linux?標(biāo)準(zhǔn)內(nèi)核的一部分,從?Linux2.4?內(nèi)核以后必指,已經(jīng)完全內(nèi)置了?LVS?的各個(gè)功能模塊囊咏,無需給內(nèi)核打任何補(bǔ)丁,可以直接使用?LVS?提供的各種功能塔橡。
LVS?自從1998年開始梅割,發(fā)展到現(xiàn)在已經(jīng)是一個(gè)比較成熟的技術(shù)項(xiàng)目了。
LVS 的體系結(jié)構(gòu)
LVS?架設(shè)的服務(wù)器集群系統(tǒng)有三個(gè)部分組成:
(1) 最前端的負(fù)載均衡層谱邪,用 Load Balancer 表示
(2) 中間的服務(wù)器集群層炮捧,用 Server Array 表示
(3) 最底端的數(shù)據(jù)共享存儲(chǔ)層,用 Shared Storage 表示
LVS 負(fù)載均衡機(jī)制
LVS?不像?HAProxy?等七層軟負(fù)載面向的是?HTTP?包惦银,所以七層負(fù)載可以做的?URL?解析等工作咆课,LVS?無法完成。
LVS?是四層負(fù)載均衡扯俱,也就是說建立在?OSI?模型的第四層——傳輸層之上书蚪,傳輸層上有我們熟悉的?TCP/UDP,LVS?支持?TCP/UDP?的負(fù)載均衡迅栅。因?yàn)?LVS?是四層負(fù)載均衡殊校,因此它相對(duì)于其它高層負(fù)載均衡的解決辦法,比如?DNS?域名輪流解析读存、應(yīng)用層負(fù)載的調(diào)度为流、客戶端的調(diào)度等呕屎,它的效率是非常高的。
所謂四層負(fù)載均衡?敬察,也就是主要通過報(bào)文中的目標(biāo)地址和端口秀睛。七層負(fù)載均衡?,也稱為“內(nèi)容交換”莲祸,也就是主要通過報(bào)文中的真正有意義的應(yīng)用層內(nèi)容蹂安。
LVS?的轉(zhuǎn)發(fā)主要通過修改?IP?地址(NAT?模式,分為源地址修改?SNAT?和目標(biāo)地址修改?DNAT)锐帜、修改目標(biāo)?MAC(DR?模式)來實(shí)現(xiàn)田盈。
NAT?模式:網(wǎng)絡(luò)地址轉(zhuǎn)換
NAT(Network?Address?Translation)是一種外網(wǎng)和內(nèi)網(wǎng)地址映射的技術(shù)。
NAT?模式下缴阎,網(wǎng)絡(luò)數(shù)據(jù)報(bào)的進(jìn)出都要經(jīng)過?LVS?的處理允瞧。LVS?需要作為?RS(真實(shí)服務(wù)器)的網(wǎng)關(guān)。
當(dāng)包到達(dá)?LVS?時(shí)药蜻,LVS?做目標(biāo)地址轉(zhuǎn)換(DNAT)瓷式,將目標(biāo)?IP?改為?RS?的?IP。RS?接收到包以后语泽,仿佛是客戶端直接發(fā)給它的一樣。RS?處理完视卢,返回響應(yīng)時(shí)踱卵,源?IP?是?RS?IP,目標(biāo)?IP?是客戶端的?IP据过。這時(shí)?RS?的包通過網(wǎng)關(guān)(LVS)中轉(zhuǎn)惋砂,LVS?會(huì)做源地址轉(zhuǎn)換(SNAT),將包的源地址改為?VIP绳锅,這樣西饵,這個(gè)包對(duì)客戶端看起來就仿佛是?LVS?直接返回給它的。
DR?模式:直接路由
DR?模式下需要?LVS?和?RS?集群綁定同一個(gè)?VIP(RS?通過將?VIP?綁定在?loopback?實(shí)現(xiàn))鳞芙,但與?NAT?的不同點(diǎn)在于:請(qǐng)求由?LVS?接受眷柔,由真實(shí)提供服務(wù)的服務(wù)器(RealServer,RS)直接返回給用戶原朝,返回的時(shí)候不經(jīng)過?LVS驯嘱。
詳細(xì)來看,一個(gè)請(qǐng)求過來時(shí)喳坠,LVS?只需要將網(wǎng)絡(luò)幀的?MAC?地址修改為某一臺(tái)?RS?的?MAC鞠评,該包就會(huì)被轉(zhuǎn)發(fā)到相應(yīng)的?RS?處理,注意此時(shí)的源?IP?和目標(biāo)?IP?都沒變壕鹉,LVS?只是做了一下移花接木剃幌。RS?收到?LVS?轉(zhuǎn)發(fā)來的包時(shí)聋涨,鏈路層發(fā)現(xiàn)?MAC?是自己的,到上面的網(wǎng)絡(luò)層负乡,發(fā)現(xiàn)?IP?也是自己的牍白,于是這個(gè)包被合法地接受,RS?感知不到前面有?LVS?的存在敬鬓。而當(dāng)?RS?返回響應(yīng)時(shí)淹朋,只要直接向源?IP(即用戶的?IP)返回即可,不再經(jīng)過?LVS钉答。
DR?負(fù)載均衡模式數(shù)據(jù)分發(fā)過程中不修改?IP?地址础芍,只修改?mac?地址,由于實(shí)際處理請(qǐng)求的真實(shí)物理?IP?地址和數(shù)據(jù)請(qǐng)求目的?IP?地址一致数尿,所以不需要通過負(fù)載均衡服務(wù)器進(jìn)行地址轉(zhuǎn)換仑性,可將響應(yīng)數(shù)據(jù)包直接返回給用戶瀏覽器,避免負(fù)載均衡服務(wù)器網(wǎng)卡帶寬成為瓶頸右蹦。因此诊杆,DR?模式具有較好的性能,也是目前大型網(wǎng)站使用最廣泛的一種負(fù)載均衡手段何陆。
LVS 的優(yōu)點(diǎn)
1晨汹、抗負(fù)載能力強(qiáng)、是工作在傳輸層上僅作分發(fā)之用贷盲,沒有流量的產(chǎn)生淘这,這個(gè)特點(diǎn)也決定了它在負(fù)載均衡軟件里的性能最強(qiáng)的,對(duì)內(nèi)存和?cpu?資源消耗比較低巩剖。
2铝穷、配置性比較低,這是一個(gè)缺點(diǎn)也是一個(gè)優(yōu)點(diǎn)佳魔,因?yàn)闆]有可太多配置的東西曙聂,所以并不需要太多接觸,大大減少了人為出錯(cuò)的幾率鞠鲜。
3宁脊、工作穩(wěn)定,因?yàn)槠浔旧砜关?fù)載能力很強(qiáng)镊尺,自身有完整的雙機(jī)熱備方案朦佩,如?LVS?+?Keepalived。
4庐氮、無流量语稠,LVS?只分發(fā)請(qǐng)求,而流量并不從它本身出去,這點(diǎn)保證了均衡器?IO?的性能不會(huì)受到大流量的影響仙畦。
5输涕、應(yīng)用范圍比較廣,因?yàn)?LVS?工作在傳輸層慨畸,所以它幾乎可以對(duì)所有應(yīng)用做負(fù)載均衡莱坎,包括?http、數(shù)據(jù)庫寸士、在線聊天室等等檐什。
LVS 的缺點(diǎn)
1、軟件本身不支持正則表達(dá)式處理弱卡,不能做動(dòng)靜分離乃正;而現(xiàn)在許多網(wǎng)站在這方面都有較強(qiáng)的需求,這個(gè)是?Nginx婶博、HAProxy?+?Keepalived?的優(yōu)勢(shì)所在瓮具。
2、如果是網(wǎng)站應(yīng)用比較龐大的話凡人,LVS/DR?+?Keepalived?實(shí)施起來就比較復(fù)雜了名党,相對(duì)而言,Nginx?/?HAProxy?+?Keepalived?就簡(jiǎn)單多了挠轴。
Nginx
Nginx?是一個(gè)強(qiáng)大的?Web?服務(wù)器軟件传睹,用于處理高并發(fā)的?HTTP?請(qǐng)求和作為反向代理服務(wù)器做負(fù)載均衡。具有高性能岸晦、輕量級(jí)蒋歌、內(nèi)存消耗少,強(qiáng)大的負(fù)載均衡能力等優(yōu)勢(shì)委煤。
Nignx 的架構(gòu)設(shè)計(jì)
相對(duì)于傳統(tǒng)基于進(jìn)程或線程的模型(Apache就采用這種模型)在處理并發(fā)連接時(shí)會(huì)為每一個(gè)連接建立一個(gè)單獨(dú)的進(jìn)程或線程,且在網(wǎng)絡(luò)或者輸入/輸出操作時(shí)阻塞修档。這將導(dǎo)致內(nèi)存和?CPU?的大量消耗碧绞,因?yàn)樾缕鹨粋€(gè)單獨(dú)的進(jìn)程或線程需要準(zhǔn)備新的運(yùn)行時(shí)環(huán)境,包括堆和棧內(nèi)存的分配吱窝,以及新的執(zhí)行上下文讥邻,當(dāng)然,這些也會(huì)導(dǎo)致多余的?CPU?開銷院峡。最終兴使,會(huì)由于過多的上下文切換而導(dǎo)致服務(wù)器性能變差。
反過來照激,Nginx?的架構(gòu)設(shè)計(jì)是采用模塊化的发魄、基于事件驅(qū)動(dòng)、異步、單線程且非阻塞励幼。
Nginx?大量使用多路復(fù)用和事件通知汰寓,Nginx?啟動(dòng)以后,會(huì)在系統(tǒng)中以?daemon?的方式在后臺(tái)運(yùn)行苹粟,其中包括一個(gè)?master?進(jìn)程有滑,n(n>=1)?個(gè)?worker?進(jìn)程。所有的進(jìn)程都是單線程(即只有一個(gè)主線程)的嵌削,且進(jìn)程間通信主要使用共享內(nèi)存的方式毛好。
其中,master?進(jìn)程用于接收來自外界的信號(hào)苛秕,并給?worker?進(jìn)程發(fā)送信號(hào)肌访,同時(shí)監(jiān)控?worker?進(jìn)程的工作狀態(tài)。worker?進(jìn)程則是外部請(qǐng)求真正的處理者想帅,每個(gè)?worker?請(qǐng)求相互獨(dú)立且平等的競(jìng)爭(zhēng)來自客戶端的請(qǐng)求场靴。請(qǐng)求只能在一個(gè)?worker?進(jìn)程中被處理,且一個(gè)?worker?進(jìn)程只有一個(gè)主線程港准,所以同時(shí)只能處理一個(gè)請(qǐng)求旨剥。(原理同?Netty?很像)
Nginx 負(fù)載均衡
Nginx?負(fù)載均衡主要是對(duì)七層網(wǎng)絡(luò)通信模型中的第七層應(yīng)用層上的?http、https?進(jìn)行支持浅缸。
Nginx?是以反向代理的方式進(jìn)行負(fù)載均衡的轨帜。反向代理(Reverse?Proxy)方式是指以代理服務(wù)器來接受?Internet?上的連接請(qǐng)求,然后將請(qǐng)求轉(zhuǎn)發(fā)給內(nèi)部網(wǎng)絡(luò)上的服務(wù)器衩椒,并將從服務(wù)器上得到的結(jié)果返回給?Internet?上請(qǐng)求連接的客戶端蚌父,此時(shí)代理服務(wù)器對(duì)外就表現(xiàn)為一個(gè)服務(wù)器。
Nginx?實(shí)現(xiàn)負(fù)載均衡的分配策略有很多毛萌,Nginx?的?upstream?目前支持以下幾種方式:
1苟弛、輪詢(默認(rèn)):每個(gè)請(qǐng)求按時(shí)間順序逐一分配到不同的后端服務(wù)器,如果后端服務(wù)器?down?掉阁将,能自動(dòng)剔除膏秫。
2、weight:指定輪詢幾率做盅,weight?和訪問比率成正比缤削,用于后端服務(wù)器性能不均的情況。
3吹榴、ip_hash:每個(gè)請(qǐng)求按訪問?ip?的?hash?結(jié)果分配亭敢,這樣每個(gè)訪客固定訪問一個(gè)后端服務(wù)器,可以解決?session?的問題图筹。
4帅刀、fair(第三方):按后端服務(wù)器的響應(yīng)時(shí)間來分配請(qǐng)求,響應(yīng)時(shí)間短的優(yōu)先分配。
5劝篷、url_hash(第三方):按訪問?url?的?hash?結(jié)果來分配請(qǐng)求哨鸭,使每個(gè)?url?定向到同一個(gè)后端服務(wù)器,后端服務(wù)器為緩存時(shí)比較有效娇妓。
Nginx 的優(yōu)點(diǎn)
1像鸡、跨平臺(tái):Nginx?可以在大多數(shù)?Unix?like?OS編譯運(yùn)行,而且也有?Windows?的移植版本
2哈恰、配置異常簡(jiǎn)單:非常容易上手只估。配置風(fēng)格跟程序開發(fā)一樣,神一般的配置
3着绷、非阻塞蛔钙、高并發(fā)連接:官方測(cè)試能夠支撐5萬并發(fā)連接,在實(shí)際生產(chǎn)環(huán)境中跑到2~3萬并發(fā)連接數(shù)
4荠医、事件驅(qū)動(dòng):通信機(jī)制采用?epoll?模型吁脱,支持更大的并發(fā)連接
5、Master/Worker?結(jié)構(gòu):一個(gè)?master?進(jìn)程彬向,生成一個(gè)或多個(gè)?worker?進(jìn)程
6兼贡、內(nèi)存消耗小:處理大并發(fā)的請(qǐng)求內(nèi)存消耗非常小娃胆。在3萬并發(fā)連接下遍希,開啟的10個(gè)?Nginx?進(jìn)程才消耗150M?內(nèi)存(15M*10=150M)
7、內(nèi)置的健康檢查功能:如果?Nginx?代理的后端的某臺(tái)?Web?服務(wù)器宕機(jī)了里烦,不會(huì)影響前端訪問
8凿蒜、節(jié)省帶寬:支持?GZIP?壓縮,可以添加瀏覽器本地緩存的?Header?頭
9胁黑、穩(wěn)定性高:用于反向代理废封,宕機(jī)的概率微乎其微
Nginx 的缺點(diǎn)
1、Nginx 僅能支 持http丧蘸、https 和 Email 協(xié)議虱饿,這樣就在適用范圍上面小些,這個(gè)是它的缺點(diǎn)
2触趴、對(duì)后端服務(wù)器的健康檢查,只支持通過端口來檢測(cè)渴肉,不支持通過?ur?l來檢測(cè)冗懦。不支持?Session?的直接保持,但能通過?ip_hash?來解決
HAProxy
HAProxy?支持兩種代理模式?TCP(四層)和HTTP(七層)仇祭,也是支持虛擬主機(jī)的披蕉。
HAProxy?的優(yōu)點(diǎn)能夠補(bǔ)充?Nginx?的一些缺點(diǎn),比如支持?Session?的保持,Cookie?的引導(dǎo)没讲;同時(shí)支持通過獲取指定的?url?來檢測(cè)后端服務(wù)器的狀態(tài)眯娱。
HAProxy?跟?LVS?類似,本身就只是一款負(fù)載均衡軟件爬凑;單純從效率上來講?HAProxy?會(huì)比?Nginx?有更出色的負(fù)載均衡速度徙缴,在并發(fā)處理上也是優(yōu)于?Nginx?的。
HAProxy?支持?TCP?協(xié)議的負(fù)載均衡轉(zhuǎn)發(fā)嘁信,可以對(duì)?MySQL?讀進(jìn)行負(fù)載均衡于样,對(duì)后端的?MySQL?節(jié)點(diǎn)進(jìn)行檢測(cè)和負(fù)載均衡,大家可以用?LVS+Keepalived?對(duì)?MySQL?主從做負(fù)載均衡潘靖。
HAProxy?負(fù)載均衡策略非常多:Round-robin(輪循)穿剖、Weight-round-robin(帶權(quán)輪循)、source(原地址保持)卦溢、RI(請(qǐng)求URL)糊余、rdp-cookie(根據(jù)cookie)。
Reference:
鐘武
https://zhongwuzw.github.io
王晨純
http://www.importnew.com/11229.html
周旭龍
http://edisonchou.cnblogs.com
注:本文轉(zhuǎn)載于linkedkeeper.com