當(dāng)前大多數(shù)的互聯(lián)網(wǎng)系統(tǒng)都使用了服務(wù)器集群技術(shù),集群是將相同服務(wù)部署在多臺(tái)服務(wù)器上構(gòu)成一個(gè)集群整體對(duì)外提供服務(wù)歇攻,這些集群可以是 Web 應(yīng)用服務(wù)器集群,也可以是數(shù)據(jù)庫服務(wù)器集群梆造,還可以是分布式緩存服務(wù)器集群等等掉伏。
在實(shí)際應(yīng)用中,在 Web 服務(wù)器集群之前總會(huì)有一臺(tái)負(fù)載均衡服務(wù)器澳窑,負(fù)載均衡設(shè)備的任務(wù)就是作為 Web 服務(wù)器流量的入口斧散,挑選最合適的一臺(tái) Web 服務(wù)器,將客戶端的請(qǐng)求轉(zhuǎn)發(fā)給它處理摊聋,實(shí)現(xiàn)客戶端到真實(shí)服務(wù)端的透明轉(zhuǎn)發(fā)鸡捐。
最近幾年很火的「云計(jì)算」以及分布式架構(gòu),本質(zhì)上也是將后端服務(wù)器作為計(jì)算資源麻裁、存儲(chǔ)資源箍镜,由某臺(tái)管理服務(wù)器封裝成一個(gè)服務(wù)對(duì)外提供,客戶端不需要關(guān)心真正提供服務(wù)的是哪臺(tái)機(jī)器煎源,在它看來色迂,就好像它面對(duì)的是一臺(tái)擁有近乎無限能力的服務(wù)器,而本質(zhì)上手销,真正提供服務(wù)的歇僧,是后端的集群。
LVS、Nginx诈悍、HAProxy 是目前使用最廣泛的三種軟件負(fù)載均衡軟件祸轮。
一般對(duì)負(fù)載均衡的使用是隨著網(wǎng)站規(guī)模的提升根據(jù)不同的階段來使用不同的技術(shù)。具體的應(yīng)用需求還得具體分析侥钳,如果是中小型的 Web 應(yīng)用适袜,比如日 PV 小于1000萬,用 Nginx 就完全可以了舷夺;如果機(jī)器不少苦酱,可以用 DNS 輪詢,LVS 所耗費(fèi)的機(jī)器還是比較多的给猾;大型網(wǎng)站或重要的服務(wù)疫萤,且服務(wù)器比較多時(shí),可以考慮用 LVS耙册。
目前關(guān)于網(wǎng)站架構(gòu)一般比較合理流行的架構(gòu)方案:Web 前端采用 Nginx/HAProxy+Keepalived 作負(fù)載均衡器;后端采用 MySQ L數(shù)據(jù)庫一主多從和讀寫分離毫捣,采用 LVS+Keepalived 的架構(gòu)详拙。
LVS
LVS 是 Linux Virtual Server 的簡稱,也就是 Linux 虛擬服務(wù)器÷現(xiàn)在 LVS 已經(jīng)是 Linux 標(biāo)準(zhǔn)內(nèi)核的一部分饶辙,從 Linux2.4 內(nèi)核以后,已經(jīng)完全內(nèi)置了 LVS 的各個(gè)功能模塊斑粱,無需給內(nèi)核打任何補(bǔ)丁弃揽,可以直接使用 LVS 提供的各種功能。
LVS 自從1998年開始则北,發(fā)展到現(xiàn)在已經(jīng)是一個(gè)比較成熟的技術(shù)項(xiàng)目了矿微。
LVS 的體系結(jié)構(gòu)
LVS 架設(shè)的服務(wù)器集群系統(tǒng)有三個(gè)部分組成:
(1) 最前端的負(fù)載均衡層,用 Load Balancer 表示
(2) 中間的服務(wù)器集群層尚揣,用 Server Array 表示
(3) 最底端的數(shù)據(jù)共享存儲(chǔ)層涌矢,用 Shared Storage 表示
LVS 負(fù)載均衡機(jī)制
LVS 不像 HAProxy 等七層軟負(fù)載面向的是 HTTP 包,所以七層負(fù)載可以做的 URL 解析等工作快骗,LVS 無法完成娜庇。
LVS 是四層負(fù)載均衡,也就是說建立在 OSI 模型的第四層——傳輸層之上方篮,傳輸層上有我們熟悉的 TCP/UDP名秀,LVS 支持 TCP/UDP 的負(fù)載均衡。因?yàn)?LVS 是四層負(fù)載均衡藕溅,因此它相對(duì)于其它高層負(fù)載均衡的解決辦法匕得,比如 DNS 域名輪流解析、應(yīng)用層負(fù)載的調(diào)度巾表、客戶端的調(diào)度等耗跛,它的效率是非常高的裕照。
所謂四層負(fù)載均衡 ,也就是主要通過報(bào)文中的目標(biāo)地址和端口调塌。七層負(fù)載均衡 晋南,也稱為“內(nèi)容交換”,也就是主要通過報(bào)文中的真正有意義的應(yīng)用層內(nèi)容羔砾。
LVS 的轉(zhuǎn)發(fā)主要通過修改 IP 地址(NAT 模式负间,分為源地址修改 SNAT 和目標(biāo)地址修改 DNAT)、修改目標(biāo) MAC(DR 模式)來實(shí)現(xiàn)姜凄。
NAT 模式:網(wǎng)絡(luò)地址轉(zhuǎn)換
NAT(Network Address Translation)是一種外網(wǎng)和內(nèi)網(wǎng)地址映射的技術(shù)政溃。
NAT 模式下,網(wǎng)絡(luò)數(shù)據(jù)報(bào)的進(jìn)出都要經(jīng)過 LVS 的處理态秧。LVS 需要作為 RS(真實(shí)服務(wù)器)的網(wǎng)關(guān)董虱。
當(dāng)包到達(dá) LVS 時(shí),LVS 做目標(biāo)地址轉(zhuǎn)換(DNAT)申鱼,將目標(biāo) IP 改為 RS 的 IP愤诱。RS 接收到包以后,仿佛是客戶端直接發(fā)給它的一樣捐友。RS 處理完淫半,返回響應(yīng)時(shí),源 IP 是 RS IP匣砖,目標(biāo) IP 是客戶端的 IP科吭。這時(shí) RS 的包通過網(wǎng)關(guān)(LVS)中轉(zhuǎn),LVS 會(huì)做源地址轉(zhuǎn)換(SNAT)猴鲫,將包的源地址改為 VIP对人,這樣,這個(gè)包對(duì)客戶端看起來就仿佛是 LVS 直接返回給它的拂共。
DR 模式:直接路由
DR 模式下需要 LVS 和 RS 集群綁定同一個(gè) VIP(RS 通過將 VIP 綁定在 loopback 實(shí)現(xiàn))规伐,但與 NAT 的不同點(diǎn)在于:請(qǐng)求由 LVS 接受,由真實(shí)提供服務(wù)的服務(wù)器(RealServer匣缘,RS)直接返回給用戶猖闪,返回的時(shí)候不經(jīng)過 LVS。
詳細(xì)來看肌厨,一個(gè)請(qǐng)求過來時(shí)培慌,LVS 只需要將網(wǎng)絡(luò)幀的 MAC 地址修改為某一臺(tái) RS 的 MAC,該包就會(huì)被轉(zhuǎn)發(fā)到相應(yīng)的 RS 處理柑爸,注意此時(shí)的源 IP 和目標(biāo) IP 都沒變吵护,LVS 只是做了一下移花接木。RS 收到 LVS 轉(zhuǎn)發(fā)來的包時(shí),鏈路層發(fā)現(xiàn) MAC 是自己的馅而,到上面的網(wǎng)絡(luò)層祥诽,發(fā)現(xiàn) IP 也是自己的,于是這個(gè)包被合法地接受瓮恭,RS 感知不到前面有 LVS 的存在雄坪。而當(dāng) RS 返回響應(yīng)時(shí),只要直接向源 IP(即用戶的 IP)返回即可屯蹦,不再經(jīng)過 LVS维哈。
DR 負(fù)載均衡模式數(shù)據(jù)分發(fā)過程中不修改 IP 地址,只修改 mac 地址登澜,由于實(shí)際處理請(qǐng)求的真實(shí)物理 IP 地址和數(shù)據(jù)請(qǐng)求目的 IP 地址一致阔挠,所以不需要通過負(fù)載均衡服務(wù)器進(jìn)行地址轉(zhuǎn)換,可將響應(yīng)數(shù)據(jù)包直接返回給用戶瀏覽器脑蠕,避免負(fù)載均衡服務(wù)器網(wǎng)卡帶寬成為瓶頸购撼。因此,DR 模式具有較好的性能谴仙,也是目前大型網(wǎng)站使用最廣泛的一種負(fù)載均衡手段迂求。
LVS 的優(yōu)點(diǎn)
抗負(fù)載能力強(qiáng)、是工作在傳輸層上僅作分發(fā)之用狞甚,沒有流量的產(chǎn)生锁摔,這個(gè)特點(diǎn)也決定了它在負(fù)載均衡軟件里的性能最強(qiáng)的廓旬,對(duì)內(nèi)存和 cpu 資源消耗比較低哼审。
配置性比較低,這是一個(gè)缺點(diǎn)也是一個(gè)優(yōu)點(diǎn)孕豹,因?yàn)闆]有可太多配置的東西涩盾,所以并不需要太多接觸,大大減少了人為出錯(cuò)的幾率励背。
工作穩(wěn)定春霍,因?yàn)槠浔旧砜关?fù)載能力很強(qiáng),自身有完整的雙機(jī)熱備方案叶眉,如 LVS+Keepalived址儒。
無流量,LVS 只分發(fā)請(qǐng)求衅疙,而流量并不從它本身出去莲趣,這點(diǎn)保證了均衡器 IO 的性能不會(huì)受到大流量的影響。
應(yīng)用范圍比較廣饱溢,因?yàn)?LVS 工作在傳輸層喧伞,所以它幾乎可以對(duì)所有應(yīng)用做負(fù)載均衡,包括 http、數(shù)據(jù)庫潘鲫、在線聊天室等等翁逞。
LVS 的缺點(diǎn)
軟件本身不支持正則表達(dá)式處理,不能做動(dòng)靜分離溉仑;而現(xiàn)在許多網(wǎng)站在這方面都有較強(qiáng)的需求挖函,這個(gè)是 Nginx、HAProxy+Keepalived 的優(yōu)勢所在彼念。
如果是網(wǎng)站應(yīng)用比較龐大的話挪圾,LVS/DR+Keepalived 實(shí)施起來就比較復(fù)雜了,相對(duì)而言逐沙,Nginx/HAProxy+Keepalived就簡單多了哲思。
Nginx
Nginx 是一個(gè)強(qiáng)大的 Web 服務(wù)器軟件,用于處理高并發(fā)的 HTTP 請(qǐng)求和作為反向代理服務(wù)器做負(fù)載均衡吩案。具有高性能棚赔、輕量級(jí)、內(nèi)存消耗少徘郭,強(qiáng)大的負(fù)載均衡能力等優(yōu)勢靠益。
Nignx 的架構(gòu)設(shè)計(jì)
相對(duì)于傳統(tǒng)基于進(jìn)程或線程的模型(Apache就采用這種模型)在處理并發(fā)連接時(shí)會(huì)為每一個(gè)連接建立一個(gè)單獨(dú)的進(jìn)程或線程,且在網(wǎng)絡(luò)或者輸入/輸出操作時(shí)阻塞残揉。這將導(dǎo)致內(nèi)存和 CPU 的大量消耗胧后,因?yàn)樾缕鹨粋€(gè)單獨(dú)的進(jìn)程或線程需要準(zhǔn)備新的運(yùn)行時(shí)環(huán)境,包括堆和棧內(nèi)存的分配抱环,以及新的執(zhí)行上下文壳快,當(dāng)然,這些也會(huì)導(dǎo)致多余的 CPU 開銷镇草。最終眶痰,會(huì)由于過多的上下文切換而導(dǎo)致服務(wù)器性能變差。
反過來梯啤,Nginx 的架構(gòu)設(shè)計(jì)是采用模塊化的竖伯、基于事件驅(qū)動(dòng)、異步因宇、單線程且非阻塞七婴。
Nginx 大量使用多路復(fù)用和事件通知,Nginx 啟動(dòng)以后察滑,會(huì)在系統(tǒng)中以 daemon 的方式在后臺(tái)運(yùn)行打厘,其中包括一個(gè) master 進(jìn)程,n(n>=1) 個(gè) worker 進(jìn)程杭棵。所有的進(jìn)程都是單線程(即只有一個(gè)主線程)的婚惫,且進(jìn)程間通信主要使用共享內(nèi)存的方式氛赐。
其中,master 進(jìn)程用于接收來自外界的信號(hào)先舷,并給 worker 進(jìn)程發(fā)送信號(hào)艰管,同時(shí)監(jiān)控 worker 進(jìn)程的工作狀態(tài)。worker 進(jìn)程則是外部請(qǐng)求真正的處理者蒋川,每個(gè) worker 請(qǐng)求相互獨(dú)立且平等的競爭來自客戶端的請(qǐng)求牲芋。請(qǐng)求只能在一個(gè) worker 進(jìn)程中被處理,且一個(gè) worker 進(jìn)程只有一個(gè)主線程捺球,所以同時(shí)只能處理一個(gè)請(qǐng)求缸浦。(原理同 Netty 很像)
Nginx 負(fù)載均衡
Nginx 負(fù)載均衡主要是對(duì)七層網(wǎng)絡(luò)通信模型中的第七層應(yīng)用層上的 http、https 進(jìn)行支持氮兵。
Nginx 是以反向代理的方式進(jìn)行負(fù)載均衡的裂逐。反向代理(Reverse Proxy)方式是指以代理服務(wù)器來接受 Internet 上的連接請(qǐng)求,然后將請(qǐng)求轉(zhuǎn)發(fā)給內(nèi)部網(wǎng)絡(luò)上的服務(wù)器泣栈,并將從服務(wù)器上得到的結(jié)果返回給 Internet 上請(qǐng)求連接的客戶端卜高,此時(shí)代理服務(wù)器對(duì)外就表現(xiàn)為一個(gè)服務(wù)器。
Nginx 實(shí)現(xiàn)負(fù)載均衡的分配策略有很多南片,Nginx 的 upstream 目前支持以下幾種方式:
輪詢(默認(rèn)):每個(gè)請(qǐng)求按時(shí)間順序逐一分配到不同的后端服務(wù)器掺涛,如果后端服務(wù)器 down 掉,能自動(dòng)剔除疼进。
weight:指定輪詢幾率薪缆,weight 和訪問比率成正比,用于后端服務(wù)器性能不均的情況伞广。
ip_hash:每個(gè)請(qǐng)求按訪問 ip 的 hash 結(jié)果分配拣帽,這樣每個(gè)訪客固定訪問一個(gè)后端服務(wù)器,可以解決 session 的問題赔癌。
fair(第三方):按后端服務(wù)器的響應(yīng)時(shí)間來分配請(qǐng)求诞外,響應(yīng)時(shí)間短的優(yōu)先分配澜沟。
url_hash(第三方):按訪問 url 的 hash 結(jié)果來分配請(qǐng)求灾票,使每個(gè) url 定向到同一個(gè)后端服務(wù)器,后端服務(wù)器為緩存時(shí)比較有效茫虽。
Nginx 的優(yōu)點(diǎn)
跨平臺(tái):Nginx 可以在大多數(shù) Unix like OS編譯運(yùn)行刊苍,而且也有 Windows 的移植版本
配置異常簡單:非常容易上手。配置風(fēng)格跟程序開發(fā)一樣濒析,神一般的配置
非阻塞正什、高并發(fā)連接:官方測試能夠支撐5萬并發(fā)連接,在實(shí)際生產(chǎn)環(huán)境中跑到2~3萬并發(fā)連接數(shù)
事件驅(qū)動(dòng):通信機(jī)制采用 epoll 模型号杏,支持更大的并發(fā)連接
Master/Worker 結(jié)構(gòu):一個(gè) master 進(jìn)程婴氮,生成一個(gè)或多個(gè) worker 進(jìn)程
內(nèi)存消耗兴拱簟:處理大并發(fā)的請(qǐng)求內(nèi)存消耗非常小。在3萬并發(fā)連接下主经,開啟的10個(gè) Nginx 進(jìn)程才消耗150M 內(nèi)存(15M*10=150M)
內(nèi)置的健康檢查功能:如果 Nginx 代理的后端的某臺(tái) Web 服務(wù)器宕機(jī)了荣暮,不會(huì)影響前端訪問
節(jié)省帶寬:支持 GZIP 壓縮,可以添加瀏覽器本地緩存的 Header 頭
穩(wěn)定性高:用于反向代理罩驻,宕機(jī)的概率微乎其微
Nginx 的缺點(diǎn)
Nginx 僅能支 持http穗酥、https 和 Email 協(xié)議,這樣就在適用范圍上面小些惠遏,這個(gè)是它的缺點(diǎn)
對(duì)后端服務(wù)器的健康檢查砾跃,只支持通過端口來檢測,不支持通過 ur l來檢測节吮。不支持 Session 的直接保持抽高,但能通過 ip_hash 來解決
HAProxy
HAProxy 支持兩種代理模式 TCP(四層)和HTTP(七層),也是支持虛擬主機(jī)的透绩。
HAProxy 的優(yōu)點(diǎn)能夠補(bǔ)充 Nginx 的一些缺點(diǎn)厨内,比如支持 Session 的保持,Cookie 的引導(dǎo)渺贤;同時(shí)支持通過獲取指定的 url 來檢測后端服務(wù)器的狀態(tài)雏胃。
HAProxy 跟 LVS 類似,本身就只是一款負(fù)載均衡軟件志鞍;單純從效率上來講 HAProxy 會(huì)比 Nginx 有更出色的負(fù)載均衡速度瞭亮,在并發(fā)處理上也是優(yōu)于 Nginx 的。
HAProxy 支持 TCP 協(xié)議的負(fù)載均衡轉(zhuǎn)發(fā)固棚,可以對(duì) MySQL 讀進(jìn)行負(fù)載均衡统翩,對(duì)后端的 MySQL 節(jié)點(diǎn)進(jìn)行檢測和負(fù)載均衡,大家可以用 LVS+Keepalived 對(duì) MySQL 主從做負(fù)載均衡此洲。
HAProxy 負(fù)載均衡策略非常多:Round-robin(輪循)厂汗、Weight-round-robin(帶權(quán)輪循)、source(原地址保持)呜师、RI(請(qǐng)求URL)娶桦、rdp-cookie(根據(jù)cookie)。
Reference:
鐘武?https://zhongwuzw.github.io
王晨純?http://www.importnew.com/11229.html
周旭龍 http://edisonchou.cnblogs.com
更多精彩文章汁汗,請(qǐng)?jiān)L問 LinkedKeeper 社區(qū) www.linkedkeeper.com
歡迎關(guān)注“LinkedKeeper”微信公眾號(hào)衷畦。LinkedKeeper 是一個(gè)致力于打造高品質(zhì)的技術(shù)資源社區(qū)。