Linux 網(wǎng)卡bond的七種模式
什么是bond
網(wǎng)卡bond是通過多張網(wǎng)卡綁定為一個邏輯網(wǎng)卡宝与,實現(xiàn)本地網(wǎng)卡的冗余,帶寬擴容和負載均衡痴怨,在生產場景中是一種常用的技術苞七。Kernels 2.4.12及以后的版本均供bonding模塊,以前的版本可以通過patch實現(xiàn)夺衍”芬辏可以通過以下命令確定內核是否支持 bonding:
#cat /boot/config-2.6.32-573.el6.x86_64 |grep -i bonding
CONFIG_BONDING=m
bond的七種模式介紹:
1、mode=0(balance-rr)(平衡掄循環(huán)策略)
鏈路負載均衡沟沙,增加帶寬河劝,支持容錯,一條鏈路故障會自動切換正常鏈路矛紫。交換機需要配置聚合口赎瞎,思科叫port channel。
- 特點:傳輸數(shù)據(jù)包順序是依次傳輸(即:第1個包走eth0颊咬,下一個包就走eth1….一直循環(huán)下去务甥,直到最后一個傳輸完畢),此模式提供負載平衡和容錯能力喳篇;但是我們知道如果一個連接或者會話的數(shù)據(jù)包從不同的接口發(fā)出的話敞临,中途再經過不同的鏈路,在客戶端很有可能會出現(xiàn)數(shù)據(jù)包無序到達的問題麸澜,而無序到達的數(shù)據(jù)包需要重新要求被發(fā)送挺尿,這樣網(wǎng)絡的吞吐量就會下降
- 表示負載分擔round-robin,并且是輪詢的方式比如第一個包走eth0,第二個包走eth1票髓,直到數(shù)據(jù)包發(fā)送完畢。
- 優(yōu)點:流量提高一倍
- 缺點:需要接入交換機做端口聚合铣耘,否則可能無法使用
2洽沟、mode=1(active-backup)(主-備份策略)
這個是主備模式,只有一塊網(wǎng)卡是active蜗细,另一塊是備用的standby裆操,所有流量都在active鏈路上處理,交換機配置的是捆綁的話將不能工作炉媒,因為交換機往兩塊網(wǎng)卡發(fā)包踪区,有一半包是丟棄的。
- 特點:只有一個設備處于活動狀態(tài)吊骤,當一個宕掉另一個馬上由備份轉換為主設備缎岗。mac地址是外部可見得,從外面看來白粉,bond的MAC地址是唯一的传泊,以避免switch(交換機)發(fā)生混亂。
此模式只提供了容錯能力鸭巴;由此可見此算法的優(yōu)點是可以提供高網(wǎng)絡連接的可用性眷细,但是它的資源利用率較低,只有一個接口處于工作狀態(tài)鹃祖,在有 N 個網(wǎng)絡接口的情況下溪椎,資源利用率為1/N - 優(yōu)點:冗余性高
- 缺點:鏈路利用率低,兩塊網(wǎng)卡只有1塊在工作
3恬口、mode=2(balance-xor)(平衡策略)
表示XOR Hash負載分擔校读,和交換機的聚合強制不協(xié)商方式配合。(需要xmit_hash_policy祖能,需要交換機配置port channel)
- 特點:基于指定的傳輸HASH策略傳輸數(shù)據(jù)包地熄。缺省的策略是:(源MAC地址 XOR 目標MAC地址) % slave數(shù)量。其他的傳輸策略可以通過xmit_hash_policy選項指定芯杀,此模式提供負載平衡和容錯能力
4端考、mode=3(broadcast)(廣播策略)
表示所有包從所有網(wǎng)絡接口發(fā)出,這個不均衡揭厚,只有冗余機制却特,但過于浪費資源。此模式適用于金融行業(yè)筛圆,因為他們需要高可靠性的網(wǎng)絡裂明,不允許出現(xiàn)任何問題。需要和交換機的聚合強制不協(xié)商方式配合太援。
- 特點:在每個slave接口上傳輸每個數(shù)據(jù)包闽晦,此模式提供了容錯能力
- 必要條件:
條件1:ethtool支持獲取每個slave的速率和雙工設定
條件2:switch(交換機)支持IEEE802.3ad Dynamic link aggregation
條件3:大多數(shù)switch(交換機)需要經過特定配置才能支持802.3ad模式
5扳碍、mode=4(802.3ad)(IEEE 802.3ad 動態(tài)鏈接聚合)
表示支持802.3ad協(xié)議,和交換機的聚合LACP方式配合(需要xmit_hash_policy).標準要求所有設備在聚合操作時仙蛉,要在同樣的速率和雙工模式笋敞,而且,和除了balance-rr模式外的其它bonding負載均衡模式一樣荠瘪,任何連接都不能使用多于一個接口的帶寬夯巷。
- 特點:創(chuàng)建一個聚合組,它們共享同樣的速率和雙工設定哀墓。根據(jù)802.3ad規(guī)范將多個slave工作在同一個激活的聚合體下趁餐。
外出流量的slave選舉是基于傳輸hash策略,該策略可以通過xmit_hash_policy選項從缺省的XOR策略改變到其他策略篮绰。需要注意的 是后雷,并不是所有的傳輸策略都是802.3ad適應的,
尤其考慮到在802.3ad標準43.2.4章節(jié)提及的包亂序問題吠各。不同的實現(xiàn)可能會有不同的適應 性喷面。 - 必要條件:
條件1:ethtool支持獲取每個slave的速率和雙工設定
條件2:switch(交換機)支持IEEE 802.3ad Dynamic link aggregation
條件3:大多數(shù)switch(交換機)需要經過特定配置才能支持802.3ad模式
6、mode=5(balance-tlb)(適配器傳輸負載均衡)
是根據(jù)每個slave的負載情況選擇slave進行發(fā)送走孽,接收時使用當前輪到的slave惧辈。該模式要求slave接口的網(wǎng)絡設備驅動有某種ethtool支持;而且ARP監(jiān)控不可用磕瓷。
- 特點:不需要任何特別的switch(交換機)支持的通道bonding盒齿。在每個slave上根據(jù)當前的負載(根據(jù)速度計算)分配外出流量。如果正在接受數(shù)據(jù)的slave出故障了困食,另一個slave接管失敗的slave的MAC地址边翁。
- 必要條件:
ethtool支持獲取每個slave的速率
7、mode=6(balance-alb)(適配器適應性負載均衡)
在5的tlb基礎上增加了rlb(接收負載均衡receive load balance).不需要任何switch(交換機)的支持硕盹。接收負載均衡是通過ARP協(xié)商實現(xiàn)的.
- 特點:該模式包含了balance-tlb模式符匾,同時加上針對IPV4流量的接收負載均衡(receive load balance, rlb),而且不需要任何switch(交換機)的支持瘩例。接收負載均衡是通過ARP協(xié)商實現(xiàn)的啊胶。bonding驅動截獲本機發(fā)送的ARP應答,并把源硬件地址改寫為bond中某個slave的唯一硬件地址垛贤,從而使得不同的對端使用不同的硬件地址進行通信焰坪。
來自服務器端的接收流量也會被均衡。當本機發(fā)送ARP請求時聘惦,bonding驅動把對端的IP信息從ARP包中復制并保存下來某饰。當ARP應答從對端到達 時,bonding驅動把它的硬件地址提取出來,并發(fā)起一個ARP應答給bond中的某個slave黔漂。
使用ARP協(xié)商進行負載均衡的一個問題是:每次廣播 ARP請求時都會使用bond的硬件地址诫尽,因此對端學習到這個硬件地址后,接收流量將會全部流向當前的slave炬守。這個問題可以通過給所有的對端發(fā)送更新 (ARP應答)來解決牧嫉,應答中包含他們獨一無二的硬件地址,從而導致流量重新分布劳较。
當新的slave加入到bond中時驹止,或者某個未激活的slave重新 激活時浩聋,接收流量也要重新分布观蜗。接收的負載被順序地分布(round robin)在bond中最高速的slave上
當某個鏈路被重新接上,或者一個新的slave加入到bond中衣洁,接收流量在所有當前激活的slave中全部重新分配墓捻,通過使用指定的MAC地址給每個 client發(fā)起ARP應答。下面介紹的updelay參數(shù)必須被設置為某個大于等于switch(交換機)轉發(fā)延時的值坊夫,從而保證發(fā)往對端的ARP應答 不會被switch(交換機)阻截砖第。 - 必要條件:
條件1:ethtool支持獲取每個slave的速率;
條件2:底層驅動支持設置某個設備的硬件地址环凿,從而使得總是有個slave(curr_active_slave)使用bond的硬件地址梧兼,同時保證每個bond 中的slave都有一個唯一的硬件地址。如果curr_active_slave出故障智听,它的硬件地址將會被新選出來的 curr_active_slave接管
其實mod=6與mod=0的區(qū)別:mod=6羽杰,先把eth0流量占滿,再占eth1到推,….ethX考赛;而mod=0的話,會發(fā)現(xiàn)2個口的流量都很穩(wěn)定莉测,基本一樣的帶寬颜骤。而mod=6,會發(fā)現(xiàn)第一個口流量很高捣卤,第2個口只占了小部分流量忍抽。
小結
mode5和mode6不需要交換機端的設置,網(wǎng)卡能自動聚合董朝。mode4需要支持802.3ad梯找。mode0,mode2和mode3理論上需要靜態(tài)聚合方式益涧。
但實測中mode0可以通過mac地址欺騙的方式在交換機不設置的情況下不太均衡地進行接收锈锤。
二、bond的配置實例
1、首先要看linux是否支持bonding,大部分發(fā)行版都支持
# modinfo bonding |more
filename: /lib/modules/2.6.32-431.el6.x86_64/kernel/drivers/net/bonding/bonding.ko
author: Thomas Davis, tadavis@lbl.gov and many others
description: Ethernet Channel Bonding Driver, v3.6.0
version: 3.6.0
license: GPL
srcversion: 353B1DC123506708446C57B
depends: 8021q,ipv6
vermagic: 2.6.32-431.el6.x86_64 SMP mod_unload modversions
如輸出以上信息久免,則說明支持bonding浅辙,如果沒有,說明內核不支持bonding,需要重新編譯內核
2、網(wǎng)卡配置文件
兩個物理網(wǎng)口分別是:eth0,eth1 綁定后的虛擬口是:bond0
[root@jacken ~]# cat /etc/sysconfig/network-scripts/ifcfg-eth0
DEVICE=eth0
HWADDR=EC:F4:BB:DC:4C:0C
TYPE=Ethernet
UUID=669f0694-9c52-4792-bd67-22c9d2c17acb
ONBOOT=yes
NM_CONTROLLED=no
BOOTPROTO=none
MASTER=bond0
SLAVE=yes
[root@jacken ~]# cat /etc/sysconfig/network-scripts/ifcfg-eth1
DEVICE=eth1
HWADDR=EC:F4:BB:DC:4C:0D
TYPE=Ethernet
UUID=1d2f30f4-b3f0-41a6-8c37-54f03115f7bd
ONBOOT=yes
NM_CONTROLLED=no
BOOTPROTO=none
MASTER=bond0
SLAVE=yes
[root@jacken ~]# cat /etc/sysconfig/network-scripts/ifcfg-bond0
DEVICE=bond0
NAME='System bond0'
TYPE=Ethernet
NM_CONTROLLED=no
USERCTL=no
ONBOOT=yes
BOOTPROTO=none
IPADDR=192.168.1.100
NETMASK=255.255.255.0
BONDING_OPTS='mode=1 miimon=100'
IPV6INIT=no
開機自動加載模塊到內核
#echo 'options bonding mode=0 miimon=200' >> /etc/modprobe.d/dist.conf
#echo 'ifenslave bond0 eth0 eth1' >>/etc/rc.local
miimon=100
每100毫秒 (即0.1秒) 監(jiān)測一次路連接狀態(tài)阎姥,如果有一條線路不通就轉入另一條線路记舆; Linux的多網(wǎng)卡綁定功能使用的是內核中的"bonding"模塊
如果修改為其它模式,只需要在BONDING_OPTS中指定mode=Number即可呼巴。USERCTL=no --是否允許非root用戶控制該設備
查看bond0狀態(tài):可以看到調用的是哪幾個物理網(wǎng)卡
#cat /proc/net/bonding/bond0
[root@compute05 ~]# cat /proc/net/bonding/bond0
Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)
Bonding Mode: fault-tolerance (active-backup)
Primary Slave: None
Currently Active Slave: eth1
MII Status: up
MII Polling Interval (ms): 100
Up Delay (ms): 0
Down Delay (ms): 0
Slave Interface: eth0
MII Status: up
Speed: 1000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: ec:f4:bb:dc:4c:0c
Slave queue ID: 0
Slave Interface: eth1
MII Status: up
Speed: 1000 Mbps
Duplex: full
Link Failure Count: 0
Permanent HW addr: ec:f4:bb:dc:4c:0d
Slave queue ID: 0
三泽腮、擴展
上邊是兩個網(wǎng)卡(eth0、eth1)綁定成一個bond0衣赶,如果我們要設置多個bond口诊赊,比如物理網(wǎng)口eth0和eth1組成bond0,eth2和eth3組成bond1府瞄,那么網(wǎng)口設置文件的設置方法和上面
是一樣的碧磅,只是/etc/modprobe.d/dist.conf文件就不能疊加了。正確的設置方法有兩種:
1遵馆、第一種
alias bond0 bonding
alias bond1 bonding
options bonding max_bonds=2 miimon=200 mode=1
這樣所有的綁定只能使用一個mode了鲸郊。
2、第二種
alias bond0 bonding
options bond0 miimon=100 mode=1
install bond1 /sbin/modprobe bonding -o bond1 miimon=100 mode=0
install bond2 /sbin/modprobe bonding -o bond2 miimon=100 mode=1
install bond3 /sbin/modprobe bonding -o bond3 miimon=100 mode=0
這種方式不同的bond口可以設定為不同的mode,注意開機自動啟動/etc/rc.d/rc.local文件的設置
ifenslave bond0 eth0 eth1
ifenslave bond1 eth2 eth3
ifenslave bond2 eth4 eth5
ifenslave bond3 eth6 eth7