什么是負載均衡
負載均衡,英文名稱為Load Balance脑题,指由多臺服務器以對稱的方式組成一個服務器集合,每臺服務器都具有等價的地位,都可以單獨對外提供服務而無須其他服務器的輔助玄柠。通過某種負載分擔技術(shù),將外部發(fā)送來的請求均勻分配到對稱結(jié)構(gòu)中的某一臺服務器上诫舅,而接收到請求的服務器獨立地回應客戶的請求羽利。負載均衡能夠平均分配客戶請求到服務器陣列,借此提供快速獲取重要數(shù)據(jù)刊懈,解決大量并發(fā)訪問服務問題这弧,這種集群技術(shù)可以用最少的投資獲得接近于大型主機的性能。
負載均衡分為軟件負載均衡和硬件負載均衡虚汛,前者的代表是阿里章文嵩博士研發(fā)的LVS匾浪,后者則是均衡服務器比如F5,當然這只是提一下卷哩,不是重點户矢。
本文講述的是"將外部發(fā)送來的請求均勻分配到對稱結(jié)構(gòu)中的某一臺服務器上"的各種算法,并以Java代碼演示每種算法的具體實現(xiàn)殉疼,OK,下面進入正題捌年,在進入正題前瓢娜,先寫一個類來模擬Ip列表:
public class IpMap{
// 待路由的Ip列表,Key代表Ip礼预,Value代表該Ip的權(quán)重
public static HashMap<String, Integer> serverWeightMap =
new HashMap<String, Integer>();
static
{
serverWeightMap.put("192.168.1.100", 1);
serverWeightMap.put("192.168.1.101", 1);
// 權(quán)重為4
serverWeightMap.put("192.168.1.102", 4);
serverWeightMap.put("192.168.1.103", 1);
serverWeightMap.put("192.168.1.104", 1);
// 權(quán)重為3
serverWeightMap.put("192.168.1.105", 3);
serverWeightMap.put("192.168.1.106", 1);
// 權(quán)重為2
serverWeightMap.put("192.168.1.107", 2);
serverWeightMap.put("192.168.1.108", 1);
serverWeightMap.put("192.168.1.109", 1);
serverWeightMap.put("192.168.1.110", 1);
}
}
輪詢(Round Robin)法
輪詢法即Round Robin法眠砾,其代碼實現(xiàn)大致如下:
public class RoundRobin{
private static Integer pos = 0;
public static String getServer(){
// 重建一個Map,避免服務器的上下線導致的并發(fā)問題
Map<String, Integer> serverMap = new HashMap<String, Integer>();
serverMap.putAll(IpMap.serverWeightMap);
// 取得Ip地址List
Set<String> keySet = serverMap.keySet();
ArrayList<String> keyList = new ArrayList<String>();
keyList.addAll(keySet);
String server = null;
synchronized (pos)
{
if (pos > keySet.size())
pos = 0;
server = keyList.get(pos);
pos ++;
}
return server;
}
}
由于serverWeightMap中的地址列表是動態(tài)的托酸,隨時可能有機器上線褒颈、下線或者宕機柒巫,因此為了避免可能出現(xiàn)的并發(fā)問題,方法內(nèi)部要新建局部變量serverMap谷丸,現(xiàn)將serverMap中的內(nèi)容復制到線程本地堡掏,以避免被多個線程修改。這樣可能會引入新的問題刨疼,復制以后serverWeightMap的修改無法反映給serverMap泉唁,也就是說這一輪選擇服務器的過程中,新增服務器或者下線服務器揩慕,負載均衡算法將無法獲知亭畜。新增無所謂,如果有服務器下線或者宕機迎卤,那么可能會訪問到不存在的地址拴鸵。因此,服務調(diào)用端需要有相應的容錯處理蜗搔,比如重新發(fā)起一次server選擇并調(diào)用劲藐。
對于當前輪詢的位置變量pos,為了保證服務器選擇的順序性碍扔,需要在操作時對其加鎖瘩燥,使得同一時刻只能有一個線程可以修改pos的值,否則當pos變量被并發(fā)修改不同,則無法保證服務器選擇的順序性厉膀,甚至有可能導致keyList數(shù)組越界。
輪詢法的優(yōu)點在于:試圖做到請求轉(zhuǎn)移的絕對均衡二拐。
輪詢法的缺點在于:為了做到請求轉(zhuǎn)移的絕對均衡服鹅,必須付出相當大的代價,因為為了保證pos變量修改的互斥性百新,需要引入重量級的悲觀鎖synchronized企软,這將會導致該段輪詢代碼的并發(fā)吞吐量發(fā)生明顯的下降。
隨機(Random)法
通過系統(tǒng)隨機函數(shù)饭望,根據(jù)后端服務器列表的大小值來隨機選擇其中一臺進行訪問仗哨。由概率統(tǒng)計理論可以得知,隨著調(diào)用量的增大铅辞,其實際效果越來越接近于平均分配流量到每一臺后端服務器厌漂,也就是輪詢的效果。
隨機法的代碼實現(xiàn)大致如下:
public class Random{
public static String getServer(){
// 重建一個Map斟珊,避免服務器的上下線導致的并發(fā)問題
Map<String, Integer> serverMap =
new HashMap<String, Integer>();
serverMap.putAll(IpMap.serverWeightMap);
// 取得Ip地址List
Set<String> keySet = serverMap.keySet();
ArrayList<String> keyList = new ArrayList<String>();
keyList.addAll(keySet);
java.util.Random random = new java.util.Random();
int randomPos = random.nextInt(keyList.size());
return keyList.get(randomPos);
}
}
整體代碼思路和輪詢法一致苇倡,先重建serverMap,再獲取到server列表。在選取server的時候旨椒,通過Random的nextInt方法取0~keyList.size()區(qū)間的一個隨機值晓褪,從而從服務器列表中隨機獲取到一臺服務器地址進行返回∽凵鳎基于概率統(tǒng)計的理論涣仿,吞吐量越大,隨機算法的效果越接近于輪詢算法的效果寥粹。
源地址哈希(Hash)法
源地址哈希的思想是獲取客戶端訪問的IP地址值变过,通過哈希函數(shù)計算得到一個數(shù)值,用該數(shù)值對服務器列表的大小進行取模運算涝涤,得到的結(jié)果便是要訪問的服務器的序號媚狰。源地址哈希算法的代碼實現(xiàn)大致如下:
public class Hash{
public static String getServer(){
// 重建一個Map,避免服務器的上下線導致的并發(fā)問題
Map<String, Integer> serverMap =
new HashMap<String, Integer>();
serverMap.putAll(IpMap.serverWeightMap);
// 取得Ip地址List
Set<String> keySet = serverMap.keySet();
ArrayList<String> keyList = new ArrayList<String>();
keyList.addAll(keySet);
// 在Web應用中可通過HttpServlet的getRemoteIp方法獲取
String remoteIp = "127.0.0.1";
int hashCode = remoteIp.hashCode();
int serverListSize = keyList.size();
int serverPos = hashCode % serverListSize;
return keyList.get(serverPos);
}
}
前兩部分和輪詢法阔拳、隨機法一樣就不說了崭孤,差別在于路由選擇部分。通過客戶端的ip也就是remoteIp糊肠,取得它的Hash值辨宠,對服務器列表的大小取模,結(jié)果便是選用的服務器在服務器列表中的索引值货裹。
源地址哈希法的優(yōu)點在于:保證了相同客戶端IP地址將會被哈希到同一臺后端服務器嗤形,直到后端服務器列表變更。根據(jù)此特性可以在服務消費者與服務提供者之間建立有狀態(tài)的session會話弧圆。
源地址哈希算法的缺點在于:除非集群中服務器的非常穩(wěn)定赋兵,基本不會上下線,否則一旦有服務器上線搔预、下線霹期,那么通過源地址哈希算法路由到的服務器是服務器上線、下線前路由到的服務器的概率非常低拯田,如果是session則取不到session历造,如果是緩存則可能引發(fā)"雪崩"。一致性Hash算法部分船庇。
加權(quán)輪詢(Weight Round Robin)法
不同的服務器可能機器配置和當前系統(tǒng)的負載并不相同吭产,因此它們的抗壓能力也不盡相同,給配置高鸭轮、負載低的機器配置更高的權(quán)重垮刹,讓其處理更多的請求,而低配置张弛、高負載的機器,則給其分配較低的權(quán)重,降低其系統(tǒng)負載吞鸭。加權(quán)輪詢法可以很好地處理這一問題寺董,并將請求順序按照權(quán)重分配到后端。加權(quán)輪詢法的代碼實現(xiàn)大致如下:
public class WeightRoundRobin{
private static Integer pos;
public static String getServer(){
// 重建一個Map刻剥,避免服務器的上下線導致的并發(fā)問題
Map<String, Integer> serverMap = new HashMap<String, Integer>();
serverMap.putAll(IpMap.serverWeightMap);
// 取得Ip地址List
Set<String> keySet = serverMap.keySet();
Iterator<String> iterator = keySet.iterator();
List<String> serverList = new ArrayList<String>();
while (iterator.hasNext()){
String server = iterator.next();
int weight = serverMap.get(server);
for (int i = 0; i < weight; i++)
serverList.add(server);
}
String server = null;
synchronized (pos){
if (pos > keySet.size())
pos = 0;
server = serverList.get(pos);
pos ++;
}
return server;
}
}
與輪詢法類似遮咖,只是在獲取服務器地址之前增加了一段權(quán)重計算的代碼,根據(jù)權(quán)重的大小造虏,將地址重復地增加到服務器地址列表中御吞,權(quán)重越大,該服務器每輪所獲得的請求數(shù)量越多漓藕。
加權(quán)隨機(Weight Random)法
與加權(quán)輪詢法類似陶珠,加權(quán)隨機法也是根據(jù)后端服務器不同的配置和負載情況來配置不同的權(quán)重。不同的是享钞,它是按照權(quán)重來隨機選擇服務器的揍诽,而不是順序。加權(quán)隨機法的代碼實現(xiàn)如下:
public class WeightRandom{
public static String getServer(){
// 重建一個Map栗竖,避免服務器的上下線導致的并發(fā)問題
Map<String, Integer> serverMap =
new HashMap<String, Integer>();
serverMap.putAll(IpMap.serverWeightMap);
// 取得Ip地址List
Set<String> keySet = serverMap.keySet();
Iterator<String> iterator = keySet.iterator();
List<String> serverList = new ArrayList<String>();
while (iterator.hasNext()){
String server = iterator.next();
int weight = serverMap.get(server);
for (int i = 0; i < weight; i++)
serverList.add(server);
}
java.util.Random random = new java.util.Random();
int randomPos = random.nextInt(serverList.size());
return serverList.get(randomPos);
}
}
這段代碼相當于是隨機法和加權(quán)輪詢法的結(jié)合暑脆,比較好理解,就不解釋了狐肢。
最小連接數(shù)(Least Connections)法
前面幾種方法費盡心思來實現(xiàn)服務消費者請求次數(shù)分配的均衡添吗,當然這么做是沒錯的,可以為后端的多臺服務器平均分配工作量份名,最大程度地提高服務器的利用率碟联,但是實際情況是否真的如此?實際情況中同窘,請求次數(shù)的均衡真的能代表負載的均衡嗎玄帕?這是一個值得思考的問題。
上面的問題想邦,再換一個角度來說就是:以后端服務器的視角來觀察系統(tǒng)的負載裤纹,而非請求發(fā)起方來觀察。最小連接數(shù)法便屬于此類丧没。
最小連接數(shù)算法比較靈活和智能鹰椒,由于后端服務器的配置不盡相同,對于請求的處理有快有慢呕童,它正是根據(jù)后端服務器當前的連接情況漆际,動態(tài)地選取其中當前積壓連接數(shù)最少的一臺服務器來處理當前請求,盡可能地提高后端服務器的利用效率夺饲,將負載合理地分流到每一臺機器奸汇。由于最小連接數(shù)設計服務器連接數(shù)的匯總和感知施符,設計與實現(xiàn)較為繁瑣,此處就不說它的實現(xiàn)了擂找。