集群的定義
集群是一組協(xié)同工作的服務集合,一般由兩個或者兩個以上的服務器組成.在集群中,同樣的服務可以由多個服務實體提供.因而當一個節(jié)點出現(xiàn)故障時,集群中的另外一個節(jié)點就可以自動接管故障節(jié)點的資源.
集群需要具備的基本條件
1.兩個或者兩個以上的服務器
2.集群中的節(jié)點是需要互相通信的,通信的方式有兩種,一種是基于RS232的心跳監(jiān)控,另一種是用一塊單獨的網(wǎng)卡來跑心跳.
3.同時一個集群系統(tǒng)需要擁有共享的數(shù)據(jù)存儲,因為集群對外提供的服務是一致的,任何一個集群節(jié)點運行一個應用時,應用的數(shù)據(jù)都集中存儲在節(jié)點共享空間內(nèi),而每個集群節(jié)點僅運行應用的服務,同時存儲應用程序文件.
小結:構建一個集群至少需要兩臺服務器,同時還需要有串口線,集群軟件,共享存儲設備等.
心跳檢測
1.通過心跳線來實現(xiàn)
可以做心跳線的設備有RS232串口線
2.通過單獨的網(wǎng)卡來實現(xiàn)
這種方式下每個節(jié)點都應該具有兩塊網(wǎng)卡,一塊作為私有網(wǎng)絡連接到對方機器相應的網(wǎng)卡,用于心跳檢測.另外一塊連接到公共網(wǎng)絡對外提供服務,同時心跳網(wǎng)卡和服務網(wǎng)卡的IP地址盡量不要在一個網(wǎng)段內(nèi).因為心跳檢測的效率直接影響故障切換時間的長短
漂移IP
在集群系統(tǒng)中,除了每個服務節(jié)點自身的真是IP地址外,還存在一個漂移IP地址茶行。至于為什么叫漂移IP,是因為這個IP地址不是固定的.比如,在兩個節(jié)點的雙機熱備中,正常狀態(tài)下,這個漂移IP地址位于主節(jié)點上,當主節(jié)點出現(xiàn)故障后,漂移IP地址自動切換到備份節(jié)點泡孩。此外,對外提供服務的IP一定要是這個漂移IP,因為故障后漂移IP可以轉移到另外的機器,其它機器就可以繼續(xù)提供服務了.
集群中的其它相關概念
節(jié)點
運行Heartbeat進程的一個獨立主機,稱為節(jié)點.節(jié)點有主次之分,分別稱為主節(jié)點和備份節(jié)點.每個節(jié)點擁有唯一的主機名,并且擁有屬于自己的一組資源,例如,磁盤,文件系統(tǒng),網(wǎng)絡地址和應用服務等,主節(jié)點上一般運行著一個或者多個應用服務.而備份節(jié)點一般處于監(jiān)控狀態(tài).
資源
資源時一個節(jié)點可以控制的實體,并且當節(jié)點宕機發(fā)生故障時,這些資源能夠被其它節(jié)點接管,一般由以下幾種
磁盤分區(qū),文件系統(tǒng),IP地址,應用程序服務,NFS等
事件
表示集群中可能發(fā)生的事情。如節(jié)點系統(tǒng)故障,網(wǎng)絡連通故障,網(wǎng)卡故障,應用程序故障燈,這些事件會導致節(jié)點的資源發(fā)生轉移
動作
即對事件發(fā)生時的響應方式,可以由shell腳本控制.如,當某個節(jié)點發(fā)送故障后,備份節(jié)點將通過事先設定好的執(zhí)行腳本進行服務的關閉或者啟動,進而接管故障節(jié)點的資源.
集群的基本分類
負載均衡集群
分布式計算集群
等