??Kubernetes
對(duì)無狀態(tài)服務(wù)有完善的支持,但是對(duì)于有狀態(tài)的服務(wù),是從1.3版本開始片酝,才逐漸支持的囚衔。
有狀態(tài)的應(yīng)用程序
??一般情況下,nginx
或者web server
(不包含MySQL
)自身都是不需要保存數(shù)據(jù)的雕沿,對(duì)于 web server
练湿,數(shù)據(jù)會(huì)保存在專門做持久化的節(jié)點(diǎn)上。所以這些節(jié)點(diǎn)可以隨意擴(kuò)容或者縮容审轮,只要簡單的增加或減少副本的數(shù)量就可以肥哎。但是很多有狀態(tài)的程序都需要集群式的部署睛蛛,意味著節(jié)點(diǎn)需要形成群組關(guān)系镜撩,每個(gè)節(jié)點(diǎn)需要一個(gè)唯一的ID(例如Kafka BrokerId, Zookeeper myid)來作為集群內(nèi)部每個(gè)成員的標(biāo)識(shí)睬魂,集群內(nèi)節(jié)點(diǎn)之間進(jìn)行內(nèi)部通信時(shí)需要用到這些標(biāo)識(shí)痴荐。傳統(tǒng)的做法是管理員會(huì)把這些程序部署到穩(wěn)定的,長期存活的節(jié)點(diǎn)上去克懊,這些節(jié)點(diǎn)有持久化的存儲(chǔ)和靜態(tài)的IP地址洋丐。這樣某個(gè)應(yīng)用的實(shí)例就跟底層物理基礎(chǔ)設(shè)施比如某臺(tái)機(jī)器豪诲,某個(gè)IP地址耦合在一起了吊圾。Kubernets
中StatefulSet
的目標(biāo)是通過把標(biāo)識(shí)分配給應(yīng)用程序的某個(gè)不依賴于底層物理基礎(chǔ)設(shè)施的特定實(shí)例來解耦這種依賴關(guān)系达椰。(消費(fèi)方不使用靜態(tài)的IP
,而是通過DNS
域名去找到某臺(tái)特定機(jī)器)
StatefulSet
??StatefulSet
(1.5版本之前叫做PetSet
)為什么適合有狀態(tài)的程序项乒,因?yàn)樗啾扔?code>Deployment有以下特點(diǎn):
- 穩(wěn)定的啰劲,唯一的網(wǎng)絡(luò)標(biāo)識(shí),可以用來發(fā)現(xiàn)集群內(nèi)部的其他成員檀何。比如
StatefulSet
的名字叫kafka
蝇裤,那么第一個(gè)起來的Pet
叫kafka-0
,第二個(gè)叫kafk-1
,依次類推。 - 穩(wěn)定的持久化存儲(chǔ):通過
Kubernetes
的PV/PVC
或者外部存儲(chǔ)(預(yù)先提供的)
來實(shí)現(xiàn) - 啟動(dòng)或關(guān)閉時(shí)保證有序:
優(yōu)雅的部署
和伸縮性
: 操作第n個(gè)pod時(shí)频鉴,前n-1個(gè)pod已經(jīng)是運(yùn)行且準(zhǔn)備好的狀態(tài)栓辜。 有序的,優(yōu)雅的刪除和終止操作:從 n, n-1, ... 1, 0 這樣的順序刪除
??上述提到的“穩(wěn)定”指的是Pod
在多次重新調(diào)度時(shí)保持穩(wěn)定砚殿,即存儲(chǔ)
啃憎,DNS名稱
芝囤,hostname
都是跟Pod
綁定到一起的似炎,跟Pod
被調(diào)度到哪個(gè)節(jié)點(diǎn)沒關(guān)系辛萍。
??所以Zookeeper
,Etcd
或Elasticsearch
這類需要穩(wěn)定的集群成員的應(yīng)用時(shí)羡藐,就可以用StatefulSet
贩毕。通過查詢無頭服務(wù)域名的A記錄
,就可以得到集群內(nèi)成員的域名信息仆嗦。
??StatefulSet
也有一些限制:
-
Pod
的存儲(chǔ)必須是通過PersistentVolume Provisioner
基于storeage類
來提供辉阶,或者是管理員預(yù)先提供的外部存儲(chǔ)。 - 刪除或者縮容不會(huì)刪除跟
StatefulSet
相關(guān)的卷瘩扼,這是為了保證數(shù)據(jù)的安全 -
StatefulSet
現(xiàn)在需要一個(gè)無頭服務(wù)(Headless Service)來負(fù)責(zé)生成Pods
的唯一網(wǎng)絡(luò)標(biāo)示谆甜,需要開發(fā)人員創(chuàng)建這個(gè)服務(wù) - 對(duì)
StatefulSet
的升級(jí)是一個(gè)手工的過程
無頭服務(wù)(Headless Service)
要定義一個(gè)服務(wù)(Service)
為無頭服務(wù)(Headless Service)
,需要把Service
定義中的ClusterIP
配置項(xiàng)設(shè)置為空: spec.clusterIP:None
集绰。和普通Service
相比规辱,Headless Service
沒有ClusterIP
(所以沒有負(fù)載均衡),它會(huì)給一個(gè)集群內(nèi)部的每個(gè)成員提供一個(gè)唯一的DNS域名
來作為每個(gè)成員的網(wǎng)絡(luò)標(biāo)識(shí)栽燕,集群內(nèi)部成員之間使用域名通信罕袋。無頭服務(wù)管理的域名是如下的格式:$(service_name).$(k8s_namespace).svc.cluster.local
。其中的"cluster.local"
是集群的域名,除非做了配置碍岔,否則集群域名默認(rèn)就是cluster.local
浴讯。StatefulSet
下創(chuàng)建的每個(gè)Pod
,得到一個(gè)對(duì)應(yīng)的DNS
子域名蔼啦,格式如下:
$(podname).$(governing_service_domain)
,這里 governing_service_domain
是由StatefulSet
中定義的serviceName
來決定榆纽。舉例子,無頭服務(wù)管理的kafka
的域名是:kafka.test.svc.cluster.local
, 創(chuàng)建的Pod
得到的子域名是 kafka-1.kafka.test.svc.cluster.local
捏肢。注意這里提到的域名掠河,都是由kuber-dns
組件管理的集群內(nèi)部使用的域名,可以通過命令來查詢:
$ nslookup my-nginx
Server: 192.168.16.53
Address 1: 192.168.16.53
Name: my-nginx
Address 1: 192.168.16.132
而普通Service
情況下猛计,Pod
名字后面是隨機(jī)數(shù)唠摹,需要通過Service
來做負(fù)載均衡。
當(dāng)一個(gè)StatefulSet
掛掉奉瘤,新創(chuàng)建的StatefulSet
會(huì)被賦予跟原來的Pod
一樣的名字勾拉,通過這個(gè)名字來匹配到原來的存儲(chǔ),實(shí)現(xiàn)了狀態(tài)保存盗温。因?yàn)樯衔奶岬搅伺涸蓿總€(gè)Pod
的標(biāo)識(shí)附著在Pod
上,無論pod
被重新調(diào)度到了哪里卖局。
成員發(fā)現(xiàn)
一個(gè)Pod
可以通過 Downward api機(jī)制來知道自己的pod
名字斧蜕,也可以運(yùn)行hostname
來發(fā)現(xiàn)自己的DNS名字
。StatefuleSet
的服務(wù)名(governing service
)在創(chuàng)建的時(shí)刻就已知了砚偶,所以只需要通過一個(gè)約定的環(huán)境變量把服務(wù)名傳遞給POD
就可以批销。
一點(diǎn)八卦
為什么從PetSet
改名字到StatefulSet
洒闸,也是很有意思的,感興趣的同學(xué)可以去這里看看:
Please Consider changing the name of PetSet before General Availability