k8s 集群原理

1. 背景

Kubernetes作為容器應(yīng)用的管理中心钉疫，對(duì)集群內(nèi)部所有容器的生命周期進(jìn)行管理，結(jié)合自身的健康檢查及錯(cuò)誤恢復(fù)機(jī)制巢价，實(shí)現(xiàn)了集群內(nèi)部應(yīng)用層的高可用性牲阁。

Kubernetes服務(wù)本身的穩(wěn)定運(yùn)行對(duì)集群管理至關(guān)重要，影響服務(wù)穩(wěn)定的因素一般來(lái)說(shuō)分為兩種,一種是服務(wù)本身異程愀龋或者服務(wù)所在機(jī)器宕機(jī)，另一種是因?yàn)榫W(wǎng)絡(luò)問(wèn)題導(dǎo)致的服務(wù)不可用您炉。本文將從存儲(chǔ)層柒爵、管理層、接入層三個(gè)方面介紹高可用Kubernetes集群的原理赚爵。

2. Etcd高可用方案

Kubernetes的存儲(chǔ)層使用的是Etcd棉胀。Etcd是CoreOS開(kāi)源的一個(gè)高可用強(qiáng)一致性的分布式存儲(chǔ)服務(wù)法瑟，Kubernetes使用Etcd作為數(shù)據(jù)存儲(chǔ)后端，把需要記錄的pod唁奢、rc霎挟、service等資源信息存儲(chǔ)在Etcd中。

Etcd使用raft算法將一組主機(jī)組成集群麻掸，raft 集群中的每個(gè)節(jié)點(diǎn)都可以根據(jù)集群運(yùn)行的情況在三種狀態(tài)間切換：follower, candidate 與 leader酥夭。leader 和 follower 之間保持心跳。如果follower在一段時(shí)間內(nèi)沒(méi)有收到來(lái)自leader的心跳脊奋，就會(huì)轉(zhuǎn)為candidate熬北，發(fā)出新的選主請(qǐng)求。

集群初始化的時(shí)候內(nèi)部的節(jié)點(diǎn)都是follower節(jié)點(diǎn)诚隙，之后會(huì)有一個(gè)節(jié)點(diǎn)因?yàn)闆](méi)有收到leader的心跳轉(zhuǎn)為candidate節(jié)點(diǎn)讶隐，發(fā)起選主請(qǐng)求。當(dāng)這個(gè)節(jié)點(diǎn)獲得了大于一半節(jié)點(diǎn)的投票后會(huì)轉(zhuǎn)為leader節(jié)點(diǎn)久又，如下圖所示：

當(dāng)leader節(jié)點(diǎn)服務(wù)異常后巫延，其中的某個(gè)follower節(jié)點(diǎn)因?yàn)闆](méi)有收到leader的心跳轉(zhuǎn)為candidate節(jié)點(diǎn)，發(fā)起選主請(qǐng)求地消。只要集群中剩余的正常節(jié)點(diǎn)數(shù)目大于集群內(nèi)主機(jī)數(shù)目的一半炉峰，Etcd集群就可以正常對(duì)外提供服務(wù)。具體的恢復(fù)過(guò)程如下圖所示：

當(dāng)集群內(nèi)部的網(wǎng)絡(luò)出現(xiàn)故障集群可能會(huì)出現(xiàn)“腦裂”問(wèn)題犯建，這個(gè)時(shí)候集群會(huì)分為一大一小兩個(gè)集群（奇數(shù)節(jié)點(diǎn)的集群）讲冠，較小的集群會(huì)處于異常狀態(tài)，較大的集群可以正常對(duì)外提供服務(wù)适瓦，出現(xiàn)網(wǎng)絡(luò)故障時(shí)的恢復(fù)過(guò)程如下圖所示：

Etcd集群的部署有三種方式竿开，具體的安裝步驟可以查看官方手冊(cè)，此處不再詳細(xì)介紹玻熙。

3. Kubernetes master服務(wù)高可用方案

Kubernetes的管理層服務(wù)包括kube-scheduler和kube-controller-manager否彩。kube-scheduer和kube-controller-manager使用一主多從的高可用方案，在同一時(shí)刻只允許一個(gè)服務(wù)處以具體的任務(wù)嗦随。Kubernetes中實(shí)現(xiàn)了一套簡(jiǎn)單的選主邏輯列荔，依賴(lài)Etcd實(shí)現(xiàn)scheduler和controller-manager的選主功能。

如果scheduler和controller-manager在啟動(dòng)的時(shí)候設(shè)置了leader-elect參數(shù)枚尼，它們?cè)趩?dòng)后會(huì)先嘗試獲取leader節(jié)點(diǎn)身份贴浙，只有在獲取leader節(jié)點(diǎn)身份后才可以執(zhí)行具體的業(yè)務(wù)邏輯。它們分別會(huì)在Etcd中創(chuàng)建kube-scheduler和kube-controller-manager的endpoint署恍，endpoint的信息中記錄了當(dāng)前的leader節(jié)點(diǎn)信息崎溃，以及記錄的上次更新時(shí)間。leader節(jié)點(diǎn)會(huì)定期更新endpoint的信息盯质，維護(hù)自己的leader身份袁串。每個(gè)從節(jié)點(diǎn)的服務(wù)都會(huì)定期檢查endpoint的信息概而，如果endpoint的信息在時(shí)間范圍內(nèi)沒(méi)有更新，它們會(huì)嘗試更新自己為leader節(jié)點(diǎn)囱修。scheduler服務(wù)以及controller-manager服務(wù)之間不會(huì)進(jìn)行通信赎瑰，利用Etcd的強(qiáng)一致性，能夠保證在分布式高并發(fā)情況下leader節(jié)點(diǎn)的全局唯一性破镰。

整體方案如下圖所示：

當(dāng)集群中的leader節(jié)點(diǎn)服務(wù)異常后餐曼，其它節(jié)點(diǎn)的服務(wù)會(huì)嘗試更新自身為leader節(jié)點(diǎn)，當(dāng)有多個(gè)節(jié)點(diǎn)同時(shí)更新endpoint時(shí)啤咽，由Etcd保證只有一個(gè)服務(wù)的更新請(qǐng)求能夠成功晋辆。通過(guò)這種機(jī)制sheduler和controller-manager可以保證在leader節(jié)點(diǎn)宕機(jī)后其它的節(jié)點(diǎn)可以順利選主，保證服務(wù)故障后快速恢復(fù)宇整。

當(dāng)集群中的網(wǎng)絡(luò)出現(xiàn)故障時(shí)對(duì)服務(wù)的選主影響不是很大瓶佳，因?yàn)閟cheduler和controller-manager是依賴(lài)Etcd進(jìn)行選主的，在網(wǎng)絡(luò)故障后鳞青，可以和Etcd通信的主機(jī)依然可以按照之前的邏輯進(jìn)行選主霸饲，就算集群被切分，Etcd也可以保證同一時(shí)刻只有一個(gè)節(jié)點(diǎn)的服務(wù)處于leader狀態(tài)臂拓。

4. Kubernetes apiserver服務(wù)高可用方案

Kubernetes的接入層服務(wù)主要是kube-apiserver厚脉。apiserver本身是無(wú)狀態(tài)的服務(wù)，它的主要任務(wù)職責(zé)是把資源數(shù)據(jù)存儲(chǔ)到Etcd中胶惰，后續(xù)具體的業(yè)務(wù)邏輯是由scheduler和controller-manager執(zhí)行的傻工。

可以同時(shí)起多個(gè)apiserver服務(wù)，使用nginx把客戶(hù)端的流量轉(zhuǎn)發(fā)到不同的后端apiserver上實(shí)現(xiàn)接入層的高可用孵滞。具體的實(shí)現(xiàn)如下圖所示：

接入層的高可用分為兩個(gè)部分中捆，一個(gè)部分是多活的apiserver服務(wù)，另一個(gè)部分是一主一備的nginx服務(wù)坊饶。

5. 總結(jié)

本文主要從存儲(chǔ)層泄伪，管理層和接入層三個(gè)部分介紹了Kubernetes高可用方案的原理，整體的方案架構(gòu)如下圖所示：

當(dāng)然要真正做到Kubernetes集群的高可用匿级，還需要考慮Kubernetes依賴(lài)的docker registry服務(wù)的高可用蟋滴，以及Kubernetes依賴(lài)的網(wǎng)絡(luò)插件（cni）的高可用等等，相關(guān)的內(nèi)容會(huì)在以后的文章中進(jìn)行介紹痘绎。

最后編輯于：2017.12.10 11:10:24

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末津函，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子孤页，更是在濱河造成了極大的恐慌尔苦，老刑警劉巖，帶你破解...
沈念sama閱讀 218,204評(píng)論 6贊 506
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場(chǎng)離奇詭異蕉堰，居然都是意外死亡，警方通過(guò)查閱死者的電腦和手機(jī)悲龟，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 93,091評(píng)論 3贊 395
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)屋讶，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)，“玉大人须教，你說(shuō)我怎么就攤上這事皿渗。” “怎么了轻腺？”我有些...
開(kāi)封第一講書(shū)人閱讀 164,548評(píng)論 0贊 354
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵乐疆，是天一觀的道長(zhǎng)。經(jīng)常有香客問(wèn)我贬养，道長(zhǎng)挤土，這世上最難降的妖魔是什么？我笑而不...
開(kāi)封第一講書(shū)人閱讀 58,657評(píng)論 1贊 293
?港島之戀（遺憾婚禮）
正文為了忘掉前任误算，我火速辦了婚禮仰美，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘儿礼。我一直安慰自己咖杂，他們只是感情好，可當(dāng)我...
茶點(diǎn)故事閱讀 67,689評(píng)論 6贊 392
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布蚊夫。她就那樣靜靜地躺著诉字，像睡著了一般。火紅的嫁衣襯著肌膚如雪知纷。梳的紋絲不亂的頭發(fā)上壤圃，一...
開(kāi)封第一講書(shū)人閱讀 51,554評(píng)論 1贊 305
城市分裂傳說(shuō)
那天，我揣著相機(jī)與錄音屈扎，去河邊找鬼埃唯。笑死，一個(gè)胖子當(dāng)著我的面吹牛鹰晨，可吹牛的內(nèi)容都是我干的墨叛。我是一名探鬼主播，決...
沈念sama閱讀 40,302評(píng)論 3贊 418
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼模蜡，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼漠趁！你這毒婦竟也來(lái)了？” 一聲冷哼從身側(cè)響起忍疾，我...
開(kāi)封第一講書(shū)人閱讀 39,216評(píng)論 0贊 276
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤闯传，失蹤者是張志新（化名）和其女友劉穎，沒(méi)想到半個(gè)月后卤妒，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體甥绿，經(jīng)...
沈念sama閱讀 45,661評(píng)論 1贊 314
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡字币，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 37,851評(píng)論 3贊 336
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了共缕。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片洗出。...
茶點(diǎn)故事閱讀 39,977評(píng)論 1贊 348
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖图谷，靈堂內(nèi)的尸體忽然破棺而出翩活，到底是詐尸還是另有隱情，我是刑警寧澤便贵，帶...
沈念sama閱讀 35,697評(píng)論 5贊 347
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布菠镇，位于F島的核電站，受9級(jí)特大地震影響承璃，放射性物質(zhì)發(fā)生泄漏利耍。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 41,306評(píng)論 3贊 330
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一盔粹、第九天我趴在偏房一處隱蔽的房頂上張望堂竟。院中可真熱鬧，春花似錦玻佩、人聲如沸出嘹。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 31,898評(píng)論 0贊 22
一樁弒父案咬崔，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)税稼。三九已至，卻和暖如春垮斯，著一層夾襖步出監(jiān)牢的瞬間郎仆，已是汗流浹背。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 33,019評(píng)論 1贊 270
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工兜蠕，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留扰肌，地道東北人。一個(gè)月前我還...
沈念sama閱讀 48,138評(píng)論 3贊 370
代替公主和親
正文我出身青樓熊杨，卻偏偏與公主長(zhǎng)得像曙旭，于是被迫代替她去往敵國(guó)和親。傳聞我的和親對(duì)象是個(gè)殘疾皇子晶府，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 44,927評(píng)論 2贊 355

k8s 集群原理

推薦閱讀更多精彩內(nèi)容