如需將現(xiàn)存的集群安全且“平滑”地升級(jí)到更新的版本捎拯。
12.1 升級(jí)預(yù)檢
把正在對外提供服務(wù)的K8s集群升級(jí)比作“給飛行中的飛機(jī)換引擎”凶朗,所以升級(jí)的難度可想而知远荠。
升級(jí)的難度主要有兩點(diǎn):
- 1.集群經(jīng)過長時(shí)間的運(yùn)行砸抛,積累了復(fù)雜的運(yùn)行時(shí)狀態(tài).
- 2.集群已經(jīng)被進(jìn)行了各種個(gè)性化配置。
這就需要在升級(jí)集群之前對集群進(jìn)行全面的檢查蝇刀,從而保證升級(jí)可以順利完成螟加。集群升級(jí)預(yù)檢功能目前被放置在運(yùn)維中心里。如下圖所示吞琐,運(yùn)維中心支持集群升級(jí)前置檢查捆探、組件升級(jí)前置檢查和集群檢查三種檢查類型。本章主要對集群升級(jí)前置檢查進(jìn)行介紹與解析站粟。
圖
12.1.1 核心組件檢查項(xiàng)
一個(gè)不健康的集群很可能會(huì)在升級(jí)中出現(xiàn)各種異常的問題黍图,就算僥幸完成了升級(jí),各種問題也會(huì)在后續(xù)使用中逐漸凸顯出來奴烙。
核心組件檢查項(xiàng)分為三類助被,分別是云資源檢查,核心組件檢查以及節(jié)點(diǎn)配置檢查切诀。
1.集群云資源
容器服務(wù)K8s需要依賴阿里云底層的各種資源揩环,集群所依賴的云資源一旦不健康,或發(fā)生配置錯(cuò)誤幅虑,都會(huì)影響整個(gè)集群的狀態(tài)丰滑。
2.集群核心組件
集群核心組件的健康與否影響著整個(gè)集群的健康。下面我們就所需要檢查的組件倒庵、它們所包含的檢查項(xiàng)吨枉,以及檢查項(xiàng)異常可能帶來的影響進(jìn)行分析哄芜,具體分析如下表所示。
表
3.集群節(jié)點(diǎn)配置
節(jié)點(diǎn)作為承載K8s的底層元計(jì)算資源柬唯,不僅