告警群中出現(xiàn)服務(wù)重啟并重新注冊(cè)信息谅畅,上去排查重啟原因痢毒,登錄rancher上看,現(xiàn)在food-match-01這臺(tái)機(jī)器上的服務(wù)已經(jīng)掛了炉旷。 途中看到...
前幾天收到反饋,k8s-uat集群部署業(yè)務(wù)會(huì)失敗,上rancher上看下pod狀態(tài)發(fā)現(xiàn)創(chuàng)建失敗旋讹,隨后展開了排查之路,今日在此記錄: 首先通過報(bào)錯(cuò)...
問題: 上周開始公司托管在IDC機(jī)房的一臺(tái)服務(wù)器頻繁掉線轿衔,導(dǎo)致ssh連接不上沉迹,過幾分鐘又恢復(fù)。通過監(jiān)控查看害驹,沒有什么有價(jià)值的結(jié)果鞭呕,因?yàn)槭菍?duì)公網(wǎng)I...
切換成最近30分鐘 排查過程:客戶端,prometheus 時(shí)區(qū)都是正常時(shí)間宛官,并且可以獲取到當(dāng)前數(shù)據(jù)葫松。一個(gè)模板下只有個(gè)別圖是這個(gè)情況,延遲30分...
二進(jìn)制搭建的k8s集群底洗。查看pod日志時(shí)腋么,報(bào)權(quán)限錯(cuò)誤 這個(gè)錯(cuò)誤是說 kube-apiserver這個(gè)用戶沒有權(quán)限查看日志,我們要給這個(gè)用戶一個(gè)a...
再刪除pod的時(shí)候亥揖,卡在了終端珊擂,一直terminating狀態(tài)》驯洌可執(zhí)行以下命令強(qiáng)制刪除
kubectl get pods -n kube-systemUnable to connect to the server: x509: ce...
禁用NetworkManager 1摧扇、systemctl stop NetworkManager 2、systemctl disable Net...