由于業(yè)務(wù)問題把ceph的集群進(jìn)行調(diào)整,當(dāng)時(shí)某一host因內(nèi)存問題掛掉。借此機(jī)會(huì)把所有的osd直奋,down--out--purge掉。
下面還是需要把這個(gè)host添加進(jìn)集群施禾。相當(dāng)于新加一個(gè)host脚线。
同事先在host上啟動(dòng)了一個(gè)osd。并且等幾分鐘后弥搞,又添加3個(gè)osd邮绿。此時(shí)集群掛掉。
出現(xiàn)pg down
查看log
image.png
最終定位原因攀例,由于新加osd時(shí)斯碌,會(huì)在此host進(jìn)行新osd所有pg都會(huì)創(chuàng)建出來(lái)。新加的osd會(huì)添加一部分肛度,剩下的有本host上其他osd創(chuàng)建傻唾,最后轉(zhuǎn)移到新的osd上。
由于同事添并不是統(tǒng)一添加osd承耿。導(dǎo)致第一個(gè)osd上面的pg num過大冠骄。在新加osd后造成了上面的問題。導(dǎo)致pg down加袋。