僵尸進(jìn)程定義
In UNIX System terminology, a process that has terminated,but whose parent has not yet waited for it is called a zombie.
在UNIX 系統(tǒng)中,一個(gè)進(jìn)程結(jié)束了,但是他的父進(jìn)程沒(méi)有等待(調(diào)用wait / waitpid), 那么它將變成一個(gè)僵尸進(jìn)程.??在fork()/execve()過(guò)程中江滨,假設(shè)子進(jìn)程結(jié)束時(shí)父進(jìn)程仍存在窖剑,而父進(jìn)程fork()之前既沒(méi)安裝SIGCHLD信號(hào)處理函數(shù)調(diào)用 waitpid()等待子進(jìn)程結(jié)束,又沒(méi)有顯式忽略該信號(hào),則子進(jìn)程成為僵尸進(jìn)程懂牧。
如何查看linux系統(tǒng)上的僵尸進(jìn)程蝙茶,如何統(tǒng)計(jì)有多少僵尸進(jìn)程宵呛?
我們可以用top命令來(lái)查看服務(wù)器當(dāng)前是否有僵尸進(jìn)程茄厘,在下圖中可以看到僵尸進(jìn)程數(shù)的提示,如果數(shù)字大于0稠茂,那么意味著服務(wù)器當(dāng)前存在有僵尸進(jìn)程:
#ps -ef | grep defunct
#ps -ef | grep defunct | grep -v grep | wc -l
# ps -ef | grep defunct | grep -v grep | awk '{print "kill -18 " $3}'
如何殺死僵尸進(jìn)程呢柠偶?
一般僵尸進(jìn)程很難直接kill掉,不過(guò)您可以kill僵尸爸爸睬关。父進(jìn)程死后诱担,僵尸進(jìn)程成為”孤兒進(jìn)程”,過(guò)繼給1號(hào)進(jìn)程init电爹,init始終會(huì)負(fù)責(zé)清理僵尸進(jìn)程.它產(chǎn)生的所有僵尸進(jìn)程也跟著消失该肴。
子進(jìn)程死后,會(huì)發(fā)送SIGCHLD信號(hào)給父進(jìn)程藐不,父進(jìn)程收到此信號(hào)后匀哄,執(zhí)行waitpid()函數(shù)為子進(jìn)程收尸。就是基于這樣的原理:就算父進(jìn)程沒(méi)有調(diào)用wait雏蛮,內(nèi)核也會(huì)向它發(fā)送SIGCHLD消息涎嚼,而此時(shí),盡管對(duì)它的默認(rèn)處理是忽略挑秉,如果想響應(yīng)這個(gè)消息法梯,可以設(shè)置一個(gè)處理函數(shù)。
我們用ps和grep命令尋找僵尸進(jìn)程:
#?ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]'
命令注解:
-A 參數(shù)列出所有進(jìn)程
-o 自定義輸出字段 我們?cè)O(shè)定顯示字段為 stat(狀態(tài)), ppid(進(jìn)程父id), pid(進(jìn)程id),cmd(命令)這四個(gè)參數(shù)
因?yàn)闋顟B(tài)為 z或者Z的進(jìn)程為僵尸進(jìn)程立哑,所以我們使用grep抓取stat狀態(tài)為zZ進(jìn)程
運(yùn)行結(jié)果參考如下
Z 12334 12339 /path/cmd
這時(shí)夜惭,我們可以使用 kill -HUP 12339來(lái)殺掉這個(gè)僵尸進(jìn)程
運(yùn)行后,可以再次運(yùn)行ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]'來(lái)確認(rèn)是否將僵尸進(jìn)程殺死铛绰。
如果kill 子進(jìn)程的無(wú)效诈茧,可以嘗試kill 其父進(jìn)程來(lái)解決問(wèn)題,例如上面例子父進(jìn)程pid是 12334捂掰,那么我們就運(yùn)行kill -HUP 12334
一條簡(jiǎn)單的命令敢会,直接查找僵死進(jìn)程,然后將父進(jìn)程殺死
# ?ps -A -o stat,ppid,pid,cmd | grep -e '^[Zz]' | awk '{print $2}' | xargs kill -9
# ps?-e?-o?ppid,stat?|?grep?Z?|?cut?-d”?”?-f2?|?xargs?kill?-9
#?kill?-HUP ?$(ps?-A?-ostat,ppid?|?grep?-e?’^[Zz]‘?|?awk?’{print?$2}’)
如何避免僵尸進(jìn)程呢这嚣?
處理SIGCHLD信號(hào)并不是必須的鸥昏,但對(duì)于某些進(jìn)程,特別是服務(wù)器進(jìn)程往往在請(qǐng)求到來(lái)時(shí)生成子進(jìn)程處理請(qǐng)求姐帚。
如果父進(jìn)程不等待子進(jìn)程結(jié)束吏垮,子進(jìn)程將成為僵尸進(jìn)程(zombie)從而占用系統(tǒng)資源。如果父進(jìn)程等待子進(jìn)程結(jié)束罐旗,將增加父進(jìn)程的負(fù)擔(dān)膳汪,影響服務(wù)器進(jìn)程的并發(fā)性能。
在Linux下 可以簡(jiǎn)單地將 SIGCHLD信號(hào)的操作設(shè)為SIG_IGN尤莺。
這樣旅敷,內(nèi)核在子進(jìn)程結(jié)束時(shí)不會(huì)產(chǎn)生僵尸進(jìn)程生棍。這一點(diǎn)與BSD4不同颤霎,BSD4下必須顯式等待子進(jìn)程結(jié)束才能釋放僵尸進(jìn)程。
或者用兩次fork()涂滴,而且使緊跟的子進(jìn)程直接退出友酱,是的孫子進(jìn)程成為孤兒進(jìn)程,從而init進(jìn)程將負(fù)責(zé)清除這個(gè)孤兒進(jìn)程柔纵!