Linux系統中查殺殭屍進程方法介紹

在UNIX 系統中,一個進程結束了,但是他的父進程沒有等待(調用wait / waitpid)他, 那麼他將變成一個殭屍進程. 在fork()/execve()過程中,假設子進程結束時父進程仍存在,而父進程fork()之前既沒安裝SIGCHLD信號處理函數調用 waitpid()等待子進程結束,又沒有顯式忽略該信號,則子進程成爲殭屍進程。

Linux系統中查殺殭屍進程方法介紹

一個進程在調用exit命令結束自己的生命的時候,其實它並沒有真正的被銷燬, 而是留下一個稱爲殭屍進程(Zombie)的數據結構(系統調用exit,它的作用是 使進程退出,但也僅僅限於將一個正常的進程變成一個殭屍進程,並不能將其完全銷燬)

進程的危害

由於子進程的結束和父進程的運行是一個異步過程,即父進程永遠無法預測子進程 到底什麼時候結束. 那麼會不會因爲父進程太忙來不及wait子進程,或者說不知道 子進程什麼時候結束,而丟失子進程結束時的狀態信息呢? 不會。因爲UNⅨ提供了一種機制可以保證只要父進程想知道子進程結束時的狀態信息, 就可以得到。這種機制就是: 在每個進程退出的時候,內核釋放該進程所有的資源,包括打開的文件,佔用的.內存等。但是仍然爲其保留一定的信息(包括進程號the process ID,退出狀態the termination status of the process,運行時間the amount of CPU time taken by the process等)。直到父進程通過wait / waitpid來取時才釋放. 但這樣就導致了問題,如果進程不調用wait / waitpid的話,那麼保留的那段信息就不會釋放,其進程號就會一直被佔用,但是系統所能使用的進程號是有限的,如果大量的產生僵死進程,將因爲沒有可用的進程號而導致系統不能產生新的進程. 此即爲殭屍進程的危害,應當避免。

1、如何查看殭屍進程?

如何查看linux系統上的殭屍進程,如何統計有多少殭屍進程?

#ps -ef | grep defunct

或者查找狀態爲Z的進程,Z就是代表zombie process,殭屍進程的意思。

另外使用top命令查看時有一欄爲S,如果狀態爲Z說明它就是殭屍進程。

Tasks: 95 total, 1 running, 94 sleeping, 0 stopped, 0 zombie

top命令中也統計了殭屍進程。或者使用下面的命令:

ps -ef | grep defunct | grep -v grep | wc -l

2、如何殺死殭屍進程?

一般殭屍進程很難直接kill掉,不過您可以kill殭屍爸爸。父進程死後,殭屍進程成爲”孤兒進程”,過繼給1號進程init,init始終會負責清理殭屍進程.它產生的所有殭屍進程也跟着消失。

ps -e -o ppid,stat | grep Z | cut –d” ” -f2 | xargs kill -9

kill -HUP `ps -A -ostat,ppid | grep -e ’^[Zz]‘ | awk ’{print $2}’`

當然您可以自己編寫更好的shell腳本,歡迎與大家分享。

另外子進程死後,會發送SIGCHLD信號給父進程,父進程收到此信號後,執行waitpid()函數爲子進程收屍。就是基於這樣的原理:就算父進程沒有調用wait,內核也會向它發送SIGCHLD消息,而此時,儘管對它的默認處理是忽略,如果想響應這個消息,可以設置一個處理函數。

3、如何避免殭屍進程?

處理SIGCHLD信號並不是必須的。但對於某些進程,特別是服務器進程往往在請求到來時生成子進程處理請求。如果父進程不等待子進程結 束,子進程將成爲殭屍進程(zombie)從而佔用系統資源。如果父進程等待子進程結束,將增加父進程的負擔,影響服務器進程的併發性能。在Linux下 可以簡單地將 SIGCHLD信號的操作設爲SIG_IGN。

signal(SIGCHLD,SIG_IGN);

這樣,內核在子進程結束時不會產生殭屍進程。這一點與BSD4不同,BSD4下必須顯式等待子進程結束才能釋放殭屍進程;或者用兩次fork(),而且使緊跟的子進程直接退出,是的孫子進程成爲孤兒進程,從而init進程將負責清除這個孤兒進程。