什么是僵尸進程
僵尸進程是指它的父進程已經退出(父進程沒有等待(調用wait/waitpid)它),而該進程dead之后沒有進程接受,就成為僵尸進程,也就是(zombie)進程。
僵尸進程是怎么樣產生
一個進程在調用exit命令結束自己的生命的時候,其實它并沒有真正的被銷毀,而是留下一個稱為僵尸進程(Zombie)的數據結構(系統調用exit,它的作用是使進程退出,但也僅僅限于將一個正常的進程變成一個僵尸進程,并不能將其完全銷毀)。
在Linux進程的狀態中,僵尸進程是非常特殊的一種,它已經放棄了幾乎所有內存空間,沒有任何可執行代碼,也不能被調度,僅僅在進程列表中保留一個位置,記載該進程的退出狀態等信息供其他進程收集,除此之外,僵尸進程不再占有任何內存空間。它需要它的父進程來為它收尸。
如果他的父進程沒安裝SIGCHLD信號處理函數調用wait或waitpid()等待子進程結束,又沒有顯式忽略該信號,那么它就一直保持僵尸狀態,如果這時父進程結束了,那么init進程自動會接手這個子進程,為它收尸,它還是能被清除的。
但是如果父進程是一個循環,不會結束,那么子進程就會一直保持僵尸狀態,這就是為什么系統中有時會有很多的僵尸進程。系統所能使用的進程號是有限的,如果大量的產生僵死進程,將因為沒有可用的進程號而導致系統不能產生新的進程.
僵尸進程的避免
1、父進程通過wait和waitpid等函數等待子進程結束,這會導致父進程掛起
2、如果父進程很忙,那么可以用signal函數為SIGCHLD安裝handler,因為子進程結束后,父進程會收到該信號,可以在handler中調用wait回收
3、如果父進程不關心子進程什么時候結束,那么可以用signal(SIGCHLD, SIG_IGN) 通知內核,自己對子進程的結束不感興趣,那么子進程結束后,內核會回收,并不再給父進程發送信號
4、還有一些技巧,就是fork兩次,父進程fork一個子進程,然后繼續工作,子進程fork一個孫進程后退出,那么孫進程被init接管,孫進程結束后,init會回收。不過子進程的回收還要自己做。
子進程結束后為什么要進入僵尸狀態?
因為父進程可能要取得子進程的退出狀態等信息。
僵尸狀態是每個子進程比經過的狀態嗎?
任何一個子進程(init除外)在exit()之后,并非馬上就消失掉,而是留下一個稱為僵尸進程(Zombie)的數據結構(它占用一點內存資源,也就是進程表里還有一個記錄),等待父進程處理。這是每個子進程在結束時都要經過的階段。如果子進程在exit()之后,父進程沒有來得及處理,這時用ps命令就能看到子進程的狀態是“Z”。
如果父進程能及時處理,可能用ps命令就來不及看到子進程的僵尸狀態,但這并不等于子進程不經過僵尸狀態。
如果父進程在子進程結束之前退出,則子進程將由init接管。init將會以父進程的身份對僵尸狀態的子進程進行處理。
如何查看僵尸進程
在linux中,利用命令ps,可以看到有標記為Z的進程就是僵尸進程。
ps -ef|grep defunc可以找出僵尸進程.
可以用ps的-l選項,得到更詳細的進程信息. F(Flag):一系列數字的和,表示進程的當前狀態。這些數字的含義為:
00:若單獨顯示,表示此進程已被終止。
01:進程是核心進程的一部分,常駐于系統主存。如:sched、 vhand 、bdflush 等。
02:Parent is tracing process.
04:Tracing parent’s signal has stopped the process; the parent is waiting ( ptrace(S)).
10:進程在優先級低于或等于25時,進入休眠狀態,而且不能用信號喚醒,例如在等待一個inode被創建時
20:進程被裝入主存(primary memory)
40:進程被鎖在主存,在事務完成前不能被置換
S(state of the process )
O:進程正在處理器運行
S:休眠狀態(sleeping)
R:等待運行(runable)
I:空閑狀態(idle)
Z:僵尸狀態(zombie)
T:跟蹤狀態(Traced)
B:進程正在等待更多的內存頁
C:cpu利用率的估算值(cpu usage)
僵尸進程清除的方法
1.改寫父進程,在子進程死后要為它收尸。具體做法是接管SIGCHLD信號。子進程死后,會發送SIGCHLD信號給父進程,父進程收到此信號后,執行waitpid()函數為子進程收尸。這是基于這樣的原理:就算父進程沒有調用wait,內核也會向它發送SIGCHLD消息,盡管對的默認處理是忽略,如果想響應這個消息,可以設置一個處理函數。
SIGCHLD信號:子進程結束時, 父進程會收到這個信號。如果父進程沒有處理這個信號,也沒有等待(wait)子進程,子進程雖然終止,但是還會在內核進程表中占有表項,這時的子進程稱為僵尸進程。這種情況我們應該避免(父進程或者忽略SIGCHILD信號,或者捕捉它,或者wait它派生的子進程,或者父進程先終止,這時子進程的終止自動由init進程來接管)。
2. kill -18 PPID (PPID是其父進程)
這個信號是告訴父進程,該子進程已經死亡了,請收回分配給他的資源。
SIGCONT也是一個有意思的信號。如前所述,當進程停止的時候,這個信號用來告訴進程恢復運行。該信號的有趣的地方在于:它不能被忽略或阻塞,但可以被捕獲。缺省行為是丟棄該信號。
3.終止父進程
如果方法2不能終止,可采用終止其父進程的方法(如果其父進程不需要的話)父進程死后,僵尸進程成為”孤兒進程”,過繼給1號進程init,init始終會負責清理僵尸進程.它產生的所有僵尸進程也跟著消失。
先看其父進程又無其他子進程,如果有,可能需要先kill其他子進程,也就是兄弟進程。方法是:
kill –15 PID1 PID2 (PID1,PID2是僵尸進程的父進程的其它子進程)。
然后再kill父進程:kill –15 PPID
這樣僵尸進程就可能被完全殺掉了。
Popularity: 3% [?]