什么是僵尸進程
僵尸進程是指它的父進程已經(jīng)退出(父進程沒有等待(調(diào)用wait/waitpid)它),而該進程dead之后沒有進程接受,就成為僵尸進程,也就是(zombie)進程。
僵尸進程是怎么樣產(chǎn)生
一個進程在調(diào)用exit命令結(jié)束自己的生命的時候,其實它并沒有真正的被銷毀,而是留下一個稱為僵尸進程(Zombie)的數(shù)據(jù)結(jié)構(gòu)(系統(tǒng)調(diào)用exit,它的作用是使進程退出,但也僅僅限于將一個正常的進程變成一個僵尸進程,并不能將其完全銷毀)。
在Linux進程的狀態(tài)中,僵尸進程是非常特殊的一種,它已經(jīng)放棄了幾乎所有內(nèi)存空間,沒有任何可執(zhí)行代碼,也不能被調(diào)度,僅僅在進程列表中保留一個位置,記載該進程的退出狀態(tài)等信息供其他進程收集,除此之外,僵尸進程不再占有任何內(nèi)存空間。它需要它的父進程來為它收尸。
如果他的父進程沒安裝SIGCHLD信號處理函數(shù)調(diào)用wait或waitpid()等待子進程結(jié)束,又沒有顯式忽略該信號,那么它就一直保持僵尸狀態(tài),如果這時父進程結(jié)束了,那么init進程自動會接手這個子進程,為它收尸,它還是能被清除的。
但是如果父進程是一個循環(huán),不會結(jié)束,那么子進程就會一直保持僵尸狀態(tài),這就是為什么系統(tǒng)中有時會有很多的僵尸進程。系統(tǒng)所能使用的進程號是有限的,如果大量的產(chǎn)生僵死進程,將因為沒有可用的進程號而導(dǎo)致系統(tǒng)不能產(chǎn)生新的進程.
僵尸進程的避免
1、父進程通過wait和waitpid等函數(shù)等待子進程結(jié)束,這會導(dǎo)致父進程掛起
2、如果父進程很忙,那么可以用signal函數(shù)為SIGCHLD安裝handler,因為子進程結(jié)束后,父進程會收到該信號,可以在handler中調(diào)用wait回收
3、如果父進程不關(guān)心子進程什么時候結(jié)束,那么可以用signal(SIGCHLD, SIG_IGN) 通知內(nèi)核,自己對子進程的結(jié)束不感興趣,那么子進程結(jié)束后,內(nèi)核會回收,并不再給父進程發(fā)送信號
4、還有一些技巧,就是fork兩次,父進程fork一個子進程,然后繼續(xù)工作,子進程fork一個孫進程后退出,那么孫進程被init接管,孫進程結(jié)束后,init會回收。不過子進程的回收還要自己做。
子進程結(jié)束后為什么要進入僵尸狀態(tài)?
因為父進程可能要取得子進程的退出狀態(tài)等信息。
僵尸狀態(tài)是每個子進程比經(jīng)過的狀態(tài)嗎?
任何一個子進程(init除外)在exit()之后,并非馬上就消失掉,而是留下一個稱為僵尸進程(Zombie)的數(shù)據(jù)結(jié)構(gòu)(它占用一點內(nèi)存資源,也就是進程表里還有一個記錄),等待父進程處理。這是每個子進程在結(jié)束時都要經(jīng)過的階段。如果子進程在exit()之后,父進程沒有來得及處理,這時用ps命令就能看到子進程的狀態(tài)是“Z”。
如果父進程能及時處理,可能用ps命令就來不及看到子進程的僵尸狀態(tài),但這并不等于子進程不經(jīng)過僵尸狀態(tài)。
如果父進程在子進程結(jié)束之前退出,則子進程將由init接管。init將會以父進程的身份對僵尸狀態(tài)的子進程進行處理。
如何查看僵尸進程
在linux中,利用命令ps,可以看到有標記為Z的進程就是僵尸進程。
ps -ef|grep defunc可以找出僵尸進程.
可以用ps的-l選項,得到更詳細的進程信息. F(Flag):一系列數(shù)字的和,表示進程的當(dāng)前狀態(tài)。這些數(shù)字的含義為:
00:若單獨顯示,表示此進程已被終止。
01:進程是核心進程的一部分,常駐于系統(tǒng)主存。如:sched、 vhand 、bdflush 等。
02:Parent is tracing process.
04:Tracing parent’s signal has stopped the process; the parent is waiting ( ptrace(S)).
10:進程在優(yōu)先級低于或等于25時,進入休眠狀態(tài),而且不能用信號喚醒,例如在等待一個inode被創(chuàng)建時
20:進程被裝入主存(primary memory)
40:進程被鎖在主存,在事務(wù)完成前不能被置換
S(state of the process )
O:進程正在處理器運行
S:休眠狀態(tài)(sleeping)
R:等待運行(runable)
I:空閑狀態(tài)(idle)
Z:僵尸狀態(tài)(zombie)
T:跟蹤狀態(tài)(Traced)
B:進程正在等待更多的內(nèi)存頁
C:cpu利用率的估算值(cpu usage)
僵尸進程清除的方法
1.改寫父進程,在子進程死后要為它收尸。具體做法是接管SIGCHLD信號。子進程死后,會發(fā)送SIGCHLD信號給父進程,父進程收到此信號后,執(zhí)行waitpid()函數(shù)為子進程收尸。這是基于這樣的原理:就算父進程沒有調(diào)用wait,內(nèi)核也會向它發(fā)送SIGCHLD消息,盡管對的默認處理是忽略,如果想響應(yīng)這個消息,可以設(shè)置一個處理函數(shù)。
SIGCHLD信號:子進程結(jié)束時, 父進程會收到這個信號。如果父進程沒有處理這個信號,也沒有等待(wait)子進程,子進程雖然終止,但是還會在內(nèi)核進程表中占有表項,這時的子進程稱為僵尸進程。這種情況我們應(yīng)該避免(父進程或者忽略SIGCHILD信號,或者捕捉它,或者wait它派生的子進程,或者父進程先終止,這時子進程的終止自動由init進程來接管)。
2. kill -18 PPID (PPID是其父進程)
這個信號是告訴父進程,該子進程已經(jīng)死亡了,請收回分配給他的資源。
SIGCONT也是一個有意思的信號。如前所述,當(dāng)進程停止的時候,這個信號用來告訴進程恢復(fù)運行。該信號的有趣的地方在于:它不能被忽略或阻塞,但可以被捕獲。缺省行為是丟棄該信號。
3.終止父進程
如果方法2不能終止,可采用終止其父進程的方法(如果其父進程不需要的話)父進程死后,僵尸進程成為”孤兒進程”,過繼給1號進程init,init始終會負責(zé)清理僵尸進程.它產(chǎn)生的所有僵尸進程也跟著消失。
先看其父進程又無其他子進程,如果有,可能需要先kill其他子進程,也就是兄弟進程。方法是:
kill –15 PID1 PID2 (PID1,PID2是僵尸進程的父進程的其它子進程)。
然后再kill父進程:kill –15 PPID
這樣僵尸進程就可能被完全殺掉了。
Popularity: 3% [?]