什么是僵尸進(jìn)程
僵尸進(jìn)程是指它的父進(jìn)程已經(jīng)退出(父進(jìn)程沒有等待(調(diào)用wait/waitpid)它),而該進(jìn)程dead之后沒有進(jìn)程接受,就成為僵尸進(jìn)程,也就是(zombie)進(jìn)程。
僵尸進(jìn)程是怎么樣產(chǎn)生
一個(gè)進(jìn)程在調(diào)用exit命令結(jié)束自己的生命的時(shí)候,其實(shí)它并沒有真正的被銷毀,而是留下一個(gè)稱為僵尸進(jìn)程(Zombie)的數(shù)據(jù)結(jié)構(gòu)(系統(tǒng)調(diào)用exit,它的作用是使進(jìn)程退出,但也僅僅限于將一個(gè)正常的進(jìn)程變成一個(gè)僵尸進(jìn)程,并不能將其完全銷毀)。
在Linux進(jìn)程的狀態(tài)中,僵尸進(jìn)程是非常特殊的一種,它已經(jīng)放棄了幾乎所有內(nèi)存空間,沒有任何可執(zhí)行代碼,也不能被調(diào)度,僅僅在進(jìn)程列表中保留一個(gè)位置,記載該進(jìn)程的退出狀態(tài)等信息供其他進(jìn)程收集,除此之外,僵尸進(jìn)程不再占有任何內(nèi)存空間。它需要它的父進(jìn)程來為它收尸。
如果他的父進(jìn)程沒安裝SIGCHLD信號(hào)處理函數(shù)調(diào)用wait或waitpid()等待子進(jìn)程結(jié)束,又沒有顯式忽略該信號(hào),那么它就一直保持僵尸狀態(tài),如果這時(shí)父進(jìn)程結(jié)束了,那么init進(jìn)程自動(dòng)會(huì)接手這個(gè)子進(jìn)程,為它收尸,它還是能被清除的。
但是如果父進(jìn)程是一個(gè)循環(huán),不會(huì)結(jié)束,那么子進(jìn)程就會(huì)一直保持僵尸狀態(tài),這就是為什么系統(tǒng)中有時(shí)會(huì)有很多的僵尸進(jìn)程。系統(tǒng)所能使用的進(jìn)程號(hào)是有限的,如果大量的產(chǎn)生僵死進(jìn)程,將因?yàn)闆]有可用的進(jìn)程號(hào)而導(dǎo)致系統(tǒng)不能產(chǎn)生新的進(jìn)程.
僵尸進(jìn)程的避免
1、父進(jìn)程通過wait和waitpid等函數(shù)等待子進(jìn)程結(jié)束,這會(huì)導(dǎo)致父進(jìn)程掛起
2、如果父進(jìn)程很忙,那么可以用signal函數(shù)為SIGCHLD安裝handler,因?yàn)樽舆M(jìn)程結(jié)束后,父進(jìn)程會(huì)收到該信號(hào),可以在handler中調(diào)用wait回收
3、如果父進(jìn)程不關(guān)心子進(jìn)程什么時(shí)候結(jié)束,那么可以用signal(SIGCHLD, SIG_IGN) 通知內(nèi)核,自己對(duì)子進(jìn)程的結(jié)束不感興趣,那么子進(jìn)程結(jié)束后,內(nèi)核會(huì)回收,并不再給父進(jìn)程發(fā)送信號(hào)
4、還有一些技巧,就是fork兩次,父進(jìn)程fork一個(gè)子進(jìn)程,然后繼續(xù)工作,子進(jìn)程fork一個(gè)孫進(jìn)程后退出,那么孫進(jìn)程被init接管,孫進(jìn)程結(jié)束后,init會(huì)回收。不過子進(jìn)程的回收還要自己做。
子進(jìn)程結(jié)束后為什么要進(jìn)入僵尸狀態(tài)?
因?yàn)楦高M(jìn)程可能要取得子進(jìn)程的退出狀態(tài)等信息。
僵尸狀態(tài)是每個(gè)子進(jìn)程比經(jīng)過的狀態(tài)嗎?
任何一個(gè)子進(jìn)程(init除外)在exit()之后,并非馬上就消失掉,而是留下一個(gè)稱為僵尸進(jìn)程(Zombie)的數(shù)據(jù)結(jié)構(gòu)(它占用一點(diǎn)內(nèi)存資源,也就是進(jìn)程表里還有一個(gè)記錄),等待父進(jìn)程處理。這是每個(gè)子進(jìn)程在結(jié)束時(shí)都要經(jīng)過的階段。如果子進(jìn)程在exit()之后,父進(jìn)程沒有來得及處理,這時(shí)用ps命令就能看到子進(jìn)程的狀態(tài)是“Z”。
如果父進(jìn)程能及時(shí)處理,可能用ps命令就來不及看到子進(jìn)程的僵尸狀態(tài),但這并不等于子進(jìn)程不經(jīng)過僵尸狀態(tài)。
如果父進(jìn)程在子進(jìn)程結(jié)束之前退出,則子進(jìn)程將由init接管。init將會(huì)以父進(jìn)程的身份對(duì)僵尸狀態(tài)的子進(jìn)程進(jìn)行處理。
如何查看僵尸進(jìn)程
在linux中,利用命令ps,可以看到有標(biāo)記為Z的進(jìn)程就是僵尸進(jìn)程。
ps -ef|grep defunc可以找出僵尸進(jìn)程.
可以用ps的-l選項(xiàng),得到更詳細(xì)的進(jìn)程信息. F(Flag):一系列數(shù)字的和,表示進(jìn)程的當(dāng)前狀態(tài)。這些數(shù)字的含義為:
00:若單獨(dú)顯示,表示此進(jìn)程已被終止。
01:進(jìn)程是核心進(jìn)程的一部分,常駐于系統(tǒng)主存。如:sched、 vhand 、bdflush 等。
02:Parent is tracing process.
04:Tracing parent’s signal has stopped the process; the parent is waiting ( ptrace(S)).
10:進(jìn)程在優(yōu)先級(jí)低于或等于25時(shí),進(jìn)入休眠狀態(tài),而且不能用信號(hào)喚醒,例如在等待一個(gè)inode被創(chuàng)建時(shí)
20:進(jìn)程被裝入主存(primary memory)
40:進(jìn)程被鎖在主存,在事務(wù)完成前不能被置換
S(state of the process )
O:進(jìn)程正在處理器運(yùn)行
S:休眠狀態(tài)(sleeping)
R:等待運(yùn)行(runable)
I:空閑狀態(tài)(idle)
Z:僵尸狀態(tài)(zombie)
T:跟蹤狀態(tài)(Traced)
B:進(jìn)程正在等待更多的內(nèi)存頁
C:cpu利用率的估算值(cpu usage)
僵尸進(jìn)程清除的方法
1.改寫父進(jìn)程,在子進(jìn)程死后要為它收尸。具體做法是接管SIGCHLD信號(hào)。子進(jìn)程死后,會(huì)發(fā)送SIGCHLD信號(hào)給父進(jìn)程,父進(jìn)程收到此信號(hào)后,執(zhí)行waitpid()函數(shù)為子進(jìn)程收尸。這是基于這樣的原理:就算父進(jìn)程沒有調(diào)用wait,內(nèi)核也會(huì)向它發(fā)送SIGCHLD消息,盡管對(duì)的默認(rèn)處理是忽略,如果想響應(yīng)這個(gè)消息,可以設(shè)置一個(gè)處理函數(shù)。
SIGCHLD信號(hào):子進(jìn)程結(jié)束時(shí), 父進(jìn)程會(huì)收到這個(gè)信號(hào)。如果父進(jìn)程沒有處理這個(gè)信號(hào),也沒有等待(wait)子進(jìn)程,子進(jìn)程雖然終止,但是還會(huì)在內(nèi)核進(jìn)程表中占有表項(xiàng),這時(shí)的子進(jìn)程稱為僵尸進(jìn)程。這種情況我們應(yīng)該避免(父進(jìn)程或者忽略SIGCHILD信號(hào),或者捕捉它,或者wait它派生的子進(jìn)程,或者父進(jìn)程先終止,這時(shí)子進(jìn)程的終止自動(dòng)由init進(jìn)程來接管)。
2. kill -18 PPID (PPID是其父進(jìn)程)
這個(gè)信號(hào)是告訴父進(jìn)程,該子進(jìn)程已經(jīng)死亡了,請(qǐng)收回分配給他的資源。
SIGCONT也是一個(gè)有意思的信號(hào)。如前所述,當(dāng)進(jìn)程停止的時(shí)候,這個(gè)信號(hào)用來告訴進(jìn)程恢復(fù)運(yùn)行。該信號(hào)的有趣的地方在于:它不能被忽略或阻塞,但可以被捕獲。缺省行為是丟棄該信號(hào)。
3.終止父進(jìn)程
如果方法2不能終止,可采用終止其父進(jìn)程的方法(如果其父進(jìn)程不需要的話)父進(jìn)程死后,僵尸進(jìn)程成為”孤兒進(jìn)程”,過繼給1號(hào)進(jìn)程init,init始終會(huì)負(fù)責(zé)清理僵尸進(jìn)程.它產(chǎn)生的所有僵尸進(jìn)程也跟著消失。
先看其父進(jìn)程又無其他子進(jìn)程,如果有,可能需要先kill其他子進(jìn)程,也就是兄弟進(jìn)程。方法是:
kill –15 PID1 PID2 (PID1,PID2是僵尸進(jìn)程的父進(jìn)程的其它子進(jìn)程)。
然后再kill父進(jìn)程:kill –15 PPID
這樣僵尸進(jìn)程就可能被完全殺掉了。
Popularity: 3% [?]