在fork()/execve()過程中,假設子進程結束時父進程仍存在,而父進程fork()之前既沒安裝SIGCHLD信號處理函數調用
waitpid()等待子進程結束,又沒有顯式忽略該信號,則子進程成為僵尸進程,無法正常結束,此時即使是root身份kill-9也不能殺死僵尸進
程。補救辦法是殺死僵尸進程的父進程(僵尸進程的父進程必然存在),僵尸進程成為"孤兒進程",過繼給1號進程init,init始終會負責清理僵尸進
程。
僵尸進程是指的父進程已經退出,而該進程dead之后沒有進程接受,就成為僵尸進程.(zombie)進程
怎樣產生僵尸進程的:
一個進程在調用exit命令結束自己的生命的時候,其實它并沒有真正的被銷毀,而是留下一個稱為僵尸進程(Zombie)的數據結構(系統調用
exit,它的作用是使進程退出,但也僅僅限于將一個正常的進程變成一個僵尸進程,并不能將其完全銷毀)。在Linux進程的狀態中,僵尸進程是非常特殊的一種,它已經放棄了幾乎所有內存空間,沒有任何可執行代碼,也不能被調度,僅僅在進程列表中保留一個位置,記載該進程的退出狀態等信息供其他進程收集,除此之外,僵尸進程不再占有任何內存空間。它需要它的父進程來為它收尸,如果他的父進程沒安裝SIGCHLD信號處理函數調用wait或waitpid()等待子進程結束,又沒有顯式忽略該信號,那么它就一直保持僵尸狀態,如果這時父進程結束了,那么init進程自動會接手這個子進程,為它收尸,它還是能被清除的。但是如果如果父進程是一個循環,不會結束,那么子進程就會一直保持僵尸狀態,這就是為什么系統中有時會有很多的僵尸進程。
Linux系統對運行的進程數量有限制,如果產生過多的僵尸進程占用了可用的進程號,將會導致新的進程無法生成。這就是僵尸進程對系統的最大危害。
僵尸進程實例:
/*-----zombie1.c-----*/
#include "sys/types.h"
#include "sys/wait.h"
#include "stdio.h"
#include "unistd.h"
int main(int argc, char* argv[])
{
while(1)
{
pid_t chi = fork();
if(chi == 0)
{
execl("/bin/bash","bash","-c","ls",NULL);
}
sleep(2);
}
會不停地產生僵死進程ls;
/*-----zombie2.c-----*/
#include <stdio.h>
#include<sys/types.h>
main()
{
if(!fork())
{
printf("child pid=%d\n", getpid());
exit(0);
}
/*wait();*/
/*waitpid(-1,NULL,0);*/
sleep(60);
printf("parent pid=%d \n", getpid());
exit(0);
}
60s內會不斷產生僵尸進程,直到父進程exit(0);
如果在調用wait/waitpid來為子進程收尸,就不會產生僵尸進程了。
PS:運行例子,先gcc zombie1.c -o zombie編譯,然后運行zombie;
然后可以可用ps -ef來查看是否產生了僵尸進程。
怎么查看僵尸進程:
利用命令ps,可以看到有標記為Z的進程就是僵尸進程。
怎樣來清除僵尸進程:
1.改寫父進程,在子進程死后要為它收尸。具體做法是接管SIGCHLD信號。子進程死后,會發送SIGCHLD信號給父進程,父進程收到此信
號后,執行
waitpid()函數為子進程收尸。這是基于這樣的原理:就算父進程沒有調用wait,內核也會向它發送SIGCHLD消息,盡管對的默認處理是忽略,
如果想響應這個消息,可以設置一個處理函數。
2.把父進程殺掉。父進程死后,僵尸進程成為"孤兒進程",過繼給1號進程init,init始終會負責清理僵尸進程.它產生的所有僵尸進程也跟著消失
在Linux中可以用
ps auwx
發現僵尸進程
a all w/ tty, including other users 所有窗口和終端,包括其他用戶的進程
u user-oriented 面向用戶(用戶友好)
-w,w wide output 寬格式輸出
x processes w/o controlling ttys
在僵尸進程后面 會標注
ps axf
看進程樹,以樹形方式現實進程列表
ps axm
會把線程列出來,在linux下進程和線程是統一的,是輕量級進程的兩種方式。
ps axu
顯示進程的詳細狀態
killall
kill -15
kill -9
一般都不能殺掉 defunct進程
用了kill -15,kill -9以后 之后反而會多出更多的僵尸進程
kill -kill pid
fuser -k pid
可以考慮殺死他的parent process,
kill -9 他的parent process
=========================================== 一個已經終止,但是其父進程尚未對其進行善后處理(獲取終止子進程的有關信息、釋放它仍占用的資源)的進程被稱為僵死進程(Zombie Process)。
避免zombie的方法:
1)在SVR4中,如果調用signal或sigset將SIGCHLD的配置設置為忽略,則不會產生僵死子進程。另外,使用SVR4版的 sigaction,則可設置SA_NOCLDWAIT標志以避免子進程僵死。
Linux中也可使用這個,在一個程序的開始調用這個函數
signal(SIGCHLD,SIG_IGN);
2)調用fork兩次。程序8 - 5 實現了這一點。
3)用waitpid等待子進程返回.
===========================================
zombie進程是僵死進程。防止它的辦法,一是用wait,waitpid之類的函數獲得進程的終止狀態,以釋放資源。另一個是fork兩次
===========================================
defunct進程只是在process table里還有一個記錄,其他的資源沒有占用,除非你的系統的process個數的限制已經快超過了,zombie進程不會有更多的壞處。
可能唯一的方法就是reboot系統可以消除zombie進程。
===========================================
任何程序都有僵尸狀態,它占用一點內存資源(也就是進程表里還有一個記錄),僅僅是表象而已不必害怕。如果程序有問題有機會遇見,解決大批量僵尸簡單有效的辦法是重起。kill是無任何效果的
fork與zombie/defunct"
在Unix下的一些進程的運作方式。當一個進程死亡時,它并不是完全的消失了。進程終止,它不再運行,但是還有一些殘留的小東西等待父進程收
回。這些殘留的東西包括子進程的返回值和其他的一些東西。當父進程 fork()一個子進程后,它必須用 wait() 或者 waitpid()
等待子進程退出。正是這個 wait() 動作來讓子進程的殘留物消失。
自然的,在上述規則之外有個例外:父進程可以忽略 SIGCLD 軟中斷而不必要 wait()??梢赃@樣做到(在支持它的系統上,比如Linux):
main()
{
signal(SIGCLD, SIG_IGN); /* now I don't have to wait()! */
fork();
fork();
fork(); /* Rabbits, rabbits, rabbits! */
?。?/p>
現在,子進程死亡時父進程沒有 wait(),通常用 ps 可以看到它被顯示為“”。它將永遠保持這樣 直到 父進程 wait(),或者按以下方法處理。
這里是你必須知道的另一個規則:當父進程在它wait()子進程之前死亡了(假定它沒有忽略 SIGCLD),子進程將把
init(pid1)進程作為它的父進程。如果子進程工作得很好并能夠控制,這并不是問題。但如果子進程已經是defunct,我們就有了一點小麻煩。
看,原先的父進程不可能再 wait(),因為它已經消亡了。這樣,init 怎么知道 wait() 這些zombie 進程。
答案:不可預料的。在一些系統上,init周期性的破壞掉它所有的defunct進程。在另外一些系統中,它干脆拒絕成為任何defunct進
程的父進程,而是馬上毀滅它們。如果你使用上述系統的一種,可以寫一個簡單的循環,用屬于init的defunct進程填滿進程表。這大概不會令你的系統
管理員很高興吧?
你的任務:確定你的父進程不要忽略 SIGCLD,也不要 wait() 它 fork() 的所有進程。不過,你也未必
要總是這樣做(比如,你要起一個 daemon 或是別的什么東西),但是你必須小心編程,如果你是一個
fork()的新手。另外,也不要在心理上有任何束縛。
總結:
子進程成為 defunct 直到父進程 wait(),除非父進程忽略了 SIGCLD 。
更進一步,父進程沒有 wait() 就消亡(仍假設父進程沒有忽略 SIGCLD )的子進程(活動的或者 defunct)成為 init 的子進程,init 用重手法處理它們。
from:
http://linux.chinaitlab.com/administer/818916.html
posted on 2010-08-26 17:09
chatler 閱讀(659)
評論(0) 編輯 收藏 引用 所屬分類:
Linux_Coding