??
在fork()/execve()過程中,假設子進程結束時父進程仍存在,而父進程fork()之前既沒安裝SIGCHLD信號處理函數調用
waitpid()等待子進程結束,又沒有顯式忽略該信號,則子進程成為僵尸進程,無法正常結束,此時即使是root身份kill
-9也不能殺死僵尸進程。補救辦法是殺死僵尸進程的父進程(僵尸進程的父進程必然存在),僵尸進程成為”孤兒進程”,過繼給1號進程init,init始
終會負責清理僵尸進程。
產生原因:
1.在子進程終止后到父進程調用wait()前的時間里,子進程被稱為zombie。
2.網絡原因有時會引起僵死進程。
解決方法:
1.設置SIGCLD信號為SIG_IGN,系統將不產生僵死進程。
2.用兩次fork(),而且使緊跟的子進程直接退出,是的孫子進程成為孤兒進程,從而init進程將負責清除這個孤兒進程。
wait的函數原型是:
#include /* 提供類型pid_t的定義 */
#include
pid_t wait(int *status)
進程一旦調用了wait,就立即阻塞自己,由wait自動分析是否當前進程的某個子進程已經退出,如果讓它找到了這樣一個已經變成僵尸的子進程,
wait就會收集這個子進程的信息,并把它徹底銷毀后返回;如果沒有找到這樣一個子進程,wait就會一直阻塞在這里,直到有一個出現為止。
參數status用來保存被收集進程退出時的一些狀態,它是一個指向int類型的指針。但如果我們對這個子進程是如何死掉的毫不在意,只想把這個僵尸進程消滅掉,(事實上絕大多數情況下,我們都會這樣想),我們就可以設定這個參數為NULL,就象下面這樣:
pid = wait(NULL);
如果成功,wait會返回被收集的子進程的進程ID,如果調用進程沒有子進程,調用就會失敗,此時wait返回-1,同時errno被置為ECHILD。
waitpid的函數原型是:
簡介
waitpid系統調用在Linux函數庫中的原型是:
#include /* 提供類型pid_t的定義 */
#include
pid_t waitpid(pid_t pid,int *status,int options)
從本質上講,系統調用waitpid和wait的作用是完全相同的,但waitpid多出了兩個可由用戶控制的參數pid和options,從而為我們編程提供了另一種更靈活的方式。下面我們就來詳細介紹一下這兩個參數:
● pid
從參數的名字pid和類型pid_t中就可以看出,這里需要的是一個進程ID。但當pid取不同的值時,在這里有不同的意義。
pid>0時,只等待進程ID等于pid的子進程,不管其它已經有多少子進程運行結束退出了,只要指定的子進程還沒有結束,waitpid就會一直等下去。
pid=-1時,等待任何一個子進程退出,沒有任何限制,此時waitpid和wait的作用一模一樣。
pid=0時,等待同一個進程組中的任何子進程,如果子進程已經加入了別的進程組,waitpid不會對它做任何理睬。
pid<-1時,等待一個指定進程組中的任何子進程,這個進程組的ID等于pid的絕對值。
● options
options提供了一些額外的選項來控制waitpid,目前在Linux中只支持WNOHANG和WUNTRACED兩個選項,這是兩個常數,可以用"|"運算符把它們連接起來使用,比如:
ret=waitpid(-1,NULL,WNOHANG | WUNTRACED);
如果我們不想使用它們,也可以把options設為0,如:
ret=waitpid(-1,NULL,0);
如果使用了WNOHANG參數調用waitpid,即使沒有子進程退出,它也會立即返回,不會像wait那樣永遠等下去。
而WUNTRACED參數,由于涉及到一些跟蹤調試方面的知識,加之極少用到,這里就不多費筆墨了,有興趣的讀者可以自行查閱相關材料。
看到這里,聰明的讀者可能已經看出端倪了--wait不就是經過包裝的waitpid嗎?沒錯,察看<內核源碼目錄>/include/unistd.h文件349-352行就會發現以下程序段:
static inline pid_t wait(int * wait_stat)
{
return waitpid(-1,wait_stat,0);
}
返回值和錯誤
waitpid的返回值比wait稍微復雜一些,一共有3種情況:
● 當正常返回的時候,waitpid返回收集到的子進程的進程ID;
● 如果設置了選項WNOHANG,而調用中waitpid發現沒有已退出的子進程可收集,則返回0;
● 如果調用中出錯,則返回-1,這時errno會被設置成相應的值以指示錯誤所在;
當pid所指示的子進程不存在,或此進程存在,但不是調用進程的子進程,waitpid就會出錯返回,這時errno被設置為ECHILD
其它:
調用 wait&waitpid 來處理終止的子進程:
pid_t wait(int* statloc);
pid_t waitpid(pid_t pid, int*statloc, int options);兩個函數都返回兩個值:函數的返回值和終止的子進程ID,而子進程終止的狀態則是通過statloc指針返回的。
???? wait&waitpid 的區別是顯而易見的,wait等待第一個終止的子進程,而waitpid則可以指定等待特定的子進程。這樣的區別可能會在下面這種情況時表現得更加明顯:
????????
當同時有5個客戶連上服務器,也就是說有五個子進程分別對應了5個客戶,此時,五個客戶幾乎在同時請求終止,這樣一來,幾乎同時,五個FIN發向服務器,
同樣的,五個SIGCHLD信號到達服務器,然而,UNIX的信號往往是不會排隊的,顯然這樣一來,信號處理函數將只會執行一次,殘留剩余四個子進程作為
僵尸進程駐留在內核空間。此時,正確的解決辦法是利用waitpid(-1, &stat,
WNOHANG)防止留下僵尸進程。其中的pid為-1表明等待第一個終止的子進程,而WNOHANG選擇項通知內核在沒有已終止進程項時不要阻塞。
wait&waitpid 區別
?????? waitpid提供了wait函數不能實現的3個功能:
- waitpid等待特定的子進程, 而wait則返回任一終止狀態的子進程;
- waitpid提供了一個wait的非阻塞版本;
- waitpid支持作業控制(以WUNTRACED選項).
用于檢查wait和waitpid兩個函數返回終止狀態的宏:這兩個函數返回的子進程狀態都保存在statloc指針中, 用以下3個宏可以檢查該狀態:
- WIFEXITED(status): 若為正常終止, 則為真. 此時可執行
- WEXITSTATUS(status): 取子進程傳送給exit或_exit參數的低8位.
- WIFSIGNALED(status): 若為異常終止, 則為真. 此時可執行
- WTERMSIG(status):?? 取使子進程終止的信號編號.
- WIFSTOPPED(status): 若為當前暫停子進程, 則為真. 此時可執行
WSTOPSIG(status): 取使子進程暫停的信號編號