作為系統調用而言,_exit和exit是一對孿生兄弟,它們究竟相似到什么程度,我們可以從Linux的源碼中找到答案:
#define __NR__exit __NR_exit /* 摘自文件include/asm-i386/unistd.h第334行 */
|
"__NR_"是在Linux的源碼中為每個系統調用加上的前綴,請注意第一個exit前有2條下劃線,第二個exit前只有1條下劃線。
這時隨便一個懂得C語言并且頭腦清醒的人都會說,_exit和exit沒有任何區別,但我們還要講一下這兩者之間的區別,這種區別主要體現在它們在函數庫中的定義。_exit在Linux函數庫中的原型是:
#i nclude<unistd.h>
void _exit(int status);
|
和exit比較一下,exit()函數定義在stdlib.h中,而_exit()定義在unistd.h中,從名字上看,stdlib.h似乎比unistd.h高級一點,那么,它們之間到底有什么區別呢?讓我們先來看流程圖,通過下圖,我們會對這兩個系統調用的執行過程產生一個較為直觀的認識。
從圖中可以看出,_exit()函數的作用最為簡單:直接使進程停止運行,清除其使用的內存空間,并銷毀其在內核中的各種數據結構;exit()函數則在這些基礎上作了一些包裝,在執行退出之前加了若干道工序,也是因為這個原因,有些人認為exit已經不能算是純粹的系統調用。
exit()函數與_exit()函數最大的區別就在于exit()函數在調用exit系統調用之前要檢查文件的打開情況,把文件緩沖區中的內容寫回文件,就是圖中的"清理I/O緩沖"一項。
在Linux的標準函數庫中,有一套稱作"高級I/O"的函數,我們熟知的printf()、fopen()、fread()、fwrite()都在此列,它們也被稱作"緩沖I/O(buffered I/O)",其特征是對應每一個打開的文件,在內存中都有一片緩沖區,每次讀文件時,會多讀出若干條記錄,這樣下次讀文件時就可以直接從內存的緩沖區中讀取,每次寫文件的時候,也僅僅是寫入內存中的緩沖區,等滿足了一定的條件(達到一定數量,或遇到特定字符,如換行符和文件結束符EOF),再將緩沖區中的內容一次性寫入文件,這樣就大大增加了文件讀寫的速度,但也為我們編程帶來了一點點麻煩。如果有一些數據,我們認為已經寫入了文件,實際上因為沒有滿足特定的條件,它們還只是保存在緩沖區內,這時我們用_exit()函數直接將進程關閉,緩沖區中的數據就會丟失,反之,如果想保證數據的完整性,就一定要使用exit()函數。
請看以下例程:
/* exit2.c */
#i nclude<stdlib.h>
main()
{
printf("output begin
");
printf("content in buffer");
exit(0);
}
|
編譯并運行:
$gcc exit2.c -o exit2
$./exit2
output begin
content in buffer
/* _exit1.c */
#i nclude<unistd.h>
main()
{
printf("output begin
");
printf("content in buffer");
_exit(0);
}
|
編譯并運行:
$gcc _exit1.c -o _exit1
$./_exit1
output begin
|
在Linux中,標準輸入和標準輸出都是作為文件處理的,雖然是一類特殊的文件,但從程序員的角度來看,它們和硬盤上存儲數據的普通文件并沒有任何區別。與所有其他文件一樣,它們在打開后也有自己的緩沖區。
請讀者結合前面的敘述,思考一下為什么這兩個程序會得出不同的結果。相信如果您理解了我前面所講的內容,會很容易的得出結論。
在這篇文章中,我們對Linux的進程管理作了初步的了解,并在此基礎上學習了getpid、fork、exit和_exit四個系統調用。在下一篇文章中,我們將學習與Linux進程管理相關的其他系統調用,并將作一些更深入的探討。
前面的文章中,我們已經了解了父進程和子進程的概念,并已經掌握了系統調用exit的用法,但可能很少有人意識到,在一個進程調用了exit之后,該進程并非馬上就消失掉,而是留下一個稱為僵尸進程(Zombie)的數據結構。在Linux進程的5種狀態中,僵尸進程是非常特殊的一種,它已經放棄了幾乎所有內存空間,沒有任何可執行代碼,也不能被調度,僅僅在進程列表中保留一個位置,記載該進程的退出狀態等信息供其他進程收集,除此之外,僵尸進程不再占有任何內存空間。從這點來看,僵尸進程雖然有一個很酷的名字,但它的影響力遠遠抵不上那些真正的僵尸兄弟,真正的僵尸總能令人感到恐怖,而僵尸進程卻除了留下一些供人憑吊的信息,對系統毫無作用。
也許讀者們還對這個新概念比較好奇,那就讓我們來看一眼Linux里的僵尸進程究竟長什么樣子。
當一個進程已退出,但其父進程還沒有調用系統調用wait(稍后介紹)對其進行收集之前的這段時間里,它會一直保持僵尸狀態,利用這個特點,我們來寫一個簡單的小程序:
/* zombie.c */
#i nclude
#i nclude
main()
{
pid_t pid;
pid=fork();
if(pid<0) /* 如果出錯 */
printf("error occurred!n");
else if(pid==0) /* 如果是子進程 */
exit(0);
else /* 如果是父進程 */
sleep(60); /* 休眠60秒,這段時間里,父進程什么也干不了 */
wait(NULL); /* 收集僵尸進程 */
}
|
sleep的作用是讓進程休眠指定的秒數,在這60秒內,子進程已經退出,而父進程正忙著睡覺,不可能對它進行收集,這樣,我們就能保持子進程60秒的僵尸狀態。
編譯這個程序:
后臺運行程序,以使我們能夠執行下一條命令:
列一下系統內的進程:
$ ps -ax
... ...
1177 pts/0 S 0:00 -bash
1577 pts/0 S 0:00 ./zombie
1578 pts/0 Z 0:00 [zombie ]
1579 pts/0 R 0:00 ps -ax
|
沒有出現Z的zombie
看到中間的"Z"了嗎?那就是僵尸進程的標志,它表示1578號進程現在就是一個僵尸進程。
我們已經學習了系統調用exit,它的作用是使進程退出,但也僅僅限于將一個正常的進程變成一個僵尸進程,并不能將其完全銷毀。僵尸進程雖然對其他進程幾乎沒有什么影響,不占用CPU時間,消耗的內存也幾乎可以忽略不計,但有它在那里呆著,還是讓人覺得心里很不舒服。而且Linux系統中進程數目是有限制的,在一些特殊的情況下,如果存在太多的僵尸進程,也會影響到新進程的產生。那么,我們該如何來消滅這些僵尸進程呢?
先來了解一下僵尸進程的來由,我們知道,Linux和UNIX總有著剪不斷理還亂的親緣關系,僵尸進程的概念也是從UNIX上繼承來的,而UNIX的先驅們設計這個東西并非是因為閑來無聊想煩煩其他的程序員。僵尸進程中保存著很多對程序員和系統管理員非常重要的信息,首先,這個進程是怎么死亡的?是正常退出呢,還是出現了錯誤,還是被其它進程強迫退出的?其次,這個進程占用的總系統CPU時間和總用戶CPU時間分別是多少?發生頁錯誤的數目和收到信號的數目。這些信息都被存儲在僵尸進程中,試想如果沒有僵尸進程,進程一退出,所有與之相關的信息都立刻歸于無形,而此時程序員或系統管理員需要用到,就只好干瞪眼了。
那么,我們如何收集這些信息,并終結這些僵尸進程呢?就要靠我們下面要講到的waitpid調用和wait調用。這兩者的作用都是收集僵尸進程留下的信息,同時使這個進程徹底消失。下面就對這兩個調用分別作詳細介紹。