作為系統(tǒng)調(diào)用而言,_exit和exit是一對孿生兄弟,它們究竟相似到什么程度,我們可以從Linux的源碼中找到答案:
#define __NR__exit __NR_exit /* 摘自文件include/asm-i386/unistd.h第334行 */
|
"__NR_"是在Linux的源碼中為每個系統(tǒng)調(diào)用加上的前綴,請注意第一個exit前有2條下劃線,第二個exit前只有1條下劃線。
這時隨便一個懂得C語言并且頭腦清醒的人都會說,_exit和exit沒有任何區(qū)別,但我們還要講一下這兩者之間的區(qū)別,這種區(qū)別主要體現(xiàn)在它們在函數(shù)庫中的定義。_exit在Linux函數(shù)庫中的原型是:
#i nclude<unistd.h>
void _exit(int status);
|
和exit比較一下,exit()函數(shù)定義在stdlib.h中,而_exit()定義在unistd.h中,從名字上看,stdlib.h似乎比unistd.h高級一點,那么,它們之間到底有什么區(qū)別呢?讓我們先來看流程圖,通過下圖,我們會對這兩個系統(tǒng)調(diào)用的執(zhí)行過程產(chǎn)生一個較為直觀的認識。
從圖中可以看出,_exit()函數(shù)的作用最為簡單:直接使進程停止運行,清除其使用的內(nèi)存空間,并銷毀其在內(nèi)核中的各種數(shù)據(jù)結(jié)構(gòu);exit()函數(shù)則在這些基礎(chǔ)上作了一些包裝,在執(zhí)行退出之前加了若干道工序,也是因為這個原因,有些人認為exit已經(jīng)不能算是純粹的系統(tǒng)調(diào)用。
exit()函數(shù)與_exit()函數(shù)最大的區(qū)別就在于exit()函數(shù)在調(diào)用exit系統(tǒng)調(diào)用之前要檢查文件的打開情況,把文件緩沖區(qū)中的內(nèi)容寫回文件,就是圖中的"清理I/O緩沖"一項。
在Linux的標準函數(shù)庫中,有一套稱作"高級I/O"的函數(shù),我們熟知的printf()、fopen()、fread()、fwrite()都在此列,它們也被稱作"緩沖I/O(buffered I/O)",其特征是對應(yīng)每一個打開的文件,在內(nèi)存中都有一片緩沖區(qū),每次讀文件時,會多讀出若干條記錄,這樣下次讀文件時就可以直接從內(nèi)存的緩沖區(qū)中讀取,每次寫文件的時候,也僅僅是寫入內(nèi)存中的緩沖區(qū),等滿足了一定的條件(達到一定數(shù)量,或遇到特定字符,如換行符和文件結(jié)束符EOF),再將緩沖區(qū)中的內(nèi)容一次性寫入文件,這樣就大大增加了文件讀寫的速度,但也為我們編程帶來了一點點麻煩。如果有一些數(shù)據(jù),我們認為已經(jīng)寫入了文件,實際上因為沒有滿足特定的條件,它們還只是保存在緩沖區(qū)內(nèi),這時我們用_exit()函數(shù)直接將進程關(guān)閉,緩沖區(qū)中的數(shù)據(jù)就會丟失,反之,如果想保證數(shù)據(jù)的完整性,就一定要使用exit()函數(shù)。
請看以下例程:
/* exit2.c */
#i nclude<stdlib.h>
main()
{
printf("output begin
");
printf("content in buffer");
exit(0);
}
|
編譯并運行:
$gcc exit2.c -o exit2
$./exit2
output begin
content in buffer
/* _exit1.c */
#i nclude<unistd.h>
main()
{
printf("output begin
");
printf("content in buffer");
_exit(0);
}
|
編譯并運行:
$gcc _exit1.c -o _exit1
$./_exit1
output begin
|
在Linux中,標準輸入和標準輸出都是作為文件處理的,雖然是一類特殊的文件,但從程序員的角度來看,它們和硬盤上存儲數(shù)據(jù)的普通文件并沒有任何區(qū)別。與所有其他文件一樣,它們在打開后也有自己的緩沖區(qū)。
請讀者結(jié)合前面的敘述,思考一下為什么這兩個程序會得出不同的結(jié)果。相信如果您理解了我前面所講的內(nèi)容,會很容易的得出結(jié)論。
在這篇文章中,我們對Linux的進程管理作了初步的了解,并在此基礎(chǔ)上學(xué)習(xí)了getpid、fork、exit和_exit四個系統(tǒng)調(diào)用。在下一篇文章中,我們將學(xué)習(xí)與Linux進程管理相關(guān)的其他系統(tǒng)調(diào)用,并將作一些更深入的探討。
前面的文章中,我們已經(jīng)了解了父進程和子進程的概念,并已經(jīng)掌握了系統(tǒng)調(diào)用exit的用法,但可能很少有人意識到,在一個進程調(diào)用了exit之后,該進程并非馬上就消失掉,而是留下一個稱為僵尸進程(Zombie)的數(shù)據(jù)結(jié)構(gòu)。在Linux進程的5種狀態(tài)中,僵尸進程是非常特殊的一種,它已經(jīng)放棄了幾乎所有內(nèi)存空間,沒有任何可執(zhí)行代碼,也不能被調(diào)度,僅僅在進程列表中保留一個位置,記載該進程的退出狀態(tài)等信息供其他進程收集,除此之外,僵尸進程不再占有任何內(nèi)存空間。從這點來看,僵尸進程雖然有一個很酷的名字,但它的影響力遠遠抵不上那些真正的僵尸兄弟,真正的僵尸總能令人感到恐怖,而僵尸進程卻除了留下一些供人憑吊的信息,對系統(tǒng)毫無作用。
也許讀者們還對這個新概念比較好奇,那就讓我們來看一眼Linux里的僵尸進程究竟長什么樣子。
當一個進程已退出,但其父進程還沒有調(diào)用系統(tǒng)調(diào)用wait(稍后介紹)對其進行收集之前的這段時間里,它會一直保持僵尸狀態(tài),利用這個特點,我們來寫一個簡單的小程序:
/* zombie.c */
#i nclude
#i nclude
main()
{
pid_t pid;
pid=fork();
if(pid<0) /* 如果出錯 */
printf("error occurred!n");
else if(pid==0) /* 如果是子進程 */
exit(0);
else /* 如果是父進程 */
sleep(60); /* 休眠60秒,這段時間里,父進程什么也干不了 */
wait(NULL); /* 收集僵尸進程 */
}
|
sleep的作用是讓進程休眠指定的秒數(shù),在這60秒內(nèi),子進程已經(jīng)退出,而父進程正忙著睡覺,不可能對它進行收集,這樣,我們就能保持子進程60秒的僵尸狀態(tài)。
編譯這個程序:
后臺運行程序,以使我們能夠執(zhí)行下一條命令:
列一下系統(tǒng)內(nèi)的進程:
$ ps -ax
... ...
1177 pts/0 S 0:00 -bash
1577 pts/0 S 0:00 ./zombie
1578 pts/0 Z 0:00 [zombie ]
1579 pts/0 R 0:00 ps -ax
|
沒有出現(xiàn)Z的zombie
看到中間的"Z"了嗎?那就是僵尸進程的標志,它表示1578號進程現(xiàn)在就是一個僵尸進程。
我們已經(jīng)學(xué)習(xí)了系統(tǒng)調(diào)用exit,它的作用是使進程退出,但也僅僅限于將一個正常的進程變成一個僵尸進程,并不能將其完全銷毀。僵尸進程雖然對其他進程幾乎沒有什么影響,不占用CPU時間,消耗的內(nèi)存也幾乎可以忽略不計,但有它在那里呆著,還是讓人覺得心里很不舒服。而且Linux系統(tǒng)中進程數(shù)目是有限制的,在一些特殊的情況下,如果存在太多的僵尸進程,也會影響到新進程的產(chǎn)生。那么,我們該如何來消滅這些僵尸進程呢?
先來了解一下僵尸進程的來由,我們知道,Linux和UNIX總有著剪不斷理還亂的親緣關(guān)系,僵尸進程的概念也是從UNIX上繼承來的,而UNIX的先驅(qū)們設(shè)計這個東西并非是因為閑來無聊想煩煩其他的程序員。僵尸進程中保存著很多對程序員和系統(tǒng)管理員非常重要的信息,首先,這個進程是怎么死亡的?是正常退出呢,還是出現(xiàn)了錯誤,還是被其它進程強迫退出的?其次,這個進程占用的總系統(tǒng)CPU時間和總用戶CPU時間分別是多少?發(fā)生頁錯誤的數(shù)目和收到信號的數(shù)目。這些信息都被存儲在僵尸進程中,試想如果沒有僵尸進程,進程一退出,所有與之相關(guān)的信息都立刻歸于無形,而此時程序員或系統(tǒng)管理員需要用到,就只好干瞪眼了。
那么,我們?nèi)绾问占@些信息,并終結(jié)這些僵尸進程呢?就要靠我們下面要講到的waitpid調(diào)用和wait調(diào)用。這兩者的作用都是收集僵尸進程留下的信息,同時使這個進程徹底消失。下面就對這兩個調(diào)用分別作詳細介紹。