亚洲日本在线观看,欧美一区二区三区的,亚洲大胆女人

unix環境高級編程 wait和waitpid調用

Posted on 2008-08-21 18:40 Prayer 閱讀(1374) 評論(0) 編輯收藏引用所屬分類: LINUX/UNIX/AIX

2002 年 3 月 01 日

本文介紹了Linux下的進程概念，并著重講解了與Linux進程管理相關的4個重要系統調用getpid,fork,exit和_exit，輔助一些例程說明了它們的特點和使用方法。

先看一下進程在大學課本里的標準定義：“進程是可并發執行的程序在一個數據集合上的運行過程。”這個定義非常嚴謹，而且難懂，如果你沒有一下子理解這句話，就不妨看看筆者自己的并不嚴謹的解釋。我們大家都知道，硬盤上的一個可執行文件經常被稱作程序，在Linux系統中，當一個程序開始執行后，在開始執行到執行完畢退出這段時間里，它在內存中的部分就被稱作一個進程。

當然，這個解釋并不完善，但好處是容易理解，在以下的文章中，我們將會對進程作一些更全面的認識。

回頁首

Linux進程簡介

Linux 是一個多任務的操作系統，也就是說，在同一個時間內，可以有多個進程同時執行。如果讀者對計算機硬件體系有一定了解的話，會知道我們大家常用的單CPU計算機實際上在一個時間片斷內只能執行一條指令，那么Linux是如何實現多進程同時執行的呢？原來Linux使用了一種稱為“進程調度（process scheduling）”的手段，首先，為每個進程指派一定的運行時間，這個時間通常很短，短到以毫秒為單位，然后依照某種規則，從眾多進程中挑選一個投入運行，其他的進程暫時等待，當正在運行的那個進程時間耗盡，或執行完畢退出，或因某種原因暫停，Linux就會重新進行調度，挑選下一個進程投入運行。因為每個進程占用的時間片都很短，在我們使用者的角度來看，就好像多個進程同時運行一樣了。

在Linux中，每個進程在創建時都會被分配一個數據結構，稱為進程控制塊（Process Control Block，簡稱PCB）。PCB中包含了很多重要的信息，供系統調度和進程本身執行使用，其中最重要的莫過于進程ID（process ID）了，進程ID也被稱作進程標識符，是一個非負的整數，在Linux操作系統中唯一地標志一個進程，在我們最常使用的I386架構（即PC使用的架構）上，一個非負的整數的變化范圍是0-32767，這也是我們所有可能取到的進程ID。其實從進程ID的名字就可以看出，它就是進程的身份證號碼，每個人的身份證號碼都不會相同，每個進程的進程ID也不會相同。

一個或多個進程可以合起來構成一個進程組（process group），一個或多個進程組可以合起來構成一個會話（session）。這樣我們就有了對進程進行批量操作的能力，比如通過向某個進程組發送信號來實現向該組中的每個進程發送信號。

最后，讓我們通過ps命令親眼看一看自己的系統中目前有多少進程在運行：

$ps -aux	（以下是在我的計算機上的運行結果，你的結果很可能與這不同。）
USER       PID %CPU %MEM   VSZ  RSS TTY      STAT START   TIME COMMAND
root         1  0.1  0.4  1412  520 ?        S    May15   0:04 init [3]
root         2  0.0  0.0     0    0 ?        SW   May15   0:00 [keventd]
root         3  0.0  0.0     0    0 ?        SW   May15   0:00 [kapm-idled]
root         4  0.0  0.0     0    0 ?        SWN  May15   0:00 [ksoftirqd_CPU0]
root         5  0.0  0.0     0    0 ?        SW   May15   0:00 [kswapd]
root         6  0.0  0.0     0    0 ?        SW   May15   0:00 [kreclaimd]
root         7  0.0  0.0     0    0 ?        SW   May15   0:00 [bdflush]
root         8  0.0  0.0     0    0 ?        SW   May15   0:00 [kupdated]
root         9  0.0  0.0     0    0 ?        SW<  May15   0:00 [mdrecoveryd]
root        13  0.0  0.0     0    0 ?        SW   May15   0:00 [kjournald]
root       132  0.0  0.0     0    0 ?        SW   May15   0:00 [kjournald]
root       673  0.0  0.4  1472  592 ?        S    May15   0:00 syslogd -m 0
root       678  0.0  0.8  2084 1116 ?        S    May15   0:00 klogd -2
rpc        698  0.0  0.4  1552  588 ?        S    May15   0:00 portmap
rpcuser    726  0.0  0.6  1596  764 ?        S    May15   0:00 rpc.statd
root       839  0.0  0.4  1396  524 ?        S    May15   0:00 /usr/sbin/apmd -p
root       908  0.0  0.7  2264 1000 ?        S    May15   0:00 xinetd -stayalive
root       948  0.0  1.5  5296 1984 ?        S    May15   0:00 sendmail: accepti
root       967  0.0  0.3  1440  484 ?        S    May15   0:00 gpm -t ps/2 -m /d
wnn        987  0.0  2.7  4732 3440 ?        S    May15   0:00 /usr/bin/cserver
root      1005  0.0  0.5  1584  660 ?        S    May15   0:00 crond
wnn       1025  0.0  1.9  3720 2488 ?        S    May15   0:00 /usr/bin/tserver
xfs       1079  0.0  2.5  4592 3216 ?        S    May15   0:00 xfs -droppriv -da
daemon    1115  0.0  0.4  1444  568 ?        S    May15   0:00 /usr/sbin/atd
root      1130  0.0  0.3  1384  448 tty1     S    May15   0:00 /sbin/mingetty tt
root      1131  0.0  0.3  1384  448 tty2     S    May15   0:00 /sbin/mingetty tt
root      1132  0.0  0.3  1384  448 tty3     S    May15   0:00 /sbin/mingetty tt
root      1133  0.0  0.3  1384  448 tty4     S    May15   0:00 /sbin/mingetty tt
root      1134  0.0  0.3  1384  448 tty5     S    May15   0:00 /sbin/mingetty tt
root      1135  0.0  0.3  1384  448 tty6     S    May15   0:00 /sbin/mingetty tt
root      8769  0.0  0.6  1744  812 ?        S    00:08   0:00 in.telnetd: 192.1
root      8770  0.0  0.9  2336 1184 pts/0    S    00:08   0:00 login -- lei
lei       8771  0.1  0.9  2432 1264 pts/0    S    00:08   0:00 -bash
lei       8809  0.0  0.6  2764  808 pts/0    R    00:09   0:00 ps -aux

以上除標題外，每一行都代表一個進程。在各列中，PID一列代表了各進程的進程ID，COMMAND一列代表了進程的名稱或在Shell中調用的命令行，對其他列的具體含義，我就不再作解釋，有興趣的讀者可以去參考相關書籍。

回頁首

getpid

在2.4.4版內核中，getpid是第20號系統調用，其在Linux函數庫中的原型是：

	#include<sys/types.h> /* 提供類型pid_t的定義 */
	#include<unistd.h> /* 提供函數的定義 */
	pid_t getpid(void);

getpid的作用很簡單，就是返回當前進程的進程ID，請大家看以下的例子：

/* getpid_test.c */
#include<unistd.h>
main()
{
	printf("The current process ID is %d\n",getpid());
}

細心的讀者可能注意到了，這個程序的定義里并沒有包含頭文件sys/types.h，這是因為我們在程序中沒有用到pid_t類型，pid_t類型即為進程ID的類型。事實上，在i386架構上（就是我們一般PC計算機的架構），pid_t類型是和int類型完全兼容的，我們可以用處理整形數的方法去處理pid_t類型的數據，比如，用"%d"把它打印出來。

編譯并運行程序getpid_test.c：

$gcc getpid_test.c -o getpid_test
$./getpid_test
The current process ID is 1980
（你自己的運行結果很可能與這個數字不一樣，這是很正常的。）

再運行一遍：

$./getpid_test
The current process ID is 1981

正如我們所見，盡管是同一個應用程序，每一次運行的時候，所分配的進程標識符都不相同。

回頁首

fork

在2.4.4版內核中，fork是第2號系統調用，其在Linux函數庫中的原型是：

	#include<sys/types.h> /* 提供類型pid_t的定義 */
	#include<unistd.h> /* 提供函數的定義 */
	pid_t fork(void);

只看fork的名字，可能難得有幾個人可以猜到它是做什么用的。fork系統調用的作用是復制一個進程。當一個進程調用它，完成后就出現兩個幾乎一模一樣的進程，我們也由此得到了一個新進程。據說fork的名字就是來源于這個與叉子的形狀頗有幾分相似的工作流程。

在 Linux中，創造新進程的方法只有一個，就是我們正在介紹的fork。其他一些庫函數，如system()，看起來似乎它們也能創建新的進程，如果能看一下它們的源碼就會明白，它們實際上也在內部調用了fork。包括我們在命令行下運行應用程序，新的進程也是由shell調用fork制造出來的。 fork有一些很有意思的特征，下面就讓我們通過一個小程序來對它有更多的了解。

/* fork_test.c */
#include<sys/types.h>
#inlcude<unistd.h>
main()
{
	pid_t pid;
	
	/*此時僅有一個進程*/
	pid=fork();
	/*此時已經有兩個進程在同時運行*/
	if(pid<0)
		printf("error in fork!");
	else if(pid==0)
		printf("I am the child process, my process ID is %d\n",getpid());
	else
		printf("I am the parent process, my process ID is %d\n",getpid());
}

編譯并運行：

$gcc fork_test.c -o fork_test
$./fork_test
I am the parent process, my process ID is 1991
I am the child process, my process ID is 1992

看這個程序的時候，頭腦中必須首先了解一個概念：在語句pid=fork()之前，只有一個進程在執行這段代碼，但在這條語句之后，就變成兩個進程在執行了，這兩個進程的代碼部分完全相同，將要執行的下一條語句都是if(pid==0)……。

兩個進程中，原先就存在的那個被稱作“父進程”，新出現的那個被稱作“子進程”。父子進程的區別除了進程標志符（process ID）不同外，變量pid的值也不相同，pid存放的是fork的返回值。fork調用的一個奇妙之處就是它僅僅被調用一次，卻能夠返回兩次，它可能有三種不同的返回值：

在父進程中，fork返回新創建子進程的進程ID；
在子進程中，fork返回0；
如果出現錯誤，fork返回一個負值；

fork出錯可能有兩種原因：（1）當前的進程數已經達到了系統規定的上限，這時errno的值被設置為EAGAIN。（2）系統內存不足，這時errno的值被設置為ENOMEM。（關于errno的意義，請參考本系列的第一篇文章。）

fork系統調用出錯的可能性很小，而且如果出錯，一般都為第一種錯誤。如果出現第二種錯誤，說明系統已經沒有可分配的內存，正處于崩潰的邊緣，這種情況對Linux來說是很罕見的。

說到這里，聰明的讀者可能已經完全看懂剩下的代碼了，如果pid小于0，說明出現了錯誤；pid==0，就說明fork返回了0，也就說明當前進程是子進程，就去執行printf("I am the child!")，否則（else），當前進程就是父進程，執行printf("I am the parent!")。完美主義者會覺得這很冗余，因為兩個進程里都各有一條它們永遠執行不到的語句。不必過于為此耿耿于懷，畢竟很多年以前，UNIX的鼻祖們在當時內存小得無法想象的計算機上就是這樣寫程序的，以我們如今的“海量”內存，完全可以把這幾個字節的顧慮拋到九霄云外。

說到這里，可能有些讀者還有疑問：如果fork后子進程和父進程幾乎完全一樣，而系統中產生新進程唯一的方法就是fork，那豈不是系統中所有的進程都要一模一樣嗎？那我們要執行新的應用程序時候怎么辦呢？從對Linux系統的經驗中，我們知道這種問題并不存在。至于采用了什么方法，我們把這個問題留到后面具體討論。

回頁首

exit

在2.4.4版內核中，exit是第1號調用，其在Linux函數庫中的原型是：

	#include<stdlib.h>
	void exit(int status);

不像fork那么難理解，從exit的名字就能看出，這個系統調用是用來終止一個進程的。無論在程序中的什么位置，只要執行到exit系統調用，進程就會停止剩下的所有操作，清除包括PCB在內的各種數據結構，并終止本進程的運行。請看下面的程序：

/* exit_test1.c */
#include<stdlib.h>
main()
{
	printf("this process will exit!\n");
	exit(0);
	printf("never be displayed!\n");
}

編譯后運行：

$gcc exit_test1.c -o exit_test1
$./exit_test1
this process will exit!

我們可以看到，程序并沒有打印后面的"never be displayed!\n"，因為在此之前，在執行到exit(0)時，進程就已經終止了。

exit 系統調用帶有一個整數類型的參數status，我們可以利用這個參數傳遞進程結束時的狀態，比如說，該進程是正常結束的，還是出現某種意外而結束的，一般來說，0表示沒有意外的正常結束；其他的數值表示出現了錯誤，進程非正常結束。我們在實際編程時，可以用wait系統調用接收子進程的返回值，從而針對不同的情況進行不同的處理。關于wait的詳細情況，我們將在以后的篇幅中進行介紹。

回頁首

exit和_exit

作為系統調用而言，_exit和exit是一對孿生兄弟，它們究竟相似到什么程度，我們可以從Linux的源碼中找到答案：

#define __NR__exit __NR_exit /* 摘自文件include/asm-i386/unistd.h第334行 */

“__NR_”是在Linux的源碼中為每個系統調用加上的前綴，請注意第一個exit前有2條下劃線，第二個exit前只有1條下劃線。

這時隨便一個懂得C語言并且頭腦清醒的人都會說，_exit和exit沒有任何區別，但我們還要講一下這兩者之間的區別，這種區別主要體現在它們在函數庫中的定義。_exit在Linux函數庫中的原型是：

	#include<unistd.h>
	void _exit(int status);

和exit比較一下，exit()函數定義在 stdlib.h中，而_exit()定義在unistd.h中，從名字上看，stdlib.h似乎比unistd.h高級一點，那么，它們之間到底有什么區別呢？讓我們先來看流程圖，通過下圖，我們會對這兩個系統調用的執行過程產生一個較為直觀的認識。

從圖中可以看出，_exit()函數的作用最為簡單：直接使進程停止運行，清除其使用的內存空間，并銷毀其在內核中的各種數據結構；exit()函數則在這些基礎上作了一些包裝，在執行退出之前加了若干道工序，也是因為這個原因，有些人認為exit已經不能算是純粹的系統調用。

exit()函數與_exit()函數最大的區別就在于exit()函數在調用exit系統調用之前要檢查文件的打開情況，把文件緩沖區中的內容寫回文件，就是圖中的“清理I/O緩沖”一項。

在 Linux的標準函數庫中，有一套稱作“高級I/O”的函數，我們熟知的printf()、fopen()、fread()、fwrite()都在此列，它們也被稱作“緩沖I/O（buffered I/O）”，其特征是對應每一個打開的文件，在內存中都有一片緩沖區，每次讀文件時，會多讀出若干條記錄，這樣下次讀文件時就可以直接從內存的緩沖區中讀取，每次寫文件的時候，也僅僅是寫入內存中的緩沖區，等滿足了一定的條件（達到一定數量，或遇到特定字符，如換行符\n和文件結束符EOF），再將緩沖區中的內容一次性寫入文件，這樣就大大增加了文件讀寫的速度，但也為我們編程帶來了一點點麻煩。如果有一些數據，我們認為已經寫入了文件，實際上因為沒有滿足特定的條件，它們還只是保存在緩沖區內，這時我們用_exit()函數直接將進程關閉，緩沖區中的數據就會丟失，反之，如果想保證數據的完整性，就一定要使用exit()函數。

請看以下例程：

/* exit2.c */
#include<stdlib.h>
main()
{
	printf("output begin\n");
	printf("content in buffer");
	exit(0);
}

編譯并運行：

$gcc exit2.c -o exit2
$./exit2
output begin
content in buffer
/* _exit1.c */
#include<unistd.h>
main()
{
	printf("output begin\n");
	printf("content in buffer");
	_exit(0);
}

編譯并運行：

$gcc _exit1.c -o _exit1
$./_exit1
output begin

在Linux中，標準輸入和標準輸出都是作為文件處理的，雖然是一類特殊的文件，但從程序員的角度來看，它們和硬盤上存儲數據的普通文件并沒有任何區別。與所有其他文件一樣，它們在打開后也有自己的緩沖區。

請讀者結合前面的敘述，思考一下為什么這兩個程序會得出不同的結果。相信如果您理解了我前面所講的內容，會很容易的得出結論。

1.7 背景

在前面的文章中，我們已經了解了父進程和子進程的概念，并已經掌握了系統調用exit的用法，但可能很少有人意識到，在一個進程調用了exit之后，該進程并非馬上就消失掉，而是留下一個稱為僵尸進程（Zombie）的數據結構。在Linux進程的5種狀態中，僵尸進程是非常特殊的一種，它已經放棄了幾乎所有內存空間，沒有任何可執行代碼，也不能被調度，僅僅在進程列表中保留一個位置，記載該進程的退出狀態等信息供其他進程收集，除此之外，僵尸進程不再占有任何內存空間。從這點來看，僵尸進程雖然有一個很酷的名字，但它的影響力遠遠抵不上那些真正的僵尸兄弟，真正的僵尸總能令人感到恐怖，而僵尸進程卻除了留下一些供人憑吊的信息，對系統毫無作用。

也許讀者們還對這個新概念比較好奇，那就讓我們來看一眼Linux里的僵尸進程究竟長什么樣子。

當一個進程已退出，但其父進程還沒有調用系統調用wait（稍后介紹）對其進行收集之前的這段時間里，它會一直保持僵尸狀態，利用這個特點，我們來寫一個簡單的小程序：

/* zombie.c */
#include <sys/types.h>
#include <unistd.h>
main()
{
	pid_t pid;
	
	pid=fork();
	if(pid<0)	/* 如果出錯 */
		printf("error occurred!\n");
	else if(pid==0) /* 如果是子進程 */
		exit(0);
	else		/* 如果是父進程 */
		sleep(60);	/* 休眠60秒，這段時間里，父進程什么也干不了 */
		wait(NULL);	/* 收集僵尸進程 */
}

sleep的作用是讓進程休眠指定的秒數，在這60秒內，子進程已經退出，而父進程正忙著睡覺，不可能對它進行收集，這樣，我們就能保持子進程60秒的僵尸狀態。

編譯這個程序：

$ cc zombie.c -o zombie

后臺運行程序，以使我們能夠執行下一條命令

$ ./zombie &
[1] 1577

列一下系統內的進程

$ ps -ax
	...  ...
 1177 pts/0    S      0:00 -bash
 1577 pts/0    S      0:00 ./zombie
 1578 pts/0    Z      0:00 [zombie <defunct>]
 1579 pts/0    R      0:00 ps -ax

看到中間的"Z"了嗎？那就是僵尸進程的標志，它表示1578號進程現在就是一個僵尸進程。

我們已經學習了系統調用exit，它的作用是使進程退出，但也僅僅限于將一個正常的進程變成一個僵尸進程，并不能將其完全銷毀。僵尸進程雖然對其他進程幾乎沒有什么影響，不占用CPU時間，消耗的內存也幾乎可以忽略不計，但有它在那里呆著，還是讓人覺得心里很不舒服。而且Linux系統中進程數目是有限制的，在一些特殊的情況下，如果存在太多的僵尸進程，也會影響到新進程的產生。那么，我們該如何來消滅這些僵尸進程呢？

先來了解一下僵尸進程的來由，我們知道，Linux和UNIX總有著剪不斷理還亂的親緣關系，僵尸進程的概念也是從UNIX上繼承來的，而UNIX的先驅們設計這個東西并非是因為閑來無聊想煩煩其他的程序員。僵尸進程中保存著很多對程序員和系統管理員非常重要的信息，首先，這個進程是怎么死亡的？是正常退出呢，還是出現了錯誤，還是被其它進程強迫退出的？其次，這個進程占用的總系統CPU時間和總用戶CPU時間分別是多少？發生頁錯誤的數目和收到信號的數目。這些信息都被存儲在僵尸進程中，試想如果沒有僵尸進程，進程一退出，所有與之相關的信息都立刻歸于無形，而此時程序員或系統管理員需要用到，就只好干瞪眼了。

那么，我們如何收集這些信息，并終結這些僵尸進程呢？就要靠我們下面要講到的waitpid調用和wait調用。這兩者的作用都是收集僵尸進程留下的信息，同時使這個進程徹底消失。下面就對這兩個調用分別作詳細介紹。

wait的函數原型是：

		#include <sys/types.h> /* 提供類型pid_t的定義 */
	#include <sys/wait.h>
	pid_t wait(int *status)

進程一旦調用了wait，就立即阻塞自己，由wait自動分析是否當前進程的某個子進程已經退出，如果讓它找到了這樣一個已經變成僵尸的子進程，wait就會收集這個子進程的信息，并把它徹底銷毀后返回；如果沒有找到這樣一個子進程，wait就會一直阻塞在這里，直到有一個出現為止。

參數status用來保存被收集進程退出時的一些狀態，它是一個指向int類型的指針。但如果我們對這個子進程是如何死掉的毫不在意，只想把這個僵尸進程消滅掉，（事實上絕大多數情況下，我們都會這樣想），我們就可以設定這個參數為NULL，就象下面這樣：

		pid = wait(NULL);

如果成功，wait會返回被收集的子進程的進程ID，如果調用進程沒有子進程，調用就會失敗，此時wait返回-1，同時errno被置為ECHILD。

1.8.2 實戰

下面就讓我們用一個例子來實戰應用一下wait調用，程序中用到了系統調用fork，如果你對此不大熟悉或已經忘記了，請參考上一篇文章《進程管理相關的系統調用（一）》。

/* wait1.c */
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
#include <stdlib.h>
main()
{
	pid_t pc,pr;
	pc=fork();
	if(pc<0) 		/* 如果出錯 */
		printf("error ocurred!\n");
	else if(pc==0){		/* 如果是子進程 */ 
		printf("This is child process with pid of %d\n",getpid());
		sleep(10);	/* 睡眠10秒鐘 */
	}
	else{			/* 如果是父進程 */
		pr=wait(NULL);	/* 在這里等待 */
		printf("I catched a child process with pid of %d\n"),pr);
	}		
	exit(0);
}

編譯并運行:

$ cc wait1.c -o wait1
$ ./wait1
This is child process with pid of 1508
I catched a child process with pid of 1508

可以明顯注意到，在第2行結果打印出來前有10秒鐘的等待時間，這就是我們設定的讓子進程睡眠的時間，只有子進程從睡眠中蘇醒過來，它才能正常退出，也就才能被父進程捕捉到。其實這里我們不管設定子進程睡眠的時間有多長，父進程都會一直等待下去，讀者如果有興趣的話，可以試著自己修改一下這個數值，看看會出現怎樣的結果。

1.8.3 參數status

如果參數status的值不是NULL，wait就會把子進程退出時的狀態取出并存入其中，這是一個整數值（int），指出了子進程是正常退出還是被非正常結束的（一個進程也可以被其他進程用信號結束，我們將在以后的文章中介紹），以及正常結束時的返回值，或被哪一個信號結束的等信息。由于這些信息被存放在一個整數的不同二進制位中，所以用常規的方法讀取會非常麻煩，人們就設計了一套專門的宏（macro）來完成這項工作，下面我們來學習一下其中最常用的兩個：

1，WIFEXITED(status) 這個宏用來指出子進程是否為正常退出的，如果是，它會返回一個非零值。

（請注意，雖然名字一樣，這里的參數status并不同于wait唯一的參數--指向整數的指針status，而是那個指針所指向的整數，切記不要搞混了。）

2，WEXITSTATUS(status) 當WIFEXITED返回非零值時，我們可以用這個宏來提取子進程的返回值，如果子進程調用exit(5)退出，WEXITSTATUS(status) 就會返回5；如果子進程調用exit(7)，WEXITSTATUS(status)就會返回7。請注意，如果進程不是正常退出的，也就是說，WIFEXITED返回0，這個值就毫無意義。

下面通過例子來實戰一下我們剛剛學到的內容：

/* wait2.c */
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
main()
{
	int status;
	pid_t pc,pr;
	pc=fork();
	if(pc<0)	/* 如果出錯 */
		printf("error ocurred!\n");
	else if(pc==0){	/* 子進程 */
		printf("This is child process with pid of %d.\n",getpid());
		exit(3);	/* 子進程返回3 */
	}
	else{		/* 父進程 */
		pr=wait(&status);
		if(WIFEXITED(status)){	/* 如果WIFEXITED返回非零值 */
			printf("the child process %d exit normally.\n",pr);
			printf("the return code is %d.\n",WEXITSTATUS(status));
		}else			/* 如果WIFEXITED返回零 */
			printf("the child process %d exit abnormally.\n",pr);
	}
}

編譯并運行:

$ cc wait2.c -o wait2
$ ./wait2
This is child process with pid of 1538.
the child process 1538 exit normally.
the return code is 3.

父進程準確捕捉到了子進程的返回值3，并把它打印了出來。

當然，處理進程退出狀態的宏并不止這兩個，但它們當中的絕大部分在平時的編程中很少用到，就也不在這里浪費篇幅介紹了，有興趣的讀者可以自己參閱Linux man pages去了解它們的用法。

1.9 waitpid

1.9.1 簡介

waitpid系統調用在Linux函數庫中的原型是：

#include <sys/types.h> /* 提供類型pid_t的定義 */
#include <sys/wait.h>
pid_t waitpid(pid_t pid,int *status,int options)

從本質上講，系統調用waitpid和wait的作用是完全相同的，但waitpid多出了兩個可由用戶控制的參數pid和options，從而為我們編程提供了另一種更靈活的方式。下面我們就來詳細介紹一下這兩個參數：

pid

從參數的名字pid和類型pid_t中就可以看出，這里需要的是一個進程ID。但當pid取不同的值時，在這里有不同的意義。

pid>0時，只等待進程ID等于pid的子進程，不管其它已經有多少子進程運行結束退出了，只要指定的子進程還沒有結束，waitpid就會一直等下去。
pid=-1時，等待任何一個子進程退出，沒有任何限制，此時waitpid和wait的作用一模一樣。
pid=0時，等待同一個進程組中的任何子進程，如果子進程已經加入了別的進程組，waitpid不會對它做任何理睬。
pid<-1時，等待一個指定進程組中的任何子進程，這個進程組的ID等于pid的絕對值。

options

options提供了一些額外的選項來控制waitpid，目前在Linux中只支持WNOHANG和WUNTRACED兩個選項，這是兩個常數，可以用"|"運算符把它們連接起來使用，比如：

ret=waitpid(-1,NULL,WNOHANG | WUNTRACED);

如果我們不想使用它們，也可以把options設為0，如：

ret=waitpid(-1,NULL,0);

如果使用了WNOHANG參數調用waitpid，即使沒有子進程退出，它也會立即返回，不會像wait那樣永遠等下去。

而WUNTRACED參數，由于涉及到一些跟蹤調試方面的知識，加之極少用到，這里就不多費筆墨了，有興趣的讀者可以自行查閱相關材料。

看到這里，聰明的讀者可能已經看出端倪了--wait不就是經過包裝的waitpid嗎？沒錯，察看<內核源碼目錄>/include/unistd.h文件349-352行就會發現以下程序段：

static inline pid_t wait(int * wait_stat)
{
return waitpid(-1,wait_stat,0);
}

1.9.2 返回值和錯誤

waitpid的返回值比wait稍微復雜一些，一共有3種情況：

當正常返回的時候，waitpid返回收集到的子進程的進程ID；
如果設置了選項WNOHANG，而調用中waitpid發現沒有已退出的子進程可收集，則返回0；
如果調用中出錯，則返回-1，這時errno會被設置成相應的值以指示錯誤所在；

當pid所指示的子進程不存在，或此進程存在，但不是調用進程的子進程，waitpid就會出錯返回，這時errno被設置為ECHILD；

/* waitpid.c */
#include <sys/types.h>
#include <sys/wait.h>
#include <unistd.h>
main()
{
pid_t pc, pr;

pc=fork();
if(pc<0) /* 如果fork出錯 */
printf("Error occured on forking.\n");
else if(pc==0){ /* 如果是子進程 */
sleep(10); /* 睡眠10秒 */
exit(0);
}
/* 如果是父進程 */
do{
pr=waitpid(pc, NULL, WNOHANG); /* 使用了WNOHANG參數，waitpid不會在這里等待 */
if(pr==0){ /* 如果沒有收集到子進程 */
printf("No child exited\n");
sleep(1);
}
}while(pr==0); /* 沒有收集到子進程，就回去繼續嘗試 */
if(pr==pc)
printf("successfully get child %d\n", pr);
else
printf("some error occured\n");
}

編譯并運行：

$ cc waitpid.c -o waitpid
$ ./waitpid
No child exited
No child exited
No child exited
No child exited
No child exited
No child exited
No child exited
No child exited
No child exited
No child exited
successfully get child 1526

父進程經過10次失敗的嘗試之后，終于收集到了退出的子進程。

因為這只是一個例子程序，不便寫得太復雜，所以我們就讓父進程和子進程分別睡眠了10秒鐘和1秒鐘，代表它們分別作了10秒鐘和1秒鐘的工作。父子進程都有工作要做，父進程利用工作的簡短間歇察看子進程的是否退出，如退出就收集它。

http://www.ibm.com/developerworks/cn/linux/kernel/syscall/part3/index.html

只有注冊用戶登錄后才能發表評論。
【推薦】100%開源！大型工業跨平臺軟件C++源碼提供，建模，組態！

相關文章: nm命令中符號類型詳解 linux 比較兩個文件夾不同 (diff命令, md5列表) linux下提示/usr/lib64/libstdc++.so.6: version `GLIBCXX_3.4.14' not found 解決辦法 lib lib32 lib64等lib文件夾的說明 Linux程序分析工具介紹—ldd,nm 動態庫(.so)鏈接靜態庫(.a)的情況總結理清gcc、libc、libstdc++的關系 linux so 動態庫中全局變量被覆蓋問題 GCC的符號可見性——解決多個庫同名符號沖突問題鏈接與自定義函數名同名的庫函數

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

Prayer

unix環境高級編程 wait和waitpid調用

日歷

常用鏈接

留言簿(28)

隨筆分類

隨筆檔案

文章分類

UNIX

信用卡

搜索

最新評論

閱讀排行榜

評論排行榜