阻塞式I/O編程有兩個(gè)特點(diǎn):

一、如果一個(gè)發(fā)現(xiàn)I\O有輸入,讀取的過(guò)程中,另外一個(gè)也有了輸入,這時(shí)候不會(huì)產(chǎn)生任何反應(yīng),也就是需要你的程序語(yǔ)句去select的時(shí)候才知道有數(shù)據(jù)輸入。

二、程序去select的時(shí)候,如果沒(méi)有數(shù)據(jù)輸入,程序會(huì)一直等待,直到有數(shù)據(jù)位置,也就是程序中無(wú)需循環(huán)和sleep。

 

Select在Socket編程中還是比較重要的,可是對(duì)于初學(xué)Socket的人來(lái)說(shuō)都不太愛(ài)用Select寫(xiě)程序,他們只是習(xí)慣寫(xiě)諸如 connect、accept、recv或recvfrom這樣的阻塞程序(所謂阻塞方式block,顧名思義,就是進(jìn)程或是線程執(zhí)行到這些函數(shù)時(shí)必須等待某個(gè)事件的發(fā)生,如果事件沒(méi)有發(fā)生,進(jìn)程或線程就被阻塞,函數(shù)不能立即返回)。可是使用Select就可以完成非阻塞(所謂非阻塞方式non- block,就是進(jìn)程或線程執(zhí)行此函數(shù)時(shí)不必非要等待事件的發(fā)生,一旦執(zhí)行肯定返回,以返回值的不同來(lái)反映函數(shù)的執(zhí)行情況,如果事件發(fā)生則與阻塞方式相同,若事件沒(méi)有發(fā)生則返回一個(gè)代碼來(lái)告知事件未發(fā)生,而進(jìn)程或線程繼續(xù)執(zhí)行,所以效率較高)方式工作的程序,它能夠監(jiān)視我們需要監(jiān)視的文件描述符的變化情況——讀寫(xiě)或是異常。下面詳細(xì)介紹一下!

Select的函數(shù)格式(我所說(shuō)的是Unix系統(tǒng)下的伯克利socket編程,和windows下的有區(qū)別,一會(huì)兒說(shuō)明):

int select(int maxfdp,fd_set *readfds,fd_set *writefds,fd_set *errorfds,struct timeval *timeout);

先說(shuō)明兩個(gè)結(jié)構(gòu)體:

第一,struct fd_set可以理解為一個(gè)集合,這個(gè)集合中存放的是文件描述符(file descriptor),即文件句柄,這可以是我們所說(shuō)的普通意義的文件,當(dāng)然Unix下任何設(shè)備、管道、FIFO等都是文件形式,全部包括在內(nèi),所以毫無(wú)疑問(wèn)一個(gè)socket就是一個(gè)文件,socket句柄就是一個(gè)文件描述符。fd_set集合可以通過(guò)一些宏由人為來(lái)操作,比如清空集合 FD_ZERO(fd_set *),將一個(gè)給定的文件描述符加入集合之中FD_SET(int ,fd_set *),將一個(gè)給定的文件描述符從集合中刪除FD_CLR(int ,fd_set*),檢查集合中指定的文件描述符是否可以讀寫(xiě)FD_ISSET(int ,fd_set* )。一會(huì)兒舉例說(shuō)明。

第二,struct timeval是一個(gè)大家常用的結(jié)構(gòu),用來(lái)代表時(shí)間值,有兩個(gè)成員,一個(gè)是秒數(shù),另一個(gè)是毫秒數(shù)。

具體解釋select的參數(shù):

int maxfdp是一個(gè)整數(shù)值,是指集合中所有文件描述符的范圍,即所有文件描述符的最大值加1,不能錯(cuò)!在Windows中這個(gè)參數(shù)的值無(wú)所謂,可以設(shè)置不正確。

fd_set *readfds是指向fd_set結(jié)構(gòu)的指針,這個(gè)集合中應(yīng)該包括文件描述符,我們是要監(jiān)視這些文件描述符的讀變化的,即我們關(guān)心是否可以從這些文件中讀取數(shù)據(jù)了,如果這個(gè)集合中有一個(gè)文件可讀,select就會(huì)返回一個(gè)大于0的值,表示有文件可讀,如果沒(méi)有可讀的文件,則根據(jù)timeout參數(shù)再判斷是否超時(shí),若超出timeout的時(shí)間,select返回0,若發(fā)生錯(cuò)誤返回負(fù)值。可以傳入NULL值,表示不關(guān)心任何文件的讀變化。

fd_set *writefds是指向fd_set結(jié)構(gòu)的指針,這個(gè)集合中應(yīng)該包括文件描述符,我們是要監(jiān)視這些文件描述符的寫(xiě)變化的,即我們關(guān)心是否可以向這些文件中寫(xiě)入數(shù)據(jù)了,如果這個(gè)集合中有一個(gè)文件可寫(xiě),select就會(huì)返回一個(gè)大于0的值,表示有文件可寫(xiě),如果沒(méi)有可寫(xiě)的文件,則根據(jù)timeout參數(shù)再判斷是否超時(shí),若超出timeout的時(shí)間,select返回0,若發(fā)生錯(cuò)誤返回負(fù)值。可以傳入NULL值,表示不關(guān)心任何文件的寫(xiě)變化。

fd_set *errorfds同上面兩個(gè)參數(shù)的意圖,用來(lái)監(jiān)視文件錯(cuò)誤異常。

struct timeval* timeout是select的超時(shí)時(shí)間,這個(gè)參數(shù)至關(guān)重要,它可以使select處于三種狀態(tài),第一,若將NULL以形參傳入,即不傳入時(shí)間結(jié)構(gòu),就是將select置于阻塞狀態(tài),一定等到監(jiān)視文件描述符集合中某個(gè)文件描述符發(fā)生變化為止;第二,若將時(shí)間值設(shè)為0秒0毫秒,就變成一個(gè)純粹的非阻塞函數(shù),不管文件描述符是否有變化,都立刻返回繼續(xù)執(zhí)行,文件無(wú)變化返回0,有變化返回一個(gè)正值;第三,timeout的值大于0,這就是等待的超時(shí)時(shí)間,即 select在timeout時(shí)間內(nèi)阻塞,超時(shí)時(shí)間之內(nèi)有事件到來(lái)就返回了,否則在超時(shí)后不管怎樣一定返回,返回值同上述。

返回值:

負(fù)值:select錯(cuò)誤 正值:某些文件可讀寫(xiě)或出錯(cuò) 0:等待超時(shí),沒(méi)有可讀寫(xiě)或錯(cuò)誤的文件

在有了select后可以寫(xiě)出像樣的網(wǎng)絡(luò)程序來(lái)!舉個(gè)簡(jiǎn)單的例子,就是從網(wǎng)絡(luò)上接受數(shù)據(jù)寫(xiě)入一個(gè)文件中。

例子:

main()

{

int sock;

FILE *fp;

struct fd_set fds;

struct timeval timeout={3,0}; //select等待3秒,3秒輪詢,要非阻塞就置0

char buffer[256]={0}; //256字節(jié)的接收緩沖區(qū)

/* 假定已經(jīng)建立UDP連接,具體過(guò)程不寫(xiě),簡(jiǎn)單,當(dāng)然TCP也同理,主機(jī)ip和port都已經(jīng)給定,要寫(xiě)的文件已經(jīng)打開(kāi)

sock=socket(...);

bind(...);

fp=fopen(...); */

while(1)

{

FD_ZERO(&fds); //每次循環(huán)都要清空集合,否則不能檢測(cè)描述符變化

FD_SET(sock,&fds); //添加描述符

FD_SET(fp,&fds); //同上

maxfdp=sock>fp?sock+1:fp+1; //描述符最大值加1

switch(select(maxfdp,&fds,&fds,NULL,&timeout)) //select使用

{

case -1: exit(-1);break; //select錯(cuò)誤,退出程序

case 0:break; //再次輪詢

default:

if(FD_ISSET(sock,&fds)) //測(cè)試sock是否可讀,即是否網(wǎng)絡(luò)上有數(shù)據(jù)

{

recvfrom(sock,buffer,256,.....);//接受網(wǎng)絡(luò)數(shù)據(jù)

if(FD_ISSET(fp,&fds)) //測(cè)試文件是否可寫(xiě)

fwrite(fp,buffer...);//寫(xiě)入文件

buffer清空;

}// end if break;

}// end switch

}//end while

}//end main

select()的機(jī)制中提供一fd_set的數(shù)據(jù)結(jié)構(gòu),實(shí)際上是一long類型的數(shù)組,
每一個(gè)數(shù)組元素都能與一打開(kāi)的文件句柄(不管是Socket句柄,還是其他
文件或命名管道或設(shè)備句柄)建立聯(lián)系,建立聯(lián)系的工作由程序員完成,
當(dāng)調(diào)用select()時(shí),由內(nèi)核根據(jù)IO狀態(tài)修改fd_set的內(nèi)容,由此來(lái)通知執(zhí)
行了select()的進(jìn)程哪一Socket或文件可讀,下面具體解釋:

#include <sys/types.h>
#include <sys/times.h>
#include <sys/select.h>

int select(nfds, readfds, writefds, exceptfds, timeout)
int nfds;
fd_set *readfds, *writefds, *exceptfds;
struct timeval *timeout;

ndfs:select監(jiān)視的文件句柄數(shù),視進(jìn)程中打開(kāi)的文件數(shù)而定,一般設(shè)為呢要監(jiān)視各文件
中的最大文件號(hào)加一。
readfds:select監(jiān)視的可讀文件句柄集合。
writefds: select監(jiān)視的可寫(xiě)文件句柄集合。
exceptfds:select監(jiān)視的異常文件句柄集合。
timeout:本次select()的超時(shí)結(jié)束時(shí)間。(見(jiàn)/usr/sys/select.h,
可精確至百萬(wàn)分之一秒!)

當(dāng)readfds或writefds中映象的文件可讀或可寫(xiě)或超時(shí),本次select()
就結(jié)束返回。程序員利用一組系統(tǒng)提供的宏在select()結(jié)束時(shí)便可判
斷哪一文件可讀或可寫(xiě)。對(duì)Socket編程特別有用的就是readfds。
幾只相關(guān)的宏解釋如下:

FD_ZERO(fd_set *fdset):清空f(shuō)dset與所有文件句柄的聯(lián)系。
FD_SET(int fd, fd_set *fdset):建立文件句柄fd與fdset的聯(lián)系。
FD_CLR(int fd, fd_set *fdset):清除文件句柄fd與fdset的聯(lián)系。
FD_ISSET(int fd, fdset *fdset):檢查fdset聯(lián)系的文件句柄fd是否
可讀寫(xiě),>0表示可讀寫(xiě)。
(關(guān)于fd_set及相關(guān)宏的定義見(jiàn)/usr/include/sys/types.h)

這樣,你的socket只需在有東東讀的時(shí)候才讀入,大致如下:

...
int sockfd;
fd_set fdR;
struct timeval timeout = ..;
...
for(;;) {
FD_ZERO(&fdR);
FD_SET(sockfd, &fdR);
switch (select(sockfd + 1, &fdR, NULL, &timeout)) {
case -1:
error handled by u;
case 0:
timeout hanled by u;
default:
if (FD_ISSET(sockfd)) {
now u read or recv something;
/* if sockfd is father and
server socket, u can now
accept() */
}
}
}

所以一個(gè)FD_ISSET(sockfd)就相當(dāng)通知了sockfd可讀。
至于struct timeval在此的功能,請(qǐng)man select。不同的timeval設(shè)置
使使select()表現(xiàn)出超時(shí)結(jié)束、無(wú)超時(shí)阻塞和輪詢?nèi)N特性。由于
timeval可精確至百萬(wàn)分之一秒,所以Windows的SetTimer()根本不算
什么。你可以用select()做一個(gè)超級(jí)時(shí)鐘。

FD_ACCEPT的實(shí)現(xiàn)?依然如上,因?yàn)榭蛻舴絪ocket請(qǐng)求連接時(shí),會(huì)發(fā)送
連接請(qǐng)求報(bào)文,此時(shí)select()當(dāng)然會(huì)結(jié)束,F(xiàn)D_ISSET(sockfd)當(dāng)然大
于零,因?yàn)橛袌?bào)文可讀嘛!至于這方面的應(yīng)用,主要在于服務(wù)方的父
Socket,你若不喜歡主動(dòng)accept(),可改為如上機(jī)制來(lái)accept()。

至于FD_CLOSE的實(shí)現(xiàn)及處理,頗費(fèi)了一堆cpu處理時(shí)間,未完待續(xù)。

--
討論關(guān)于利用select()檢測(cè)對(duì)方Socket關(guān)閉的問(wèn)題:

仍然是本地Socket有東東可讀,因?yàn)閷?duì)方Socket關(guān)閉時(shí),會(huì)發(fā)一個(gè)關(guān)閉連接
通知報(bào)文,會(huì)馬上被select()檢測(cè)到的。關(guān)于TCP的連接(三次握手)和關(guān)
閉(二次握手)機(jī)制,敬請(qǐng)參考有關(guān)TCP/IP的書(shū)籍。

不知是什么原因,UNIX好象沒(méi)有提供通知進(jìn)程關(guān)于Socket或Pipe對(duì)方關(guān)閉的
信號(hào),也可能是cpu所知有限。總之,當(dāng)對(duì)方關(guān)閉,一執(zhí)行recv()或read(),
馬上回返回-1,此時(shí)全局變量errno的值是115,相應(yīng)的sys_errlist[errno]
為"Connect refused"(請(qǐng)參考/usr/include/sys/errno.h)。所以,在上
篇的for(;;)...select()程序塊中,當(dāng)有東西可讀時(shí),一定要檢查recv()或
read()的返回值,返回-1時(shí)要作出關(guān)斷本地Socket的處理,否則select()會(huì)
一直認(rèn)為有東西讀,其結(jié)果曾幾令cpu傷心欲斷針腳。不信你可以試試:不檢
查recv()返回結(jié)果,且將收到的東東(實(shí)際沒(méi)收到)寫(xiě)至標(biāo)準(zhǔn)輸出...
在有名管道的編程中也有類似問(wèn)題出現(xiàn)。具體處理詳見(jiàn)拙作:發(fā)布一個(gè)有用
的Socket客戶方原碼。

至于主動(dòng)寫(xiě)Socket時(shí)對(duì)方突然關(guān)閉的處理則可以簡(jiǎn)單地捕捉信號(hào)SIGPIPE并作
出相應(yīng)關(guān)斷本地Socket等等的處理。SIGPIPE的解釋是:寫(xiě)入無(wú)讀者方的管道。
在此不作贅述,請(qǐng)?jiān)攎an signal。

以上是cpu在作tcp/ip數(shù)據(jù)傳輸實(shí)驗(yàn)積累的經(jīng)驗(yàn),若有錯(cuò)漏,請(qǐng)狂炮擊之。

唉,昨天在hacker區(qū)被一幫孫子轟得差點(diǎn)兒沒(méi)短路。ren cpu(奔騰的心) z80

補(bǔ)充關(guān)于select在異步(非阻塞)connect中的應(yīng)用,剛開(kāi)始搞socket編程的時(shí)候
我一直都用阻塞式的connect,非阻塞connect的問(wèn)題是由于當(dāng)時(shí)搞proxy scan
而提出的呵呵
通過(guò)在網(wǎng)上與網(wǎng)友們的交流及查找相關(guān)FAQ,總算知道了怎么解決這一問(wèn)題.同樣
用select可以很好地解決這一問(wèn)題.大致過(guò)程是這樣的:

1.將打開(kāi)的socket設(shè)為非阻塞的,可以用fcntl(socket, F_SETFL, O_NDELAY)完
成(有的系統(tǒng)用FNEDLAY也可).

2.發(fā)connect調(diào)用,這時(shí)返回-1,但是errno被設(shè)為EINPROGRESS,意即connect仍舊
在進(jìn)行還沒(méi)有完成.

3.將打開(kāi)的socket設(shè)進(jìn)被監(jiān)視的可寫(xiě)(注意不是可讀)文件集合用select進(jìn)行監(jiān)視,
如果可寫(xiě),用
getsockopt(socket, SOL_SOCKET, SO_ERROR, &error, sizeof(int));
來(lái)得到error的值,如果為零,則connect成功.

在許多unix版本的proxyscan程序你都可以看到類似的過(guò)程,另外在solaris精華
區(qū)->編程技巧中有一個(gè)通用的帶超時(shí)參數(shù)的connect模塊.

原文出自:http://blog.ednchina.com/thinkker/151601/message.aspx