作者:CppExplore 地址:http://www.shnenglu.com/CppExplore/
全文針對linux環(huán)境。tcp/udp兩種server種,tcp相對較復(fù)雜也相對比較常用。本文就從tcp server開始講起。先從基本說起,看一個單線程的網(wǎng)絡(luò)模型,處理流程如下:
socket-->bind-->listen-->[accept-->read-->write-->close]-->close
[]中代碼循環(huán)運行,[]外的是對監(jiān)聽socket的處理,[]內(nèi)的是對accept返回的客戶socket的處理。這些系統(tǒng)調(diào)用的參數(shù)以及需要的頭文件等,只需要在linux下man就好。
一、注意事項。
(1)包裹宏使用。這些系統(tǒng)調(diào)用返回-1表示失敗。檢測系統(tǒng)調(diào)用的返回值是個好習(xí)慣,應(yīng)該說必須檢測,如果系統(tǒng)調(diào)用總是成功的話,它為何又要有返回值呢?。每次檢查的話,代碼寫起來又很是羅唆,并且容易遺漏檢測。使用宏包裹系統(tǒng)調(diào)用或者使用包裹函數(shù)是不錯的方案。下面給出幾個預(yù)定義包裹宏:
#define NOERROR_FUNC(func,opt) if((func)<0) \
{ \
printf("Line[%d] error[%d:%s]\n",__LINE__,errno,strerror(errno)); \
opt; \
}
#define NOERROR_FUNC_1(func) NOERROR_FUNC(func,return -1)
#define NOERROR_FUNC_NULL(func) NOERROR_FUNC(func,return NULL)
不知道strerror?,剛說了,去linux下:man strerror
以后使用就可以類似于這樣:
NOERROR_FUNC_1((fd=socket(AF_INET,SOCKET_STREAM,0)));
NOERROR_FUNC_1(bind(fd,(struct sockaddr *)&serverAddr,sizeof(struct sockaddr_in)));
(2)不能返回失敗的錯誤。大多數(shù)阻塞式系統(tǒng)調(diào)用要處理EINTR錯誤,另accept還要處理ECONNABORTED。與(1)同樣道理,預(yù)定義宏如下:
#define NOERROR_FUNC_BUT_ERR(func,opt,err,erropt) if((func)<0) \
{ \
printf("Line[%d] error[%d:%s]\n",__LINE__,errno,strerror(errno)); \
if(errno==err) { erropt;} \
else {opt;} \
}
#define NOERROR_FUNC_BUT_ERR_2(func,opt,err1,err2,erropt) if((func)<0) \
{ \
printf("Line[%d] error[%d:%s]\n",__LINE__,errno,strerror(errno)); \
if(errno==err1||errno==err2) { erropt;} \
else {opt;} \
}
調(diào)用accept的代碼就可以如此寫:
while(1)

{
client_sockfd=accept(fd,(struct sockaddr *)&clientAddr,&lenAddr);
NOERROR_FUNC_BUT_ERR_2(client_sockfd,retun -1,EINTR,ECONNABORTED,continue);



(3)涉及到系統(tǒng)調(diào)用分兩類:從用戶態(tài)到內(nèi)核態(tài),該類系統(tǒng)調(diào)用使用值參數(shù),有:bind/setsockopt/connect;從內(nèi)核態(tài)到用戶態(tài),該類系統(tǒng)調(diào)用使用值-結(jié)果參數(shù),有:accept/getsockopt。
看下兩者函數(shù)原型,從用戶態(tài)到內(nèi)核態(tài):
int setsockopt(int s, int level, int optname, const void *optval, socklen_t optlen);
int connect(int sockfd, const struct sockaddr *serv_addr, socklen_t addrlen);
int bind(int sockfd,struct sockaddr *Addr,socklen_t addrlen);
從內(nèi)核態(tài)到用戶態(tài):
int getsockopt(int s, int level, int optname, void *optval, socklen_t *optlen);
int accept(int sockfd,struct sockaddr *Addr,socklen_t *addrlen);
看最后一個參數(shù),從用戶態(tài)到內(nèi)核態(tài)只要告訴內(nèi)核參數(shù)長度的值就可以了,因此是值方式。從內(nèi)核態(tài)到用戶態(tài),要事先準備好變量保存內(nèi)核態(tài)返回的結(jié)果長度值,因此是指針方式,稱之為值-結(jié)果參數(shù)。
二、系統(tǒng)調(diào)用
(1)socket
int fd;
NOERROR_FUNC_1(fd=socket(AF_INET,SOCKET_STREAM,0));
創(chuàng)建一個ipv4的tcp socket
(2)bind
把socket綁定到一個地址,首先要指明地址,如下:
struct sockaddr_in addr;
addr.sin_family=AF_INET;//協(xié)議類型
addr.sin_port=htons(5000);//端口地址
addr.sin_addr.s_addr=htonl(INADDR_ANY);//此處表示任意ip(主機有多個網(wǎng)卡,則將環(huán)路地址127.0.0.1以及各網(wǎng)卡ip都指定)。
NOERROR_FUNC_1(bind(fd,(struct sockaddr *)addr,sizeof(struct sockaddr_in)));
創(chuàng)建ipv4協(xié)議的地址,使用5000端口,接收任何地址的connect,把該地址和fd綁定。
注意:
1、地址聲明的時候使用struct sockaddr_in,使用的時候總是強制轉(zhuǎn)化為struct sockaddr。
2、struct sockaddr_in結(jié)構(gòu)中端口和ip都必須是網(wǎng)絡(luò)序。htons把主機序的short int轉(zhuǎn)化為網(wǎng)絡(luò)序,htonl把主機序的long int轉(zhuǎn)化為網(wǎng)絡(luò)序。
3、除任意ip地址為常量外,一般習(xí)慣用點分字符串表示ip地址,而addr.sin_addr.s_addr要使用網(wǎng)絡(luò)序整型。
因此有兩個函數(shù)可以在字符串和網(wǎng)絡(luò)序ip地址之間做轉(zhuǎn)換:
const char *inet_ntop(int af, const void *src,char *dst, socklen_t cnt);
int inet_pton(int af, const char *src, void *dst);
這里是需要網(wǎng)絡(luò)序,因此使用ton(to net)那個函數(shù),比如:
NOERROR_FUNC_1(inet_pton(AF_INET,"172.168.0.45", &addr.sin_addr.s_addr));
(3)setsockopt
long val;
socklen_t len=sizeof(val);
NOERROR_FUNC_1(setsockopt(fd,SOL_SOCKET,SO_REUSEADDR,&(val=1),len));
給socket設(shè)置選項,常用的不多,SO_REUSEADDR是一個,服務(wù)器一般使用,其它還有SO_RCVBUF,SO_SNDBUF。accept返回的對端socket繼承監(jiān)聽socket的發(fā)送緩存、接收緩存選項。一般也不需要設(shè)置SO_RCVBUF,SO_SNDBUF,默認的足夠了,帶寬很大的情況下,需要設(shè)置,以免其稱為瓶頸,貌似默認的是8092字節(jié)。哦,還有要在listen前設(shè)置。
(4)listen
NOERROR_FUNC_1(listen(fd,SOMAXCONN));
把fd從主動端口變?yōu)楸粍佣丝冢却齝lient connect。第二個參數(shù)是表示三次握手中隊列以及完成了三次握手等待accept系統(tǒng)函數(shù)來取的隊列的相加值,有的系統(tǒng)不是簡單相加,還有一個系數(shù),也就是如果設(shè)置5,系數(shù)是2,那么兩個隊列的和就是10。如果隊列滿,而accept沒來取(很忙的情況下,來不及調(diào)用accept),再有連接來就會被拒絕掉,要想系統(tǒng)能處理超大爆發(fā)的連接,就加大這個參數(shù)值,加快accept的處理。SOMAXCONN表示取系統(tǒng)允許的最大值。
(5)accept
前面已經(jīng)舉例了,這里就不再列例子了。
阻塞式調(diào)用,需要處理EINTR(被信號終止),ECONNABORTED(返回前client異常終止),處理的方式就是重新accept。
(6)read
int read(int fd,char *buf,size_t len);
這是針對文件描述符的一個系統(tǒng)調(diào)用,socket也屬于文件描述符。tcp協(xié)議中傳輸?shù)臄?shù)據(jù)都是流字節(jié),沒有什么結(jié)束符的標志,只能由協(xié)議提供結(jié)束方式,比如http協(xié)議使用"\r\n\r\n"或者"\n\n"標識一條信令結(jié)束,這樣的話,我們只能一個字節(jié)一個字節(jié)的讀取,然后結(jié)合已經(jīng)讀取的字節(jié),判斷是否應(yīng)該結(jié)束讀。而網(wǎng)絡(luò)模型中要提高性能,一個重要方面就是要減少系統(tǒng)調(diào)用的次數(shù)。因此tcp中都要使用緩存區(qū)一次讀取盡可能多的數(shù)據(jù),然后再從該緩存區(qū)一個字節(jié)一個字節(jié)的讀取,緩存區(qū)數(shù)據(jù)被讀完而沒有到結(jié)束位置的時候,再次調(diào)用系統(tǒng)調(diào)用read。
返回值為0表示對端正常關(guān)閉,大于0表示讀取到的字節(jié)數(shù)。示例見最后例子。
(7)write
int write(int fd,char *buf,size_t len);
兩個需要注意的地方:
1、對EINTR處理。防止被信號中斷,沒有正確寫入需求的字符數(shù)。
2、signal(SIGPIPE, SIG_IGN);這句代碼的意思是忽略SIGPIPE信號。
write寫被重置(對端意外關(guān)閉)的套接口,產(chǎn)生SIGPIPE信號,不處理的話程序被終止。忽略的話,繼續(xù)寫會產(chǎn)生EPIPE錯誤,檢查write系統(tǒng)調(diào)用的返回結(jié)果就好了。示例見最后例子。
signal的使用,man下就看到了,回調(diào)函數(shù)的原型等都有,SIG_IGN也會出現(xiàn),呵呵。
(8)close就不說了
(9)fcntl
要對socket設(shè)置為非阻塞方式,setsockopt沒有提供相應(yīng)的選項,只能用fcntl函數(shù)設(shè)置。
int flags;
NOERROR_FUNC_1(flags=fcntl(client_sockfd,F_GETFL,0));
NOERROR_FUNC_1(fcntl(client_sockfd,F_SETFL,flags|O_NONBLOCK));
多路分離I/O(select/poll/epoll)通常設(shè)置為非阻塞方式。
設(shè)置為阻塞方式(默認方式)代碼:
int flags;
NOERROR_FUNC_1(flags=fcntl(client_sockfd,F_GETFL,0));
NOERROR_FUNC_1(fcntl(client_sockfd,F_SETFL,flags&~O_NONBLOCK));
對于阻塞方式的套接口,如果要避免read write永遠阻塞,設(shè)置等待時間的方式有3種:信號方式,不推薦,不說了;select方式,每次調(diào)用read前調(diào)用select監(jiān)視該套接口是否在指定時間內(nèi)可寫,超時select返回0,這樣每次執(zhí)行read都要調(diào)用兩個系統(tǒng)調(diào)用,不推薦;最后就是設(shè)置套接口選項SO_RECVTIMEO和SO_SNDTIMEO,其實這個也不推薦,總之不推薦阻塞式的方式,呵呵。實用的網(wǎng)絡(luò)模型都是多路分離的。
非阻塞方式下的connect函數(shù)要說下,當然是就客戶端而言,connect后如果沒有立即返回連接成功的話,把這個socket加入select的 fd_set(poll的pollfd,epoll的EPOLL_CTL_ADD操作),要監(jiān)視是否可寫事件,可寫的時候用getsockopt獲取SO_ERROR選項,如果非負(其實就是0值)就標示connect成功,否則就是失敗。EPOLL中測試結(jié)果是connect失敗的返回事件是EPOLLERR|EPOLLHUP,并不是加入時的EPOLLOUT,成功的時候是EPOLLOUT。
三、示例
最后給個單線程的服務(wù)器,雖說沒什么實用意義,不過就象“hello world!”,入門第一課。
這個例子,讀取數(shù)據(jù),回寫response,關(guān)閉clientfd。不管read write是否出錯,都執(zhí)行close,因此代碼很簡單。
先來main函數(shù):
int main()


{
int server_sockfd;
int client_sockfd;
struct sockaddr_in serverAddr;
struct sockaddr_in clientAddr;
size_t lenAddr;
int val;

memset(&serverAddr,0,sizeof(serverAddr));
serverAddr.sin_family=AF_INET;
serverAddr.sin_port=htons(5000);
serverAddr.sin_addr.s_addr=htonl(INADDR_ANY);

NOERROR_FUNC_1((server_sockfd=socket(AF_INET,SOCK_STREAM,0)));
NOERROR_FUNC_1(setsockopt(server_sockfd,SOL_SOCKET,SO_REUSEADDR,&(val=1),sizeof(val)));
NOERROR_FUNC_1(bind(server_sockfd,(struct sockaddr *)&serverAddr,sizeof(struct sockaddr_in)));
NOERROR_FUNC_1(listen(server_sockfd,SOMAXCONN));
const static char * response="HTTP/1.1 200 OK\r\n\r\n";
char buf[BUF_LEN];
signal(SIGPIPE, SIG_IGN);
while(1)

{
client_sockfd=accept(server_sockfd,(struct sockaddr *)&clientAddr,&lenAddr);
NOERROR_FUNC_BUT_ERR_2(client_sockfd,return -1,EINTR,ECONNABORTED,continue);
BuffCache cache;
if(read_double_enter(client_sockfd,buf,BUF_LEN,&cache)>0)
writen(client_sockfd,response,19);
close(client_sockfd);
}
close(server_sockfd);
return 0;
}
下面是包含的頭文件和宏:
#include <unistd.h>
#include <sys/types.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <stdio.h>
#include <errno.h>
#include <signal.h>
#include <stdlib.h>
#include <string.h>
#include <stdarg.h>


#define NOERROR_FUNC(func,opt) if((func)<0) \

{ \
printf("Line[%d] error[%d:%s]\n",__LINE__,errno,strerror(errno)); \
opt; \
}
#define NOERROR_FUNC_BUT_ERR(func,opt,err,erropt) if((func)<0) \

{ \
printf("Line[%d] error[%d:%s]\n",__LINE__,errno,strerror(errno)); \

if(errno==err)
{ erropt;} \

else
{opt;} \
}
#define NOERROR_FUNC_BUT_ERR_2(func,opt,err1,err2,erropt) if((func)<0) \

{ \
printf("Line[%d] error[%d:%s]\n",__LINE__,errno,strerror(errno)); \

if(errno==err1||errno==err2)
{ erropt;} \

else
{opt;} \
}

#define NOERROR_FUNC_1(func) NOERROR_FUNC(func,return -1)
#define NOERROR_FUNC_NULL(func) NOERROR_FUNC(func,return NULL)

#define BUF_LEN 1024
下面是緩存區(qū)和讀寫代碼:
class BuffCache


{
public:

BuffCache():count(0)
{}
int read_socket(int fd,char * pCh)

{
if(count<=0)

{
again:
if((count=read(fd,buf,BUF_LEN))<0)

{
if(errno==EINTR)
goto again;
*pCh='\0';
return -1;
}
else if(count==0)

{
*pCh='\0';
return 0;
}
ptrBuf=buf;
}
count--;
*pCh=*(ptrBuf++);
return 1;
}
private:
char buf[BUF_LEN];
char * ptrBuf;
int count;
};
inline int read_double_enter(int fd,char * pCh, int maxsize,BuffCache *cache)


{
int i=0;
char *ptr=pCh;
int res=0;
int sum=0;
for(i=0;i<maxsize;i++)

{
if((res=cache->read_socket(fd,ptr))<0)
return -1;
else if(res==0)

{
*ptr='\0';
return sum;
}
else

{
if(*ptr=='\n'&&
((ptr-pCh>=1&&*(ptr-1)=='\n')||
(ptr-pCh>=3&&*(ptr-1)=='\r'&&*(ptr-2)=='\n'&&*(ptr-3)=='\r')))

{
*(ptr+1)='\0';
return ++sum;
}
}
ptr++;
sum++;
}
}

inline int writen(int fd,const char * buf, int len)


{
int count=0;
int leftlen=len;
const char * ptr=buf;
while(leftlen>0)

{
again:
NOERROR_FUNC_BUT_ERR((count=write(fd,ptr,leftlen)),return -1,EINTR,goto again);
leftlen-=count;
ptr+=count;
}
}
隨便寫的一個程序,湊合著看吧。
四、其它基礎(chǔ)性知識的說明(1)read write外 還有recv send recvfrom sendto recvmsg sendmsg不說了
(2)信號處理不說了
(3)多路分離后面講各種模型的時候詳細寫
(4)信號方式的多路分離不細說了,在tcp中只能accept除使用信號SIGIO,但是該信號為非可靠信號,當大量client連接到來的時候,經(jīng)常丟失信號,10并發(fā)都支持不了,實在沒什么實際意義。