doing5552

記錄每日點(diǎn)滴，不枉人生一世

C++博客 :: 首頁 :: 聯(lián)系 :: 聚合

:: 管理

73 Posts :: 0 Stories :: 94 Comments :: 0 Trackbacks

公告

常用鏈接

留言簿(24)

我參與的團(tuán)隊(duì)

隨筆分類(2)

隨筆檔案(73)

news

Live
sina
湖光倒影的技術(shù)博客
學(xué)著站在巨人的肩膀上
演出預(yù)告

搜索

積分與排名

積分 - 455713
排名 - 49

閱讀排行榜

評(píng)論排行榜

關(guān)于epoll的用法的說明

2010年04月21日星期三上午 11:51

以下文章轉(zhuǎn)在網(wǎng)絡(luò),對(duì)epoll說明比較詳細(xì)

epoll - I/O event notification facility

在linux的網(wǎng)絡(luò)編程中，很長的時(shí)間都在使用select來做事件觸發(fā)。在linux新的內(nèi)核中，有了一種替換它的機(jī)制，就是epoll。
相比于select，epoll最大的好處在于它不會(huì)隨著監(jiān)聽fd數(shù)目的增長而降低效率。因?yàn)樵趦?nèi)核中的select實(shí)現(xiàn)中，它是采用輪詢來處理的，輪詢的fd數(shù)目越多，自然耗時(shí)越多。并且，在linux/posix_types.h頭文件有這樣的聲明：
#define __FD_SETSIZE    1024
表示select最多同時(shí)監(jiān)聽1024個(gè)fd，當(dāng)然，可以通過修改頭文件再重編譯內(nèi)核來擴(kuò)大這個(gè)數(shù)目，但這似乎并不治本。

epoll的接口非常簡單，一共就三個(gè)函數(shù)：
1. int epoll_create(int size);
創(chuàng) 建一個(gè)epoll的句柄，size用來告訴內(nèi)核這個(gè)監(jiān)聽的數(shù)目一共有多大。這個(gè)參數(shù)不同于select()中的第一個(gè)參數(shù)，給出最大監(jiān)聽的fd+1的值。需要注意的是，當(dāng)創(chuàng)建好epoll句柄后，它就是會(huì)占用一個(gè)fd值，在linux下如果查看/proc/進(jìn)程id/fd/，是能夠看到這個(gè)fd的，所以在使用完epoll后，必須調(diào)用close()關(guān)閉，否則可能導(dǎo)致fd被耗盡。

2. int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
epoll的事件注冊(cè)函數(shù)，它不同與select()是在監(jiān)聽事件時(shí)告訴內(nèi)核要監(jiān)聽什么類型的事件，而是在這里先注冊(cè)要監(jiān)聽的事件類型。第一個(gè)參數(shù)是 epoll_create()的返回值，第二個(gè)參數(shù)表示動(dòng)作，用三個(gè)宏來表示：
EPOLL_CTL_ADD：注冊(cè)新的fd到epfd中；
EPOLL_CTL_MOD：修改已經(jīng)注冊(cè)的fd的監(jiān)聽事件；
EPOLL_CTL_DEL：從epfd中刪除一個(gè)fd；
第三個(gè)參數(shù)是需要監(jiān)聽的fd，第四個(gè)參數(shù)是告訴內(nèi)核需要監(jiān)聽什么事，struct epoll_event結(jié)構(gòu)如下：

typedef union epoll_data {
void *ptr;
int fd;
__uint32_t u32;
__uint64_t u64;
} epoll_data_t;

struct epoll_event {
__uint32_t events; /* Epoll events */
epoll_data_t data; /* User data variable */
};

events可以是以下幾個(gè)宏的集合：
EPOLLIN ：表示對(duì)應(yīng)的文件描述符可以讀（包括對(duì)端SOCKET正常關(guān)閉）；
EPOLLOUT：表示對(duì)應(yīng)的文件描述符可以寫；
EPOLLPRI：表示對(duì)應(yīng)的文件描述符有緊急的數(shù)據(jù)可讀（這里應(yīng)該表示有帶外數(shù)據(jù)到來）；
EPOLLERR：表示對(duì)應(yīng)的文件描述符發(fā)生錯(cuò)誤；
EPOLLHUP：表示對(duì)應(yīng)的文件描述符被掛斷；
EPOLLET：將EPOLL設(shè)為邊緣觸發(fā)(Edge Triggered)模式，這是相對(duì)于水平觸發(fā)(Level Triggered)來說的。
EPOLLONESHOT：只監(jiān)聽一次事件，當(dāng)監(jiān)聽完這次事件之后，如果還需要繼續(xù)監(jiān)聽這個(gè)socket的話，需要再次把這個(gè)socket加入到 EPOLL隊(duì)列里

3. int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout);
等待事件的產(chǎn)生，類似于select()調(diào)用。參數(shù)events用來從內(nèi)核得到事件的集合，maxevents告之內(nèi)核這個(gè)events有多大，這個(gè) maxevents的值不能大于創(chuàng)建epoll_create()時(shí)的size，參數(shù)timeout是超時(shí)時(shí)間（毫秒，0會(huì)立即返回，-1將不確定，也有說法說是永久阻塞）。該函數(shù)返回需要處理的事件數(shù)目，如返回0表示已超時(shí)。

4、關(guān)于ET、LT兩種工作模式：
可以得出這樣的結(jié)論:
ET 模式僅當(dāng)狀態(tài)發(fā)生變化的時(shí)候才獲得通知,這里所謂的狀態(tài)的變化并不包括緩沖區(qū)中還有未處理的數(shù)據(jù),也就是說,如果要采用ET模式,需要一直 read/write直到出錯(cuò)為止,很多人反映為什么采用ET模式只接收了一部分?jǐn)?shù)據(jù)就再也得不到通知了,大多因?yàn)檫@樣;而LT模式是只要有數(shù)據(jù)沒有處理就會(huì)一直通知下去的.

那么究竟如何來使用epoll呢？其實(shí)非常簡單。
通過在包含一個(gè)頭文件#include <sys/epoll.h> 以及幾個(gè)簡單的API將可以大大的提高你的網(wǎng)絡(luò)服務(wù)器的支持人數(shù)。

首先通過create_epoll(int maxfds)來創(chuàng)建一個(gè)epoll的句柄，其中maxfds為你epoll所支持的最大句柄數(shù)。這個(gè)函數(shù)會(huì)返回一個(gè)新的epoll句柄，之后的所有操作將通過這個(gè)句柄來進(jìn)行操作。在用完之后，記得用close()來關(guān)閉這個(gè)創(chuàng)建出來的epoll句柄。

之后在你的網(wǎng)絡(luò)主循環(huán)里面，每一幀的調(diào)用epoll_wait(int epfd, epoll_event events, int max events, int timeout)來查詢所有的網(wǎng)絡(luò)接口，看哪一個(gè)可以讀，哪一個(gè)可以寫了。基本的語法為：
nfds = epoll_wait(kdpfd, events, maxevents, -1);
其中kdpfd為用epoll_create創(chuàng)建之后的句柄，events是一個(gè)epoll_event*的指針，當(dāng)epoll_wait這個(gè)函數(shù)操作成功之后，epoll_events里面將儲(chǔ)存所有的讀寫事件。max_events是當(dāng)前需要監(jiān)聽的所有socket句柄數(shù)。最后一個(gè)timeout是 epoll_wait的超時(shí)，為0的時(shí)候表示馬上返回，為-1的時(shí)候表示一直等下去，直到有事件范圍，為任意正整數(shù)的時(shí)候表示等這么長的時(shí)間，如果一直沒有事件，則范圍。一般如果網(wǎng)絡(luò)主循環(huán)是單獨(dú)的線程的話，可以用-1來等，這樣可以保證一些效率，如果是和主邏輯在同一個(gè)線程的話，則可以用0來保證主循環(huán) 的效率。

epoll_wait范圍之后應(yīng)該是一個(gè)循環(huán)，遍利所有的事件。

幾乎所有的epoll程序都使用下面的框架：

for( ; ; )
{
nfds = epoll_wait(epfd,events,20,500);
for(i=0;i<nfds;++i)
{
if(events[i].data.fd==listenfd) //有新的連接
{
connfd = accept(listenfd,(sockaddr *)&clientaddr, &clilen); //accept這個(gè)連接
ev.data.fd=connfd;
ev.events=EPOLLIN|EPOLLET;
epoll_ctl(epfd,EPOLL_CTL_ADD,connfd,&ev); //將新的fd添加到epoll的監(jiān)聽隊(duì)列中
}
else if( events[i].events&EPOLLIN ) //接收到數(shù)據(jù)，讀socket
{
n = read(sockfd, line, MAXLINE)) < 0   //讀
ev.data.ptr = md;    //md為自定義類型，添加數(shù)據(jù)
ev.events=EPOLLOUT|EPOLLET;
epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,&ev);//修改標(biāo)識(shí)符，等待下一個(gè)循環(huán)時(shí)發(fā)送數(shù)據(jù)，異步處理的精髓
}
else if(events[i].events&EPOLLOUT) //有數(shù)據(jù)待發(fā)送，寫socket
{
struct myepoll_data* md = (myepoll_data*)events[i].data.ptr;   //取數(shù)據(jù)
sockfd = md->fd;
send( sockfd, md->ptr, strlen((char*)md->ptr), 0 );       //發(fā)送數(shù)據(jù)
ev.data.fd=sockfd;
ev.events=EPOLLIN|EPOLLET;
epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,&ev); //修改標(biāo)識(shí)符，等待下一個(gè)循環(huán)時(shí)接收數(shù)據(jù)
}
else
{
//其他的處理
}
}
}

posted on 2010-07-18 21:16 doing5552 閱讀(336) 評(píng)論(0) 編輯收藏引用

只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。
【推薦】100%開源！大型工業(yè)跨平臺(tái)軟件C++源碼提供，建模，組態(tài)！



網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理