歡迎閱讀此篇IOCP教程。我將先給出IOCP的定義然后給出它的實(shí)現(xiàn)方法,最后剖析一個(gè)Echo程序來(lái)為您撥開(kāi)IOCP的謎云,除去你心中對(duì)IOCP的煩惱。OK,但我不能保證你明白IOCP的一切,但我會(huì)盡我最大的努力。以下是我會(huì)在這篇文章中提到的相關(guān)技術(shù):
I/O端口
同步/異步
堵塞/非堵塞
服務(wù)端/客戶端
多線程程序設(shè)計(jì)
Winsock API 2.0
在這之前,我曾經(jīng)開(kāi)發(fā)過(guò)一個(gè)項(xiàng)目,其中一塊需要網(wǎng)絡(luò)支持,當(dāng)時(shí)還考慮到了代碼的可移植性,只要使用select,connect,accept,listen,send還有recv,再加上幾個(gè)#ifdef的封裝以用來(lái)處理Winsock和BSD套接字[socket]中間的不兼容性,一個(gè)網(wǎng)絡(luò)子系統(tǒng)只用了幾個(gè)小時(shí)很少的代碼就寫(xiě)出來(lái)了,至今還讓我很回味。那以后很長(zhǎng)時(shí)間也就沒(méi)再碰了。
前些日子,我們策劃做一個(gè)網(wǎng)絡(luò)游戲,我主動(dòng)承擔(dān)下網(wǎng)絡(luò)這一塊,想想這還不是小case,心里偷著樂(lè)啊。網(wǎng)絡(luò)游戲好啊,網(wǎng)絡(luò)游戲?yàn)槌砂偕锨У耐婕姨峁┝藰?lè)趣和令人著秘的游戲體驗(yàn),他們?cè)诰€上互相戰(zhàn)斗或是加入隊(duì)伍去戰(zhàn)勝共同的敵人。我信心滿滿的準(zhǔn)備開(kāi)寫(xiě)我的網(wǎng)絡(luò),于是乎,發(fā)現(xiàn)過(guò)去的阻塞同步模式模式根本不能拿到一個(gè)巨量多玩家[MMP]的架構(gòu)中去,直接被否定掉了。于是乎,就有了IOCP,如果能過(guò)很輕易而舉的搞掂IOCP,也就不會(huì)有這篇教程了。下面請(qǐng)諸位跟隨我進(jìn)入正題。
什么是IOCP?
先讓我們看看對(duì)IOCP的評(píng)價(jià)
I/O完成端口可能是Win32提供的最復(fù)雜的內(nèi)核對(duì)象。
[Advanced Windows 3rd] Jeffrey Richter
這是[IOCP]實(shí)現(xiàn)高容量網(wǎng)絡(luò)服務(wù)器的最佳方法。
[Windows Sockets2.0:Write Scalable Winsock Apps Using Completion Ports]
Microsoft Corporation
完成端口模型提供了最好的伸縮性。這個(gè)模型非常適用來(lái)處理數(shù)百乃至上千個(gè)套接字。
[Windows網(wǎng)絡(luò)編程2nd] Anthony Jones & Jim Ohlund
I/O completion ports特別顯得重要,因?yàn)樗鼈兪俏ㄒ贿m用于高負(fù)載服務(wù)器[必須同時(shí)維護(hù)許多連接線路]的一個(gè)技術(shù)。Completion ports利用一些線程,幫助平衡由I/O請(qǐng)求所引起的負(fù)載。這樣的架構(gòu)特別適合用在SMP系統(tǒng)中產(chǎn)生的”scalable”服務(wù)器。
[Win32多線程程序設(shè)計(jì)] Jim Beveridge & Robert Wiener
看來(lái)我們完全有理由相信IOCP是大型網(wǎng)絡(luò)架構(gòu)的首選。那IOCP到底是什么呢?
微軟在Winsock2中引入了IOCP這一概念 。IOCP全稱I/O Completion Port,中文譯為I/O完成端口。IOCP是一個(gè)異步I/O的API,它可以高效地將I/O事件通知給應(yīng)用程序。與使用select()或是其它異步方法不同的是,一個(gè)套接字[socket]與一個(gè)完成端口關(guān)聯(lián)了起來(lái),然后就可繼續(xù)進(jìn)行正常的Winsock操作了。然而,當(dāng)一個(gè)事件發(fā)生的時(shí)候,此完成端口就將被操作系統(tǒng)加入一個(gè)隊(duì)列中。然后應(yīng)用程序可以對(duì)核心層進(jìn)行查詢以得到此完成端口。
這里我要對(duì)上面的一些概念略作補(bǔ)充,在解釋[完成]兩字之前,我想先簡(jiǎn)單的提一下同步和異步這兩個(gè)概念,邏輯上來(lái)講做完一件事后再去做另一件事就是同步,而同時(shí)一起做兩件或兩件以上事的話就是異步了。你也可以拿單線程和多線程來(lái)作比喻。但是我們一定要將同步和堵塞,異步和非堵塞區(qū)分開(kāi)來(lái),所謂的堵塞函數(shù)諸如accept(…),當(dāng)調(diào)用此函數(shù)后,此時(shí)線程將掛起,直到操作系統(tǒng)來(lái)通知它,”HEY兄弟,有人連進(jìn)來(lái)了”,那個(gè)掛起的線程將繼續(xù)進(jìn)行工作,也就符合”生產(chǎn)者-消費(fèi)者”模型。堵塞和同步看上去有兩分相似,但卻是完全不同的概念。大家都知道I/O設(shè)備是個(gè)相對(duì)慢速的設(shè)備,不論打印機(jī),調(diào)制解調(diào)器,甚至硬盤(pán),與CPU相比都是奇慢無(wú)比的,坐下來(lái)等I/O的完成是一件不甚明智的事情,有時(shí)候數(shù)據(jù)的流動(dòng)率非常驚人,把數(shù)據(jù)從你的文件服務(wù)器中以Ethernet速度搬走,其速度可能高達(dá)每秒一百萬(wàn)字節(jié),如果你嘗試從文件服務(wù)器中讀取100KB,在用戶的眼光來(lái)看幾乎是瞬間完成,但是,要知道,你的線程執(zhí)行這個(gè)命令,已經(jīng)浪費(fèi)了10個(gè)一百萬(wàn)次CPU周期。所以說(shuō),我們一般使用另一個(gè)線程來(lái)進(jìn)行I/O。重疊IO[overlapped I/O]是Win32的一項(xiàng)技術(shù),你可以要求操作系統(tǒng)為你傳送數(shù)據(jù),并且在傳送完畢時(shí)通知你。這也就是[完成]的含義。這項(xiàng)技術(shù)使你的程序在I/O進(jìn)行過(guò)程中仍然能夠繼續(xù)處理事務(wù)。事實(shí)上,操作系統(tǒng)內(nèi)部正是以線程來(lái)完成overlapped I/O。你可以獲得線程所有利益,而不需要付出什么痛苦的代價(jià)。
完成端口中所謂的[端口]并不是我們?cè)赥CP/IP中所提到的端口,可以說(shuō)是完全沒(méi)有關(guān)系。我到現(xiàn)在也沒(méi)想通一個(gè)I/O設(shè)備[I/O Device]和端口[IOCP中的Port]有什么關(guān)系。估計(jì)這個(gè)端口也迷惑了不少人。IOCP只不過(guò)是用來(lái)進(jìn)行讀寫(xiě)操作,和文件I/O倒是有些類似。既然是一個(gè)讀寫(xiě)設(shè)備,我們所能要求它的只是在處理讀與寫(xiě)上的高效。在文章的第三部分你會(huì)輕而易舉的發(fā)現(xiàn)IOCP設(shè)計(jì)的真正用意。
IOCP和網(wǎng)絡(luò)又有什么關(guān)系?
int main()
{
WSAStartup(MAKEWORD(2, 2), &wsaData);
ListeningSocket = socket(AF_INET, SOCK_STREAM, 0);
bind(ListeningSocket, (SOCKADDR*)&ServerAddr, sizeof(ServerAddr));
listen(ListeningSocket, 5);
int nlistenAddrLen = sizeof(ClientAddr);
while(TRUE)
{
NewConnection = accept(ListeningSocket, (SOCKADDR*)&ClientAddr, &nlistenAddrLen);
HANDLE hThread = CreateThread(NULL, 0, ThreadFunc, (void*) NewConnection, 0, &dwTreadId);
CloseHandle(hThread);
}
return 0;
}
相信只要寫(xiě)過(guò)網(wǎng)絡(luò)的朋友,應(yīng)該對(duì)這樣的結(jié)構(gòu)在熟悉不過(guò)了。accept后線程被掛起,等待一個(gè)客戶發(fā)出請(qǐng)求,而后創(chuàng)建新線程來(lái)處理請(qǐng)求。當(dāng)新線程處理客戶請(qǐng)求時(shí),起初的線程循環(huán)回去等待另一個(gè)客戶請(qǐng)求。處理客戶請(qǐng)求的線程處理完畢后終結(jié)。
在上述的并發(fā)模型中,對(duì)每個(gè)客戶請(qǐng)求都創(chuàng)建了一個(gè)線程。其優(yōu)點(diǎn)在于等待請(qǐng)求的線程只需做很少的工作。大多數(shù)時(shí)間中,該線程在休眠[因?yàn)閞ecv處于堵塞狀態(tài)]。
但是當(dāng)并發(fā)模型應(yīng)用在服務(wù)器端[基于Windows NT],Windows NT小組注意到這些應(yīng)用程序的性能沒(méi)有預(yù)料的那么高。特別的,處理很多同時(shí)的客戶請(qǐng)求意味著很多線程并發(fā)地運(yùn)行在系統(tǒng)中。因?yàn)樗羞@些線程都是可運(yùn)行的[沒(méi)有被掛起和等待發(fā)生什么事],Microsoft意識(shí)到NT內(nèi)核花費(fèi)了太多的時(shí)間來(lái)轉(zhuǎn)換運(yùn)行線程的上下文[Context],線程就沒(méi)有得到很多CPU時(shí)間來(lái)做它們的工作。
大家可能也都感覺(jué)到并行模型的瓶頸在于它為每一個(gè)客戶請(qǐng)求都創(chuàng)建了一個(gè)新線程。創(chuàng)建線程比起創(chuàng)建進(jìn)程開(kāi)銷要小,但也遠(yuǎn)不是沒(méi)有開(kāi)銷的。
我們不妨設(shè)想一下:如果事先開(kāi)好N個(gè)線程,讓它們?cè)谀莌old[堵塞],然后可以將所有用戶的請(qǐng)求都投遞到一個(gè)消息隊(duì)列中去。然后那N個(gè)線程逐一從消息隊(duì)列中去取出消息并加以處理。就可以避免針對(duì)每一個(gè)用戶請(qǐng)求都開(kāi)線程。不僅減少了線程的資源,也提高了線程的利用率。理論上很不錯(cuò),你想我等泛泛之輩都能想出來(lái)的問(wèn)題,Microsoft又怎會(huì)沒(méi)有考慮到呢?!
這個(gè)問(wèn)題的解決方法就是一個(gè)稱為I/O完成端口的內(nèi)核對(duì)象,他首次在Windows NT3.5中被引入。
其實(shí)我們上面的構(gòu)想應(yīng)該就差不多是IOCP的設(shè)計(jì)機(jī)理。其實(shí)說(shuō)穿了IOCP不就是一個(gè)消息隊(duì)列嘛!你說(shuō)這和[端口]這兩字有何聯(lián)系。我的理解就是IOCP最多是應(yīng)用程序和操作系統(tǒng)溝通的一個(gè)接口罷了。
至于IOCP的具體設(shè)計(jì)那我也很難說(shuō)得上來(lái),畢竟我沒(méi)看過(guò)實(shí)現(xiàn)的代碼,但你完全可以進(jìn)行模擬,只不過(guò)性能可能…,如果想深入理解IOCP, Jeffrey Ritchter的Advanced Windows 3rd其中第13章和第14張有很多寶貴的內(nèi)容,你可以拿來(lái)窺視一下系統(tǒng)是如何完成這一切的。
實(shí)現(xiàn)方法
Microsoft為IOCP提供了相應(yīng)的API函數(shù),主要的就兩個(gè),我們逐一的來(lái)看一下:
HANDLE CreateIoCompletionPort (
HANDLE FileHandle, // handle to file
HANDLE ExistingCompletionPort, // handle to I/O completion port
ULONG_PTR CompletionKey, // completion key
DWORD NumberOfConcurrentThreads // number of threads to execute concurrently
);
在討論各參數(shù)之前,首先要注意該函數(shù)實(shí)際用于兩個(gè)截然不同的目的:
1.用于創(chuàng)建一個(gè)完成端口對(duì)象
2.將一個(gè)句柄[HANDLE]和完成端口關(guān)聯(lián)到一起
在創(chuàng)建一個(gè)完成一個(gè)端口的時(shí)候,我們只需要填寫(xiě)一下NumberOfConcurrentThreads這個(gè)參數(shù)就可以了。它告訴系統(tǒng)一個(gè)完成端口上同時(shí)允許運(yùn)行的線程最大數(shù)。在默認(rèn)情況下,所開(kāi)線程數(shù)和CPU數(shù)量相同,但經(jīng)驗(yàn)給我們一個(gè)公式:
線程數(shù) = CPU數(shù) * 2 + 2
要使完成端口有用,你必須把它同一個(gè)或多個(gè)設(shè)備相關(guān)聯(lián)。這也是調(diào)用CreateIoCompletionPort完成的。你要向該函數(shù)傳遞一個(gè)已有的完成端口的句柄,我們既然要處理網(wǎng)絡(luò)事件,那也就是將客戶的socket作為HANDLE傳進(jìn)去。和一個(gè)完成鍵[對(duì)你有意義的一個(gè)32位值,也就是一個(gè)指針,操作系統(tǒng)并不關(guān)心你傳什么]。每當(dāng)你向端口關(guān)聯(lián)一個(gè)設(shè)備時(shí),系統(tǒng)向該完成端口的設(shè)備列表中加入一條信息紀(jì)錄。
另一個(gè)API就是
BOOL GetQueuedCompletionStatus(
HANDLE CompletionPort, // handle to completion port
LPDWORD lpNumberOfBytes, // bytes transferred
PULONG_PTR lpCompletionKey, // file completion key
LPOVERLAPPED *lpOverlapped, // buffer
DWORD dwMilliseconds // optional timeout value
);
第一個(gè)參數(shù)指出了線程要監(jiān)視哪一個(gè)完成端口。很多服務(wù)應(yīng)用程序只是使用一個(gè)I/O完成端口,所有的I/O請(qǐng)求完成以后的通知都將發(fā)給該端口。簡(jiǎn)單的說(shuō),GetQueuedCompletionStatus使調(diào)用線程掛起,直到指定的端口的I/O完成隊(duì)列中出現(xiàn)了一項(xiàng)或直到超時(shí)。同I/O完成端口相關(guān)聯(lián)的第3個(gè)數(shù)據(jù)結(jié)構(gòu)是使線程得到完成I/O項(xiàng)中的信息:傳輸?shù)淖止?jié)數(shù),完成鍵和OVERLAPPED結(jié)構(gòu)的地址。該信息是通過(guò)傳遞給GetQueuedCompletionSatatus的lpdwNumberOfBytesTransferred,lpdwCompletionKey和lpOverlapped參數(shù)返回給線程的。
根據(jù)到目前為止已經(jīng)講到的東西,首先來(lái)構(gòu)建一個(gè)frame。下面為您說(shuō)明了如何使用完成端口來(lái)開(kāi)發(fā)一個(gè)echo服務(wù)器。大致如下:
1.初始化Winsock
2.創(chuàng)建一個(gè)完成端口
3.根據(jù)服務(wù)器線程數(shù)創(chuàng)建一定量的線程數(shù)
4.準(zhǔn)備好一個(gè)socket進(jìn)行bind然后listen
5.進(jìn)入循環(huán)accept等待客戶請(qǐng)求
6.創(chuàng)建一個(gè)數(shù)據(jù)結(jié)構(gòu)容納socket和其他相關(guān)信息
7.將連進(jìn)來(lái)的socket同完成端口相關(guān)聯(lián)
8.投遞一個(gè)準(zhǔn)備接受的請(qǐng)求
以后就不斷的重復(fù)5至8的過(guò)程
那好,我們用具體的代碼來(lái)展示一下細(xì)節(jié)的操作。
至此文章也該告一段落了,我?guī)е隽艘惶诵L(fēng)般的旅游,游覽了所謂的完成端口。
posted on 2007-08-17 11:03
聶文龍 閱讀(443)
評(píng)論(0) 編輯 收藏 引用 所屬分類:
net work