男女精品视频,久久精品国产精品亚洲精品,亚洲国产精品成人久久综合一区

高效網(wǎng)游服務(wù)器實(shí)現(xiàn)探討

隨著多核處理器的普及,如何充分利用多核并行工作就成為高性能程序設(shè)計(jì)的一個(gè)重點(diǎn)。本系列文章將圍繞高性能網(wǎng)游服務(wù)器的實(shí)現(xiàn),探討這方面的技術(shù)。

網(wǎng)游服務(wù)器的特點(diǎn)是:

具有大量客戶端連接(數(shù)百至數(shù)千個(gè)),每個(gè)客戶端都以一定的速率不斷發(fā)送和接收數(shù)據(jù);
服務(wù)器端的數(shù)據(jù)流量通常在幾個(gè)至幾十個(gè)Mbps之間;
數(shù)據(jù)需要實(shí)時(shí)處理;
數(shù)據(jù)包具有時(shí)序關(guān)系,往往需要按照嚴(yán)格的先后順序予以處理。

網(wǎng)游服務(wù)器實(shí)際上代表了一類典型的新興流數(shù)據(jù)處理服務(wù)器。這里只是為了討論方便而限定于網(wǎng)游服務(wù)器,但是所討論的原理和技術(shù)應(yīng)該是普適的。

同步多線程技術(shù)肯定是無法滿足要求的。由于每個(gè)客戶端都在持續(xù)和服務(wù)器交換數(shù)據(jù),系統(tǒng)將無法有效管理太多的線程;即使使用線程池技術(shù),所能服務(wù)的客戶連接也是很有限的。至于數(shù)據(jù)處理的實(shí)時(shí)性和數(shù)據(jù)的時(shí)序都無法顧及。

異步技術(shù)有好幾種方式,這里只討論IOCP和輪詢模式。IOCP是微軟推動(dòng)的技術(shù)。對(duì)非常大量的連接(數(shù)千至數(shù)萬)很有效。但是由于使用了多線程,這些線程需要把所需讀寫的數(shù)據(jù)通過共享的FIFO與主線程解耦(否則無法保持時(shí)序)。這就造成頻繁的線程切換,無法滿足大數(shù)據(jù)量的實(shí)時(shí)處理要求。另外,由于網(wǎng)卡只有一塊(就一個(gè)網(wǎng)絡(luò)地址而言),多線程并不能增加讀寫的速率。在另外一些時(shí)序要求不那么嚴(yán)格的場合,這些線程可以各自獨(dú)立完成所有的處理任務(wù),只需要在線程內(nèi)部保持?jǐn)?shù)據(jù)的時(shí)序。這就是向同步多線程技術(shù)退化了。

輪詢是常用的模式。程序員把需要處理的Socket連接注冊(cè)到一個(gè)數(shù)據(jù)結(jié)構(gòu)中,然后提交給系統(tǒng)檢查它們的讀寫狀態(tài)。系統(tǒng)返回可供操作的Socket連接列表供程序員逐個(gè)處理。如果有數(shù)據(jù)可讀就讀入并處理,如果可寫則把相應(yīng)的數(shù)據(jù)寫出去。為了提高效率和程序結(jié)構(gòu)的清晰起見,Socket服務(wù)器通常單獨(dú)使用一個(gè)線程,并且通過FIFO數(shù)據(jù)結(jié)構(gòu)和主線程解耦。

在單核處理器上,上面這種輪詢的模式是沒有問題的。但是在多核平臺(tái)上,用于解耦的FIFO將會(huì)變成并發(fā)瓶頸。這是因?yàn)閭鹘y(tǒng)的實(shí)現(xiàn)技術(shù)必須對(duì)FIFO加鎖。雖然網(wǎng)絡(luò)線程和主線程分別跑在不同的核上,理論上可以物理同時(shí)地運(yùn)行(如果分別操作不同的數(shù)據(jù)項(xiàng)),但是同步鎖卻強(qiáng)行迫使其中的一個(gè)線程必須等待另外一個(gè)線程退出臨界段,即使另外一個(gè)核空閑著。

這時(shí)候就需要一種支持并發(fā)的數(shù)據(jù)結(jié)構(gòu),下面稱之為ConcurrentFIFO。

public interface ConcurrentFIFO {
public Object remove();
public void put(Object o);
}

put方法把一個(gè)數(shù)據(jù)對(duì)象推進(jìn)FIFO,而remove方法從FIFO刪除并返回一個(gè)數(shù)據(jù)對(duì)象。通過精心設(shè)計(jì),ConcurrentFIFO的實(shí)現(xiàn)是線程安全的,兩個(gè)線程可以安全而同時(shí)地訪問FIFO。這樣在多核平臺(tái)上就能達(dá)到極高的性能。

通用的ConcurrentFIFO是非常難于實(shí)現(xiàn)的。基本的技術(shù)是使用原子的CAS操作來實(shí)現(xiàn)。CAS即CompareAndSet。現(xiàn)代處理器基本上都能支持這一類指令。但是這種數(shù)據(jù)結(jié)構(gòu)的實(shí)現(xiàn)的一個(gè)很大的障礙就是垃圾回收。在多線程并發(fā)運(yùn)行的情況下,被原子替換下來的數(shù)據(jù)無法得知其是否是其它線程所需要的,也就無法決定是否回收這塊內(nèi)存。除非有垃圾回收器,否則ConcurrentFIFO是很難實(shí)現(xiàn)的。(鼓吹手工管理內(nèi)存效率最高的朋友們請(qǐng)瞪大眼睛看清楚)

其實(shí),即使是對(duì)于有垃圾回收和內(nèi)建線程支持的Java語言,要想構(gòu)造一個(gè)支持并發(fā)的數(shù)據(jù)結(jié)構(gòu),也是極端困難的。java.util.concurrent包是經(jīng)過并發(fā)領(lǐng)域的專家(Doug Lea,同時(shí)也是早期lig++的主要作者,以及DLmalloc的作者。我后面討論內(nèi)存管理的時(shí)候還要提到他)精心編寫,并且由java社區(qū)的許多專家仔細(xì)評(píng)審測試之后才發(fā)布的。

現(xiàn)在來討論上次提到的并發(fā)FIFO,其實(shí)現(xiàn)需要一些特殊的技巧。我上次說要實(shí)現(xiàn)單線程讀單線程寫的FIFO,但是這里我們先來討論一般的并發(fā)FIFO。

我們知道,傳統(tǒng)的生產(chǎn)者——消費(fèi)者問題,通常是使用一個(gè)共享的緩沖區(qū)來交換數(shù)據(jù)的,生產(chǎn)者和消費(fèi)者各自有對(duì)應(yīng)的指針,在生產(chǎn)或者消費(fèi)的時(shí)候相應(yīng)地移動(dòng)。如果達(dá)到了緩沖區(qū)的邊界則回繞。如果生產(chǎn)者指針追上消費(fèi)者指針,則表明緩沖區(qū)滿了;如果消費(fèi)者指針追上生產(chǎn)者指針,則表明緩沖區(qū)空了。問題在于,為了防止在緩沖區(qū)滿的時(shí)候插入數(shù)據(jù),或者在緩沖區(qū)空的時(shí)候刪除數(shù)據(jù),生產(chǎn)者或者消費(fèi)者的每一次插入或者刪除數(shù)據(jù)操作,都必須同時(shí)訪問這兩個(gè)指針,這就帶來了不必要的同步。

在單核處理器上,共享緩沖區(qū)方式非常高效,并且具有固定的空間開銷(有時(shí)候你需要保守地估計(jì)一個(gè)比較大的數(shù)值)。但是在多核處理器上(或者SMP系統(tǒng)中),如果要實(shí)現(xiàn)并發(fā)的FIFO,就必須摒棄這種方式。使用單鏈表而不是共享緩沖區(qū)就可以避開這個(gè)問題,這是第一個(gè)技巧。

第二個(gè)技巧關(guān)系到鏈表的使用方向。一般使用鏈表,其插入或者刪除節(jié)點(diǎn)的位置是任意的。但是把鏈表作為FIFO使用,則只能也只需要在兩端操作。需要注意的是這時(shí)候必須從尾部TAIL插入新的節(jié)點(diǎn),而從頭部HEAD刪除節(jié)點(diǎn)。否則從尾部刪除節(jié)點(diǎn)之后,無從得知新的尾部在哪里,除非從頭部遍歷。這樣做的好處是,插入或者刪除都只涉及到一個(gè)節(jié)點(diǎn)。插入的時(shí)候,只要讓新創(chuàng)建的節(jié)點(diǎn)包含所需要插入的數(shù)據(jù),并且其后繼(下一個(gè)節(jié)點(diǎn))為NULL;再讓當(dāng)前尾部的節(jié)點(diǎn)的后繼從NULL變成這個(gè)新節(jié)點(diǎn),這個(gè)新節(jié)點(diǎn)也就變成了新的尾部節(jié)點(diǎn)(這里的操作順序很關(guān)鍵)。刪除的時(shí)候,則檢查當(dāng)前頭部節(jié)點(diǎn)的后繼NEXT是否NULL。若是,表明FIFO是空的;否則,取NEXT所包含的數(shù)據(jù)來使用(是的,是NEXT而不是當(dāng)前頭部節(jié)點(diǎn)所包含的數(shù)據(jù),參看下一個(gè)技巧和不變式),并把該數(shù)據(jù)從NEXT中刪除,而NEXT也成為新的頭部節(jié)點(diǎn)。(沒有配圖,各位請(qǐng)自己想象一下)

最后一個(gè)技巧:為了隔離對(duì)頭部和尾部的訪問,我們需要一個(gè)空節(jié)點(diǎn)N(不包含數(shù)據(jù)的有效節(jié)點(diǎn)),其下一個(gè)節(jié)點(diǎn)為NULL;并且引入HEAD和TAIL。在開始的時(shí)候,HEAD和TAIL都等于N。插入和刪除數(shù)據(jù)的過程上面已經(jīng)講過了,這里講一下不變式。

第一個(gè)不變式:頭部節(jié)點(diǎn)總是空的(不包含數(shù)據(jù))。在FIFO初始化的時(shí)候這是成立的。之后的插入操作不改變頭部節(jié)點(diǎn),因此對(duì)不變式?jīng)]有影響。而對(duì)于刪除操作,則每一個(gè)新頭部節(jié)點(diǎn)的數(shù)據(jù)都已經(jīng)在它成為新的頭部節(jié)點(diǎn)的時(shí)候被刪除(取用)了。

第二個(gè)不變式:插入和刪除操作沒有數(shù)據(jù)沖突,也就是說,插入線程和刪除線程不會(huì)同時(shí)讀寫同一項(xiàng)數(shù)據(jù)(不是節(jié)點(diǎn))。我們只需要考慮FIFO為空,即相當(dāng)于剛剛完成初始化之后的情況。對(duì)于空節(jié)點(diǎn)N,插入操作改變其后繼,刪除操作則檢查其后繼。只要插入線程保證先讓新節(jié)點(diǎn)包含數(shù)據(jù)再把新節(jié)點(diǎn)插入鏈表(也就是不能先插入空節(jié)點(diǎn),再往節(jié)點(diǎn)中填入數(shù)據(jù)),那么刪除線程就不會(huì)拿到空的節(jié)點(diǎn)。我們看到,唯一可能發(fā)生爭用的地方就是N的后繼指針,插入線程只要在更新N的后繼指針之前準(zhǔn)備好其它相關(guān)數(shù)據(jù)和設(shè)置即可。

這意味著,如果能夠做到:1)一個(gè)線程對(duì)數(shù)據(jù)的更新能夠被另外一個(gè)線程即刻看到;2)對(duì)數(shù)據(jù)的讀或者寫(更新和讀取N的后繼指針)都是原子的;3)指令沒有被亂序執(zhí)行。那么在單線程讀單線程寫的情況下,甚至不需要使用鎖就可以安全地完成并發(fā)FIFO;如果有多個(gè)生產(chǎn)者線程,則增加一個(gè)生產(chǎn)者鎖;如果有多個(gè)消費(fèi)者線程,則可以增加一個(gè)消費(fèi)者鎖。也就是說,可以有四種組合。

但是實(shí)際情況遠(yuǎn)非如此。對(duì)于2)是容易滿足的,因?yàn)楝F(xiàn)代通用處理器上32位數(shù)據(jù)的讀或者寫通常都是原子的。對(duì)于1),則取決于系統(tǒng)的內(nèi)存模型:在強(qiáng)內(nèi)存模型如C/C++中是滿足的,在弱內(nèi)存模型如Java中則不然。但是主要的問題還在于3)。由于指令的亂序執(zhí)行,第二個(gè)不變式所需要的保證很可能被破壞,即使代碼確實(shí)是那樣寫的。因此鎖是必不可少的,因?yàn)榧渔i的同時(shí)還會(huì)插入內(nèi)存屏障。

這樣看來,上次說的SRSW并發(fā)FIFO就沒有特別的意義了。干脆就用兩個(gè)鎖分別對(duì)應(yīng)生產(chǎn)者和消費(fèi)者,而并不限制生產(chǎn)者或者消費(fèi)者的數(shù)量:T_LOCK和H_LOCK。在插入新建節(jié)點(diǎn)到鏈表尾部的時(shí)候使用T_LOCK,而在對(duì)頭部操作的時(shí)候使用H_LOCK。

具體的代碼這里先不給了。這里的算法不是我發(fā)明的,而是來自Maged M. Michael 和 Michael L. Scott的Simple, Fast, and Practical Non-Blocking and Blocking Concurrent Queue Algorithms。請(qǐng)參考其雙鎖算法的偽碼。

現(xiàn)在來討論游戲消息的傳送。在一個(gè)網(wǎng)游的運(yùn)營成本中,帶寬費(fèi)用應(yīng)該是很大的一塊。因此如何高效編碼以及收發(fā)消息就成為節(jié)省運(yùn)營成本的關(guān)鍵。這里面能做很多文章。

首先是一個(gè)基本的判斷:隨著處理器的計(jì)算能力不斷提高,以及多核的日益普及,在消息的編碼以及收發(fā)環(huán)節(jié),CPU資源將不會(huì)成為瓶頸。相對(duì)的,應(yīng)該千方百計(jì)考慮如何在保證游戲正常運(yùn)行的前提下,降低不必要的通信開銷。也就是說,可以對(duì)游戲中的消息進(jìn)行一些比較復(fù)雜的編碼。

那么游戲中都有哪些消息?我們知道聊天和語音消息優(yōu)先級(jí)比較低,而且可以通過專門的服務(wù)器來處理。真正比較關(guān)鍵、能夠影響玩家的游戲體驗(yàn)的,是那些狀態(tài)變更、動(dòng)作、玩家之間或者玩家和服務(wù)器/NPC之間的實(shí)時(shí)交互的消息。尤其是,這些消息的傳送有嚴(yán)格的時(shí)序要求。如果一個(gè)玩家先看到自己的角色被砍死,然后才看到對(duì)方發(fā)出來的攻擊動(dòng)作,甚至根本沒有看到對(duì)方有什么動(dòng)作,他/她肯定會(huì)憤憤不平。因此,消息系統(tǒng)必須保證每一條消息的及時(shí)傳遞,并且不能打亂它們之間的順序。

這意味著,每一條消息必須有明確的邊界。也就是說,收到一條消息之后,接收方必須能夠明確這條消息有多少個(gè)字節(jié)。這是一條顯而易見的要求。但是大概是出于慣性,在實(shí)踐中它常常變?yōu)橄⒕幋a中的長度字段。

這無疑是一種浪費(fèi)。很多消息的長度是固定的,僅僅靠檢查其消息類型就可以了解其邊界。變長消息的處理后面會(huì)討論。我這里并不是說要把具體的游戲邏輯與網(wǎng)絡(luò)代碼混在一起。通過使用元數(shù)據(jù)就可以有效的把網(wǎng)絡(luò)代碼跟具體的游戲邏輯有效隔離開來。關(guān)于元數(shù)據(jù)的使用后面也會(huì)詳加探討。今天時(shí)間不多了,下面討論消息類型的編碼作為結(jié)束。

通常一個(gè)字節(jié)會(huì)被用來編碼消息的類型,以方便接收方的解碼。但是我們知道,游戲中并不是每種類型的消息的傳送頻率都是一樣的。事實(shí)上,我們知道哪些消息會(huì)被大量發(fā)送,哪些消息的頻率會(huì)低很多,而另外一些消息,一天也不會(huì)有幾條。明乎此,就可以采用非對(duì)稱的編碼方式來編碼消息的類型。這就是Huffman編碼。對(duì)于占據(jù)了絕大部分通信量的狀態(tài)變更消息而言,即使每條消息節(jié)省下半個(gè)字節(jié),也是非常劃算的。以我的經(jīng)驗(yàn),一臺(tái)普通PC可以作為服務(wù)器支持2000人同時(shí)在線的實(shí)時(shí)動(dòng)作類游戲,消息通量是每秒10000條;如果一個(gè)服務(wù)集群有5臺(tái)處理器,那么就相當(dāng)于節(jié)省了200kbps的帶寬。這還僅僅是從消息類型編碼方面榨取的。當(dāng)然,Huffman編碼的解碼是比較麻煩的,效率也會(huì)低一些。但是正如前面所指出的,這部分的運(yùn)行開銷并不會(huì)造成性能瓶頸。

posted on 2009-01-02 03:49 小王閱讀(893) 評(píng)論(1) 編輯收藏引用所屬分類: 網(wǎng)絡(luò)通訊

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

常用鏈接

留言簿(16)

隨筆分類(443)

隨筆檔案(381)

Linux

游戲開發(fā)

綜合

最新隨筆

搜索

最新隨筆

最新評(píng)論

閱讀排行榜

評(píng)論排行榜

只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。


相關(guān)文章: 非boost版本的asio無法識(shí)別asio::placeholders::error和boost::system::error_code libevent 無法解析的外部符號(hào) __imp__WSASend UDT協(xié)議-基于UDP的可靠數(shù)據(jù)傳輸協(xié)議 (TCP-over-UDP library)基于UDP協(xié)議之上實(shí)現(xiàn)通用、可靠、高效的TCP協(xié)議 TCP短連接與長連接拼包函數(shù)及網(wǎng)絡(luò)封包的異常處理常用的setsockopt 使用VC9+PlatformSDK編寫WinSock程序時(shí)，#include WinSock2.h文件導(dǎo)致類型重定義問題（麻辣隔壁的，微軟又想搞什么花樣）隧道技術(shù)及其應(yīng)用（架設(shè)服務(wù)器集群的理想選擇） Socket程序開發(fā)，發(fā)送端寫入數(shù)據(jù)成功，接收端收不到數(shù)據(jù)的現(xiàn)象分析

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理