07年我寫了一篇文章叫《我的網(wǎng)絡(luò)模塊設(shè)計(jì)》,姑且叫那個(gè)為第一版吧,由于持續(xù)對(duì)網(wǎng)絡(luò)模塊進(jìn)行改進(jìn),所以現(xiàn)在的實(shí)現(xiàn)和當(dāng)時(shí)有很大改變,加上上層應(yīng)用越來越多,又經(jīng)過了幾年時(shí)間考驗(yàn),現(xiàn)在的實(shí)現(xiàn)方式比之前的更靈活更有效率,也因?yàn)樽罱戳艘恍┤俗鼍W(wǎng)絡(luò)程序多年竟毫無建樹,一直要用別人寫的網(wǎng)絡(luò)模塊,所以有感而寫此文,為了使得此文不受上一篇《我的網(wǎng)絡(luò)模塊設(shè)計(jì)》的影響,我決定寫之前不看原來的文章,所以此文跟原文那篇文章可能沒有太多相似性。
一個(gè)基本的網(wǎng)絡(luò)模塊,無非就是管理N個(gè)連接,快速處理每個(gè)連接的收發(fā)數(shù)據(jù)、消息等,所謂好的網(wǎng)路模塊,無非就是穩(wěn)定、高效、靈活,下面分幾部分來寫:
一、 連接管理
之所以首先寫連接管理,是因?yàn)檫B接管理是核心,也是最難的地方,我寫第一個(gè)網(wǎng)絡(luò)庫(kù)之前,搜索過很多當(dāng)時(shí)可以找到的例子工程,當(dāng)時(shí)幾乎找不到可穩(wěn)定運(yùn)行的工程,當(dāng)然更找不到好的,于是摸索前進(jìn),期間對(duì)連接管理使用了各種方法,從最早一個(gè)cs(臨界區(qū)CriticalSection,我簡(jiǎn)稱cs),recv send都用這個(gè)cs,到后來send用一個(gè)cs,recv用一個(gè)cs,用多個(gè)的時(shí)候還出過錯(cuò),最后使用一個(gè)cs+一個(gè)原子值ref管理一個(gè)連接,每個(gè)連接send的時(shí)候用cs,recv的時(shí)候用ref,如果該連接的消息要跨線程異步執(zhí)行,也使用ref,如此較簡(jiǎn)單的解決了連接管理的問題。
同樣使用生存期管理方法,也有人用智能指針,雖然原理和我直接操縱生存期一樣,但實(shí)現(xiàn)方法畢竟不同,不過我為了讓實(shí)現(xiàn)依賴少一些沒有引入智能指針。
當(dāng)然我后來也發(fā)現(xiàn)很多人不是用這種方法,如有些人就id來管理連接,每個(gè)連接分個(gè)id,其他操作全部用id,每次對(duì)連接的調(diào)用先翻譯一下,如果id找得到映射目標(biāo)就調(diào)用,否則就說明該連接不存在了,這種方法簡(jiǎn)單只是不直接,多了個(gè)查找過程,另外查找的時(shí)候可能還需要全局鎖(這依賴于連接數(shù)據(jù)組織)。
也有人使用一個(gè)線程管理連接,其他所有與該連接有關(guān)的生存期問題全部到該線程處理,這樣也是可行的,只是需要做一個(gè)較好的包裝,如果包裝好上層調(diào)用方便,如果包裝不好,可能上層調(diào)用就有一些約束。
雖然各種方法都有人使用,但我一直選擇直接的生存期管理方法,其實(shí)內(nèi)部實(shí)現(xiàn)的時(shí)候還是有很多優(yōu)化措施的,減少了大量addref、release的調(diào)用,進(jìn)一步提高了效率。
二、 線程組
我最初做網(wǎng)絡(luò)庫(kù)的時(shí)候還不是很清楚上層如何使用這個(gè)庫(kù),后來在上面做了幾個(gè)應(yīng)用之后慢慢有了更多想法,最近的網(wǎng)絡(luò)庫(kù)是設(shè)計(jì)了這么幾組線程:io線程組、同步線程組、異步線程組、時(shí)鐘線程組、log線程組,每組線程都可開可關(guān),就算io線程組也是可關(guān)的,這只是為了整個(gè)庫(kù)更靈活適用性更廣泛,如只用同步線程組或異步線程組僅將這個(gè)線程組當(dāng)一個(gè)消息隊(duì)列使用。
Io線程組就是處理io收發(fā)的,listen recv send 以及解密解壓縮都是在這組線程,一般這組線程會(huì)開2個(gè)或2*cpu個(gè)。
同步線程組,一般這組線程開1個(gè),用來處理logic。
異步線程組,這組線程根據(jù)需要開0個(gè)或n個(gè),簡(jiǎn)單應(yīng)用無db等慢速操作的應(yīng)用不開,有很多db等慢速操作的可以開很多個(gè)。
時(shí)鐘線程組,一般不開或開1個(gè)。
Log線程組,一般開1個(gè),主要為了避免其他線程調(diào)用WriteLog的時(shí)候被磁盤io阻塞,所以弄了一個(gè)log線程。
其實(shí)還有一個(gè)主線程,我的每組線程(包括主線程)都支持事件和定時(shí)器,io線程、同步線程、異步線程組、時(shí)鐘線程組、甚至log線程組都支持事件和定時(shí)器,到去年我還只是讓每組線程都支持事件,今年為了更好的使用時(shí)鐘我給每組線程設(shè)計(jì)了定時(shí)器,現(xiàn)在定時(shí)器線程組有點(diǎn)雞肋的味道,一般是用不上專門的定時(shí)器線程組,不過我還沒有將它刪掉,主要在我的設(shè)計(jì)里面,它和同步異步線程組一樣,都只是一組線程,如果必要的時(shí)候可以將它用作同步線程或者異步線程組,所以繼續(xù)保留了它的存在。
這幾組線程之間都是可互發(fā)消息的,所以一個(gè)邏輯要異步到別的線程執(zhí)行是非常方便的,只要調(diào)用一下PostXXEvent(TlsInfo *ptls, DWORD dwEvent, WPARAM wParam, LPARAM lParam);我憑借這個(gè)設(shè)計(jì)使得這套網(wǎng)絡(luò)庫(kù)幾乎可以適用上層各種應(yīng)用,不管是非常簡(jiǎn)單的網(wǎng)絡(luò)應(yīng)用還是復(fù)雜的,一框打盡。對(duì)最簡(jiǎn)單的,一個(gè)io線程搞定,其他線程全關(guān),對(duì)于復(fù)雜的io線程+同步+異步+log全開。
三、 內(nèi)存池
內(nèi)存池其實(shí)沒有想象中的那么神秘,當(dāng)然如果要讓一個(gè)網(wǎng)絡(luò)程序持續(xù)7*24小時(shí)穩(wěn)定高效運(yùn)行,內(nèi)存池幾乎必不可少的,內(nèi)存池的作用首先是減少內(nèi)存碎片,其次是為了提高速度,我想這兩點(diǎn)很容易想明白的,關(guān)于內(nèi)存池我之前寫了系列文章,可參考我的博客:
《內(nèi)存池之引言》 http://blog.csdn.net/oldworm/archive/2010/02/04/5288985.aspx
《單線程內(nèi)存池》 http://blog.csdn.net/oldworm/archive/2010/02/04/5289003.aspx
《多線程內(nèi)存池》 http://blog.csdn.net/oldworm/archive/2010/02/04/5289006.aspx
《dlmalloc、nedmalloc》 http://blog.csdn.net/oldworm/archive/2010/02/04/5289010.aspx
《線程關(guān)聯(lián)內(nèi)存池》 http://blog.csdn.net/oldworm/archive/2010/02/04/5289015.aspx
《線程關(guān)聯(lián)內(nèi)存池再提速》 http://blog.csdn.net/oldworm/archive/2010/02/04/5289018.aspx
四、 定時(shí)器
關(guān)于定時(shí)器,上面講線程組的時(shí)候已經(jīng)講過,我現(xiàn)在的設(shè)計(jì)是每個(gè)線程(包括主線程)都支持定時(shí)器,調(diào)用方法都是一樣的,回調(diào)函數(shù)形式也是一樣的,由于定時(shí)器放到各組線程里面,所以減少了線程之間的切換,提高了效率。
關(guān)于定時(shí)器,可參考《定時(shí)器模塊改造》 http://blog.csdn.net/oldworm/archive/2010/09/11/5877425.aspx
五、 包格式
關(guān)于包格式可參考《常用cs程序自定義數(shù)據(jù)包描述》 http://blog.csdn.net/oldworm/archive/2010/03/24/5413013.aspx
六、 Buffer
之前的文章其實(shí)我一直沒有提過我的buffer,其實(shí)我的buffer設(shè)計(jì)是很靈活的,現(xiàn)在它和pool也是有些關(guān)聯(lián)的,我的poolset其實(shí)底下就是按照各種不同大小的buffer預(yù)設(shè)的尺寸。Buffer我設(shè)計(jì)為循環(huán)式,不允許回繞,包含
Char *pbase 塊基址
Char *pread 當(dāng)前讀指針
Char *pwrite 當(dāng)前寫指針
DWORD tag;
Buffer *next;
Capacity 總分配尺寸,上面分配的時(shí)候可能只是指定了19,但實(shí)際可能分配的是32個(gè)字節(jié),所以內(nèi)部用的時(shí)候要根據(jù)capacity來最大限度的利用緩沖區(qū)。
Buffer分配還利用了一個(gè)技巧,事實(shí)上分配的時(shí)候是一次分配一個(gè)需要的大緩沖,前面為Buffer自身的數(shù)據(jù),后面為數(shù)據(jù)部分,pbase指向數(shù)據(jù)部分,這樣處理減少了一次分配,我估計(jì)很多人都在用這個(gè)技巧。
Pwrite總是不會(huì)小于pread的,但pread可能和pbase不一樣,僅當(dāng)后面空余空間不夠用的時(shí)候才可能會(huì)移動(dòng)數(shù)據(jù),否則數(shù)據(jù)不會(huì)移動(dòng)。
WSARecv的時(shí)候我是這么處理的,如果首次獲取了一個(gè)包的一部分,但buffer中還有足夠的空間放下包的剩余部分,我不會(huì)再分配一個(gè)buffer去recv,而是直接用原buffer指定一個(gè)合適的偏移和size去WSARecv,這樣可以最大限度的減少?gòu)?fù)制。
剛才還有朋友問到我recv的層次組織,我的網(wǎng)絡(luò)庫(kù)里面是這樣組織的,OnRecv是個(gè)虛函數(shù),最基礎(chǔ)的IocpClient的OnRecv只處理數(shù)據(jù)而不解析格式,IocpClientMsg就會(huì)認(rèn)識(shí)默認(rèn)的一種包格式,這個(gè)類的OnRecv會(huì)將m_recvbuf中的數(shù)據(jù)組織為msg,并盡可能的一次返回更多個(gè)msg,回調(diào)OnMsg函數(shù),由上層決定該消息在哪個(gè)線程處理,這樣我認(rèn)為是最靈活的,如果是個(gè)很小的server,可能直接就在io線程里面處理了,也可postevent到同步線程處理,亦可PostEvent到異步線程處理。
七、 TLSINFO
TlsInfo顧名思義就是每個(gè)線程關(guān)聯(lián)的一組數(shù)據(jù),暫時(shí)我還沒有看到別人這么設(shè)計(jì),也許我設(shè)計(jì)得有些復(fù)雜了,在這個(gè)數(shù)據(jù)里面有一些常用的和該線程相關(guān)的數(shù)據(jù),如該線程的分配基、步長(zhǎng),用這兩個(gè)參數(shù)可讓每個(gè)線程制造出唯一序列,還有常用pool的地址,如tm_pool *p1k; tm_pool *p2k;… 這樣設(shè)計(jì)使得要分配的時(shí)候直接取tm_pool,最大限度的發(fā)揮了分配速度,還有一些常規(guī)參量long c; long d; DWORD a; DWORD b;… 這幾個(gè)值可理解為棧內(nèi)值,其實(shí)為了減少上層調(diào)用復(fù)雜度的,如我將一個(gè)連接的包從io線程PostEvent到同步線程處理,PostEvent首參數(shù)就是tlsinfo,PostEvent會(huì)根據(jù)tlsinfo里面的一個(gè)內(nèi)部值決定是不是要調(diào)用addref,因?yàn)槲矣袀€(gè)地方預(yù)增了2,所以大多數(shù)情況下在io發(fā)到其他線程的時(shí)候是無需調(diào)用addref的,提高了效率,tlsinfo里的其他一些值上層應(yīng)用可使用,用在邏輯處理等情況下。
八、 性能分析
*nix下有很多知名的網(wǎng)絡(luò)庫(kù),但在win下特別是使用iocp的庫(kù)里面,一直就沒有一個(gè)能作為基準(zhǔn)的庫(kù),即使asio也因?yàn)槌鰜硖聿粸榇蠖鄶?shù)人熟悉而不能成為基準(zhǔn)庫(kù),libevent接iocp由于采用0 buffer模擬所以也沒有發(fā)揮出足夠的性能,對(duì)比spserver我比它快70%左右,我總在想要是微軟能將他那個(gè)iocp的例子寫得更好一點(diǎn)就好了,至少學(xué)的人有一個(gè)更高一點(diǎn)的基礎(chǔ),而不至于讓http://www.codeproject.com/KB/IP/iocp_server_client.aspx這樣的垃圾代碼都能成為很多人的樣板。
九、 雜談
為了寫好一個(gè)win下穩(wěn)定高效的網(wǎng)絡(luò)庫(kù),我07年的時(shí)候幾乎搜遍了那個(gè)時(shí)間段之前所有能找到的iocp例子,還包括通過朋友等途徑看到的如snda等網(wǎng)絡(luò)庫(kù),可惜真沒找到好的,大多數(shù)例子是只要多線程發(fā)起幾千個(gè)連接不斷發(fā)送數(shù)據(jù)馬上就死了,偶爾幾個(gè)不死的(包括snda的)只要隨機(jī)連接并斷開就會(huì)產(chǎn)生句柄泄漏,關(guān)閉所有連接之后句柄并不關(guān)閉等,也就是說這些例子連基本的生存期管理都沒搞定,能通過生存期管理并且不死的只有有限的幾個(gè),可惜性能又太差,杯具啊。
早年寫網(wǎng)絡(luò)庫(kù)的時(shí)候也加入了sodme在google上建的那個(gè)群,當(dāng)時(shí)群還是很熱鬧的,可惜大多數(shù)人都是摸索,所以很多問題只是討論卻從無定論,沒有誰(shuí)能說服別人,也沒有人可輕易被說服,要是現(xiàn)在或許有一些很有經(jīng)驗(yàn)的人,可惜那個(gè)群由于GFW現(xiàn)在雖能訪問也不大活躍了。
最近看到有些寫網(wǎng)絡(luò)程序7年甚至更久的人還在用libevent、ace等感想很復(fù)雜,可悲的是那些人還沒意識(shí)到用一個(gè)庫(kù)和寫一個(gè)庫(kù)有多大的區(qū)別,可能那些人一輩子也認(rèn)識(shí)不到寫一個(gè)庫(kù)比用一個(gè)庫(kù)難多少,那些人以為這些庫(kù)基本會(huì)用了,讓他自己去寫也基本是照這個(gè)模式,不會(huì)有什么突破,就無需自己動(dòng)手了,悲哀啊。當(dāng)然,要寫一個(gè)穩(wěn)定的網(wǎng)絡(luò)庫(kù)需要耗費(fèi)很多時(shí)間,特別是要寫一個(gè)能和知名庫(kù)性能接近或更好的庫(kù),更是要費(fèi)神費(fèi)力,沒點(diǎn)耐心和持久力是不可能做好的。在中文領(lǐng)域隨便查什么稍有些名氣的代碼,總是能找到很多剖析類文章,可原創(chuàng)的東西總是很少,也不知道那些大俠怎么搞的,什么都能剖析可怎么總寫不出什么像樣的東西呢。
其實(shí)本來沒有打算寫這篇文章,可能是看了陳碩的muduo才使得我有了寫出來的沖動(dòng),大概是受到他的開源鼓勵(lì)吧。
謹(jǐn)以此文記錄本人最近3年對(duì)網(wǎng)絡(luò)模塊的修改并簡(jiǎn)短總結(jié)。