muduo (http://code.google.com/p/muduo) 是一個(gè)基于 Reactor 模式的 C++ 網(wǎng)絡(luò)庫,我在編寫它的時(shí)候并沒有以高并發(fā)高吞吐為主要目標(biāo),但出乎我的意料,ping pong 測試表明,muduo 吞吐量比 boost.asio 高 15% 以上。
測試對象
測試環(huán)境
硬件:DELL 490 工作站,雙路 Intel quad core Xeon E5320 CPU,16G 內(nèi)存
操作系統(tǒng):Ubuntu Linux Server 10.04.1 LTS x86_64
編譯器:g++ 4.4.3
測試方法
依據(jù) asio 性能測試 http://think-async.com/Asio/LinuxPerformanceImprovements 的辦法,用 ping pong 協(xié)議來測試吞吐量。
簡單地說,ping pong 協(xié)議是客戶端和服務(wù)器都實(shí)現(xiàn) echo 協(xié)議。當(dāng) TCP 連接建立時(shí),客戶端向服務(wù)器發(fā)送一些數(shù)據(jù),服務(wù)器會(huì) echo 回這些數(shù)據(jù),然后客戶端再 echo 回服務(wù)器。這些數(shù)據(jù)就會(huì)像乒乓球一樣在客戶端和服務(wù)器之間來回傳送,直到有一方斷開連接為止。這是用來測試吞吐量的常用辦法。
asio 的測試代碼取自 http://asio.cvs.sourceforge.net/viewvc/asio/asio/src/tests/performance/ ,未作更改。
muduo 的測試代碼在 0.1.1 軟件包內(nèi),路徑為 examples/pingpong/,代碼如 http://gist.github.com/564985 所示。
muduo 和 asio 的優(yōu)化編譯參數(shù)均為 -O2 -finline-limit=1000
$ BUILD_TYPE=release ./build.sh # 編譯 muduo 的優(yōu)化版本
我主要做了兩項(xiàng)測試:
- 單線程測試,測試并發(fā)連接數(shù)為 1/10/100/1000/10000 時(shí)的吞吐量。
- 多線程測試,并發(fā)連接數(shù)為 100 或 1000,服務(wù)器和客戶端的線程數(shù)同時(shí)設(shè)為 1/2/3/4。(由于我家里只有一臺 8 核機(jī)器,而且服務(wù)器和客戶端運(yùn)行在同一臺機(jī)器上,線程數(shù)大于 4 沒有意義。)
所有測試中,ping pong 消息的大小均為 16k bytes。測試用的 shell 腳本可從 http://gist.github.com/564985 下載。
測試結(jié)果
單線程測試的結(jié)果,數(shù)字越大越好:
多線程測試的結(jié)果,數(shù)字越大越好:
測試結(jié)果表明 muduo 吞吐量平均比 asio 高 15% 以上。
討論
muduo 出乎意料地比 asio 性能優(yōu)越,我想主要得益于其簡單的設(shè)計(jì)和簡潔的代碼。
asio 在多線程測試中表現(xiàn)不佳,我猜測其主要原因是測試代碼只使用了一個(gè) io_service,如果改用“io_service per CPU”的話,性能應(yīng)該有所提高。我對 asio 的了解程度僅限于能讀懂其代碼,希望能有 asio 高手編寫“io_service per CPU”的 ping pong 測試,以便與 muduo 做一個(gè)公平的比較。
ping pong 測試很容易實(shí)現(xiàn),歡迎其他網(wǎng)絡(luò)庫(ACE、POCO、libevent 等)也能加入到對比中來,期待這些庫的高手出馬。