作者:CppExplore http://www.shnenglu.com/CppExplore/和http://blog.csdn.net/cppexplore同步發(fā)布
一 服務器分類
從軟件性能角度,高性能服務器分:cpu密集型服務器/IO密集型服務器
(1)CPU密集型:該類服務器沒有對io的訪問/沒有同步點,性能瓶頸在于對cpu的充分利用。
典型的如轉發(fā)服務器/代理服務器/協(xié)議轉換類服務器/分布式總線服務器等。
(2)IO密集型:該類服務器存在對cache/db/硬盤等的同步訪問,或者對fcgi/其他服務器等的同步訪問。
簡單說有同步訪問點的均歸屬此類服務器。當前硬件基礎下,有同步操作的服務器,性能瓶頸均在同步點的返回快慢上,而非cpu。
二 網絡層機制
對上述兩類服務器,均需要同樣高效的網絡層機制。當前高效的網絡層也就是大家熟知的iocp/epoll/kqueue/port/dev.poll等,在各個os下使用宿主os推薦的高效網絡層機制,任何通過其他機制繞過這些機制的做法都不可能達到最好性能。這里推薦下boost.asio,文檔齊全,示例豐富,學習曲線平緩。
三 CPU密集型服務器設計
(1)單進程單線程是改類服務器的本質特征。
整個進程只存在一個線程,所有代碼均運行在同一個線程中,均順序執(zhí)行,任何地方不需要加鎖。由于網絡線程的存在,實際上該類程序的唯一線程就是網絡線程,以linux為例,就是epoll線程。
在多核情況下,fork和cpu個數相同的進程數并且如果可能使用sched_setaffinity類函數將進程和cpu綁定。以充分利用多核性能。
該類服務器的代表:tuxedo/nginx.
(2)單進程多線程,但多線程均完成同樣的功能,彼此之間互不依賴/互不影響 ,這是該類服務器的變體。
單進程單線程無疑是該類服務器最理想最完美的實現。但有時候為了簡化部署,簡化業(yè)務上報,業(yè)務自檢,統(tǒng)一日志,尤其是統(tǒng)計類日志/配置動態(tài)生效等附加功能考慮,不得已犧牲少許性能而將上述“單進程單線程,fork多個充分利用多核”方案改造為“獨立多線程充分利用多核”方案。
該方案中,多線程中的各個線程仍然是順序執(zhí)行,任何地方不需要加鎖,均為獨立的網絡線程。
相對方案(1), 該方案編程更復雜,而linux下線程調度又不如進程高效,整體看為方便性犧牲了少許性能。
該類服務器的代表:我們的協(xié)議轉換網關/分布式總線服務器等。
(3)高效算法
優(yōu)化耗時較多算法/挑選合適容器,完成固定任務,盡量減少cpu的運算量。
(4)錯誤設計:區(qū)分網絡線程/業(yè)務線程,將業(yè)務線程根據業(yè)務特點劃分各個線程階段。
對cpu密集型的服務器來說,關鍵在于充分利用cpu,盡量減少無用代碼的執(zhí)行。引如中間處理線程,意味著引入鎖切換/內存復制/更多無效代碼,不可否認,在已有協(xié)議棧情況下,根據業(yè)務特點化分線程可以簡化編程。單純的單一線程意味著更復雜的編碼,尤其是涉及到更多中間狀態(tài)時。
在該場景下,有位牛人,對線程的點評:“線程是給那些不能將程序執(zhí)行序轉換成狀態(tài)機的笨人用的” 這句話真是再合適不過了。
四 IO密集型服務器設計
(1)網絡層多線程,中間線程按照業(yè)務特點設定,同步點操作使用多線程
同步點使用多線程是該類服務器的本質特征。在同步操作的返回時間不能由本服務器控制的前提下,本服務器所能做的也就只能是加多線程數,提供同步并發(fā)數。線程數的最優(yōu)配置取決于網絡層入口并發(fā)數以及同步操作返回的時間。簡單劃分可以網絡線程數=cpu個數/2.同步點線程數還取決于同步操作的代價,若為廉價的cache操作,則可適當增多,若為昂貴的db操作,則要根據可以分配的連接數決定。
(2)減少人為產生的同步點
盡量減少訪問其他系統(tǒng)使用同步接口。
(3)優(yōu)化同步點
根據同步操作的特點優(yōu)化: 異步/增大緩存/批量等。
五 內存操作/鎖機制/內核態(tài)用戶態(tài)切換/日志操作
(1)內存操作
內存申請:減少內存動態(tài)分配,推薦tcmalloc
內存復制:CPU密集型,必須的內存復制:(a)網絡讀:處從內核態(tài)復制到用戶態(tài),僅1次 (b)網絡寫:異步內存復制/用戶態(tài)到內核態(tài) ,僅2次
IO密集型,內存復制非關鍵點。
(2)鎖機制 CPU密集型:盡量無鎖. IO密集型: 非關鍵點
(3)內核態(tài)用戶態(tài)切換
兩類服務器均相同,盡量減少內核態(tài)/用戶態(tài)互相切換:每次調用系統(tǒng)調用盡可能讀取更多字符/僅可能減少不必要的系統(tǒng)調用(去除不必要的調用/通過緩存機制減少調用次數)。
(4)日志操作 略
六 進程vs線程vs協(xié)程
進程和線程(略)
協(xié)程:和進程/線程這種cpu調度單元不同,它更多是線程內對象之間一種調度理念的優(yōu)化。協(xié)程對象有自己的堆棧,可以通過直接跳轉直接轉換執(zhí)行點,減少了內存尋址操作。它特別適合用來優(yōu)化線程內的某些基礎組件,包括:狀態(tài)機/調停者模式(或者線程內隊列)。
在CPU密集型服務器的設計中,說道“線程是給那些不能將程序執(zhí)行序轉換成狀態(tài)機的笨人用的”,而有了協(xié)程,我們有了一種新的簡化編程的方法。將協(xié)程用于網絡層,可以手動實現類似select的功能,用于多對象參與的復雜中間狀態(tài),可以簡化編程。
但從整體性能角度看,協(xié)程則是雞肋的存在,從幾年前出現boost.Coroutine,到現在該項目停止開發(fā),boost引入更多其他方案asio/mpl/statechart,協(xié)程一路蹣跚。
七 總結
在當前硬件體系架構下,服務器性能的關鍵仍然是傳統(tǒng)的cpu/io/memory.
cpu密集型的服務器,需要最大限度充分利用所有cpu,以及盡量少的進行內存申請/內存復制。
IO密集型服務器,需要最大限度提高io能力,為達到該目的,可以在非同步線程犧牲對cpu的利用率/犧牲對memory的高效使用,一切為提高io并發(fā)能力服務。
八 后記
特別感謝張杰同學代替我編譯探測程序代碼,讓我有時間碼點文字。