作者:oldworm 可任意轉載但請指明原始鏈接
服務器程序最核心的任務之一就是處理一組任務,在處理一組任務的時候最常見的做法是用線程池,最常見的線程池一般是由一組線程等待在一個信號燈上,有一個任務到達后解鎖一個線程,讓該線程去處理任務,線程處理完成后又回歸到線程池,此做法比來一個任務分配一個線程的古老方法效率高了很多,但這也不是線程池的唯一做法,在windows下至少有三種典型線程池,由于實現上的不同效率相差很大,很有必要作一個比較,以便了解在什么情況下用什么線程池。Windows下常見的線程池實現有以下三種方式,分別是:基于信號燈的傳統線程池(以下簡稱:傳統線程池),系統線程池,完成端口線程池,下面分別介紹三種典型的線程池。
傳統線程池
前面已經提到此線程池的典型做法是讓一組線程等待在同一個信號燈上,一旦任務隊列有新任務加入,池中某線程立刻被喚醒并從任務隊列取出一個任務執行,完成后該線程回歸到線程池中。
系統線程池
系統線程池是由win2000及之后的操作系統提供的,提供了方便的應用線程池的功能,用在以下幾種場合:
Ø 以異步方式調用方法
Ø 以一定的時間間隔調用方法
Ø 當一個內核對象得到通知時,調用方法
Ø 當一個異步I/O請求完成時,調用方法
完成端口線程池
將完成端口和一組線程綁定,利用完成端口的排隊和等待機制實現,由于操作系統對完成端口有專門的優化,我們期待這種模式的線程池有更好的表現。
上面簡單介紹了三種典型線程池,但什么情況下用什么線程池,我們先來測試一下效率,后面再總結。我們的測試方法是使用以上三種典型線程池分別執行1000萬小任務,比較執行任務的時間,我們用來測試的小任務是如下的一個函數:
void singletest(void *p)
{
volatile long l = 10;
for(int i=0; i<10; i++)
{
InterlockedIncrement(&l);
}
TESTNODE *pn = static_cast<TESTNODE *>(p);
if(InterlockedDecrement(&pn->tasknum) == 0)
SetEvent(gend);
}
一旦任務結束,置一個完成事件。為了測試簡單,傳統線程池和完成端口模式線程池都用了一個固定數目的線程,例子中用的是11,沒有執行動態增減線程之類的調度操作。
經測試結果如下表:(耗時單位為毫秒)
測試次數
|
傳統線程池耗時
|
系統線程池耗時
|
完成端口線程池耗時
|
1
|
49250
|
72234
|
20391
|
2
|
50906
|
71266
|
20281
|
3
|
50156
|
73000
|
20297
|
4
|
50437
|
71157
|
20000
|
5
|
49250
|
73078
|
19547
|
6
|
49844
|
73156
|
19469
|
耗時比約為:5 : 7 : 2,差別巨大
從上表可以看出,我們平時最習慣使用的傳統線程池效率并不好,連完成端口線程池一半效率都不到,系統提供的線程池則效率更差,由此可以總結如下:
線程池模型
|
適用操作系統
|
效率
|
易用性
|
傳統線程池
|
任意
|
中
|
較麻煩,大多數人寫不出好的線程池
|
系統線程池
|
Win2000之后
|
低
|
最簡單
|
完成端口線程池
|
Win2000之后
|
高
|
較簡單
|
當然不是說系統提供的線程池一無是處,很多時候我們還是可以選擇使用系統線程池的,畢竟它的使用是最簡單的,只是需要最高效率的時候換個選擇,大多數對效率要求不是特別高的場合或你要使用TimerQueue、RegisterWaitForSingleObject、完成端口例程等的時候必須要使用系統線程池,如果不考慮9x系統和nt,那么還是不要使用自己寫的基于信號燈方式的傳統線程池吧,既沒效率也不簡單。當然如果要考慮在各種平臺下都通用,那么基于信號燈方式的傳統線程池幾乎是不二之選。
至于以上三種線程池效率差別為什么會這么大,我想各位看過這個數據的都會考慮,具體原因我將另文闡述。
測試代碼如下:
// CompareThreadpool.cpp : Defines the entry point for the console application.
//
#include "stdafx.h"
#include "CompareThreadpool.h"
#include "threadpool.h"
#include "threadgroup.h"
#ifdef _DEBUG
#define new DEBUG_NEW
#undef THIS_FILE
static char THIS_FILE[] = __FILE__;
#endif
/////////////////////////////////////////////////////////////////////////////
// The one and only application object
CWinApp theApp;
using namespace std;
HANDLE gend = INVALID_HANDLE_VALUE;
HANDLE giocp = INVALID_HANDLE_VALUE;
/**
該例子用來比較測試三種線程池,分別是:
我自己的線程池
系統提供的線程池
標準的完成端口模型
@author oldworm / oldworm@21cn.com
2007.5.22
*/
struct TESTNODE
{
volatile long tasknum; //任務總數目
DWORD start; //任務開始時間
DWORD end; //任務結束時間
};
void singletest(void *p)
{
volatile long l = 10;
for(int i=0; i<10; i++)
{
InterlockedIncrement(&l);
}
TESTNODE *pn = static_cast<TESTNODE *>(p);
if(InterlockedDecrement(&pn->tasknum) == 0)
SetEvent(gend);
// printf("num=%u, th=%u\r\n", pn->tasknum, GetCurrentThreadId());
}
void mythreadpool(void *p)
{
singletest(p);
}
DWORD WINAPI workitemfunc(void *param)
{
singletest(param);
return 0;
}
void thgroupfunc(void *pgroup, void *param)
{
// CThreadGroup *pg = static_cast<CThreadGroup *>(pgroup);
DWORD dwbyte;
TESTNODE *tn = NULL;
LPOVERLAPPED pov;
while(1)
{
GetQueuedCompletionStatus(giocp, &dwbyte, (LPDWORD)&tn, (LPOVERLAPPED*)&pov, INFINITE);
if(!tn) break;
singletest((void *)tn);
}
}
int _tmain(int argc, TCHAR* argv[], TCHAR* envp[])
{
const int THREADS = 11;
const int TASKNUMS = 10000000;
CThreadPool tp(THREADS);
CThreadGroup tg;
TESTNODE tn;
int i;
gend = CreateEvent(NULL, FALSE, FALSE, NULL);
printf("線程池效率比較,分別執行%u個小任務\r\n", TASKNUMS);
//自己線程池方式
tn.start = GetTickCount();
tn.tasknum = TASKNUMS;
for(i=0; i<TASKNUMS; i++)
{
tp.Call(mythreadpool, &tn);
}
WaitForSingleObject(gend, INFINITE);
tn.end = GetTickCount();
printf("mythreadpool方式總耗時: %u\r\n", tn.end-tn.start);
////////////////////////////////////////////
//系統線程池方式
tn.start = GetTickCount();
tn.tasknum = TASKNUMS;
for(i=0; i<TASKNUMS; i++)
{
QueueUserWorkItem(workitemfunc, &tn, WT_EXECUTEDEFAULT);
}
WaitForSingleObject(gend, INFINITE);
tn.end = GetTickCount();
printf("系統線程池方式總耗時: %u\r\n", tn.end-tn.start);
////////////////////////////////////////////
//完成端口形式
tn.start = GetTickCount();
tn.tasknum = TASKNUMS;
giocp = CreateIoCompletionPort(INVALID_HANDLE_VALUE, NULL, 0, 0);
for(i=0; i<THREADS; i++)
{
tg.AddThread(thgroupfunc, NULL);
}
tg.Start();
for(i=0; i<TASKNUMS; i++)
{
PostQueuedCompletionStatus(giocp, 0, (DWORD)&tn, NULL);
}
WaitForSingleObject(gend, INFINITE);
for(i=0; i<THREADS; i++)
{
PostQueuedCompletionStatus(giocp, 0, NULL, NULL);
}
tn.end = GetTickCount();
printf("完成端口方式總耗時: %u\r\n", tn.end-tn.start);
CloseHandle(giocp);
CloseHandle(gend);
return 0;
}