摘自:http://www.diybl.com/course/3_program/c++/cppjs/2008426/111619.html
去年11月的MSDN雜志曾刊登過一篇文章 Break Free of Code Deadlocks in Critical Sections Under Windows ,Matt Pietrek 和 Russ Osterlund 兩位對臨界區(Critical Section)的內部實現做了一次簡短的介紹,但點到為止,沒有繼續深入下去,當時給我的感覺就是癢癢的,呵呵,于是用IDA和SoftIce大致分析了一下臨界區的實現,大致弄明白了原理后也就沒有深究。現在乘著Win2k源碼的東風,重新分析一下這塊的內容,做個小小的總結吧 :P
臨界區(Critical Section)是Win32中提供的一種輕量級的同步機制,與互斥(Mutex)和事件(Event)等內核同步對象相比,臨界區是完全在用戶態維護的,所以僅能在同一進程內供線程同步使用,但也因此無需在使用時進行用戶態和核心態之間的切換,工作效率大大高于其它同步機制。
臨界區的使用方法非常簡單,使用 InitializeCriticalSection 或 InitializeCriticalSectionAndSpinCount 函數初始化一個 CRITICAL_SECTION 結構;使用 SetCriticalSectionSpinCount 函數設置臨界區的Spin計數器;然后使用 EnterCriticalSection 或 TryEnterCriticalSection 獲取臨界區的所有權;完成需要同步的操作后,使用 LeaveCriticalSection 函數釋放臨界區;最后使用 DeleteCriticalSection 函數析構臨界區結構。
以下是MSDN中提供的一個簡單的例子:
以下為引用:
// Global variable
CRITICAL_SECTION CriticalSection;
void main()
{
...
// Initialize the critical section one time only.
if (!InitializeCriticalSectionAndSpinCount(&CriticalSection, 0x80000400) )
return;
...
// Release resources used by the critical section object.
DeleteCriticalSection(&CriticalSection)
}
DWORD WINAPI ThreadProc( LPVOID lpParameter )
{
...
// Request ownership of the critical section.
EnterCriticalSection(&CriticalSection);
// Access the shared resource.
// Release ownership of the critical section.
LeaveCriticalSection(&CriticalSection);
...
}
首先看看構造和析構臨界區結構的函數。
InitializeCriticalSection 函數(ntosdll esource.c:1210)實際上是調用 InitializeCriticalSectionAndSpinCount 函數(resource.c:1266)完成功能的,只不過傳入一個值為0的初始Spin計數器;InitializeCriticalSectionAndSpinCount 函數主要完成兩部分工作:初始化 RTL_CRITICAL_SECTION 結構和 RTL_CRITICAL_SECTION_DEBUG 結構。前者是臨界區的核心結構,下面將著重討論;后者是調試用結構,Matt 那篇文章里面分析的很清楚了,我這兒就不羅嗦了 :P
RTL_CRITICAL_SECTION結構在winnt.h中定義如下:
以下為引用:
typedef struct _RTL_CRITICAL_SECTION {
PRTL_CRITICAL_SECTION_DEBUG DebugInfo;
//
// The following three fields control entering and exiting the critical
// section for the resource
//
LONG LockCount;
LONG RecursionCount;
HANDLE OwningThread; // from the thread''s
ClientId->UniqueThread
HANDLE LockSemaphore;
ULONG_PTR SpinCount; // force size on 64-bit systems when packed
} RTL_CRITICAL_SECTION, *PRTL_CRITICAL_SECTION;
InitializeCriticalSectionAndSpinCount 函數中首先對臨界區結構進行了初始化
DebugInfo 字段指向初始化臨界區時分配的RTL_CRITICAL_SECTION_DEBUG結構;
LockCount 字段是臨界區中最重要的字段,初始值為-1,當臨界區被獲取(Hold)時此字段大于等于0;
RecursionCount 字段保存當前臨界區所有者線程的獲取緩沖區嵌套層數,初始值為0;
OwningThread 字段保存當前臨界區所有者線程的句柄,初始值為0;
LockSemaphore 字段實際上是一個auto-reset的事件句柄,用于喚醒等待獲取臨界區的阻塞線程,初始值為0;
SpinCount 字段用于在多處理器環境下完成輕量級的CPU見同步,單處理器時沒有使用(初始值為0),多處理器時設置為SpinCount參數值(最大為MAX_SPIN_COUNT=0x00ffffff)。此外 RtlSetCriticalSectionSpinCount 函數(resource.c:1374)的代碼與這兒設置SpinCount的代碼完全一樣。
初始化臨界區結構后,函數會根據SpinCount參數的一個標志位判斷是否需要預先初始化 LockSemaphore 字段,如果需要則使用NtCreateEvent創建一個具有訪問權限的同步用事件核心對象,初始狀態為沒有激發。這一初始化本來是在 EnterCriticalSection 函數中完成的,將之顯式提前可以進一步優化 EnterCriticalSection 函數的性能。
值得注意的是,這一特性僅對Win2k有效。MSDN里面說明如下:
以下為引用:
Windows 2000: If the high-order bit is set, the function preallocates the event used by the EnterCriticalSection function. Do not set this bit if you are creating a large number of critical section objects, because it will consume a significant amount of nonpaged pool. This flag is not necessary on Windows XP and later, and it is ignored.
與之對應的 DeleteCriticalSection 函數完成關閉事件句柄和是否調試結構的功能。
臨界區真正的核心代碼在win2kprivate tosdlli386critsect.asm里面,包括_RtlEnterCriticalSection、_RtlTryEnterCriticalSection和_RtlLeaveCriticalSection三個函數。
_RtlEnterCriticalSection 函數 (critsect.asm:85) 首先檢查SpinCount是否為0,如果不為0則處理多處理器架構下的問題[分支1];如為0則使用原子操作給LockCount加一,并判斷是否其值為0。如果加一后LockCount大于0,則此臨界區已經被獲取[分支2];如為0則獲取當前線程TEB中的線程句柄,保存在臨界區的OwningThread字段中,并將RecursionCount設置為1。調試版本則調用RtlpCriticalSectionIsOwned函數在調試模式下驗證此緩沖區是被當前線程獲取的,否則在調試模式下激活調試器。最后還會更新TEB的CountOfOwnedCriticalSections計數器,以及臨界區調試結構中的EntryCount字段。
如果此臨界區已經被獲取[分支2],則判斷獲取臨界區的線程句柄是否與當前線程相符。如果是同一線程則直接將RecursionCount和調試結構的EntryCount字段加一;如果不是當前線程,則調用RtlpWaitForCriticalSection函數等待此臨界區,并從頭開始執行獲取臨界區的程序。
多CPU情況的分支處理方式類似,只是多了對SpinCount的雙重檢查處理。
接著的_RtlTryEnterCriticalSection(critsect.asm:343)函數是一個輕量級的嘗試獲取臨界區的函數。偽代碼如下:
以下為引用:
if(CriticalSection->LockCount == -1)
{
// 臨界區可用
CriticalSection->LockCount = 0;
CriticalSection->OwningThread = TEB->ClientID;
CriticalSection->RecursionCount = 1;
return TRUE;
}
else
{
if(CriticalSection->OwningThread == TEB->ClientID)
{
// 臨界區是當前線程獲取
CriticalSection->LockCount++;
CriticalSection->RecursionCount++;
return TRUE;
}
else
{
// 臨界區已被其它線程獲取
return FALSE;
}
}
最后的_RtlLeaveCriticalSection(critsect.asm:271)函數釋放已獲取的臨界區,實現就比較簡單了,實際上就是對嵌套計數器和鎖定計數器進行操作。偽代碼如下:
以下為引用:
if(--CriticalSection->RecursionCount == 0)
{
bsp; // 臨界區已不再被使用
CriticalSection->OwningThread = 0;
if(--CriticalSection->LockCount)
{
// 仍有線程鎖定在臨界區上
_RtlpUnWaitCriticalSection(CriticalSection)
}
}
else
{
--CriticalSection->LockCount
}