摘自:http://www.diybl.com/course/3_program/c++/cppjs/2008426/111619.html
去年11月的MSDN雜志曾刊登過一篇文章 Break Free of Code Deadlocks in Critical Sections Under Windows ,Matt Pietrek 和 Russ Osterlund 兩位對臨界區(qū)(Critical Section)的內(nèi)部實現(xiàn)做了一次簡短的介紹,但點到為止,沒有繼續(xù)深入下去,當時給我的感覺就是癢癢的,呵呵,于是用IDA和SoftIce大致分析了一下臨界區(qū)的實現(xiàn),大致弄明白了原理后也就沒有深究。現(xiàn)在乘著Win2k源碼的東風,重新分析一下這塊的內(nèi)容,做個小小的總結吧 :P
臨界區(qū)(Critical Section)是Win32中提供的一種輕量級的同步機制,與互斥(Mutex)和事件(Event)等內(nèi)核同步對象相比,臨界區(qū)是完全在用戶態(tài)維護的,所以僅能在同一進程內(nèi)供線程同步使用,但也因此無需在使用時進行用戶態(tài)和核心態(tài)之間的切換,工作效率大大高于其它同步機制。
臨界區(qū)的使用方法非常簡單,使用 InitializeCriticalSection 或 InitializeCriticalSectionAndSpinCount 函數(shù)初始化一個 CRITICAL_SECTION 結構;使用 SetCriticalSectionSpinCount 函數(shù)設置臨界區(qū)的Spin計數(shù)器;然后使用 EnterCriticalSection 或 TryEnterCriticalSection 獲取臨界區(qū)的所有權;完成需要同步的操作后,使用 LeaveCriticalSection 函數(shù)釋放臨界區(qū);最后使用 DeleteCriticalSection 函數(shù)析構臨界區(qū)結構。
以下是MSDN中提供的一個簡單的例子:
以下為引用:
// Global variable
CRITICAL_SECTION CriticalSection;
void main()
{
...
// Initialize the critical section one time only.
if (!InitializeCriticalSectionAndSpinCount(&CriticalSection, 0x80000400) )
return;
...
// Release resources used by the critical section object.
DeleteCriticalSection(&CriticalSection)
}
DWORD WINAPI ThreadProc( LPVOID lpParameter )
{
...
// Request ownership of the critical section.
EnterCriticalSection(&CriticalSection);
// Access the shared resource.
// Release ownership of the critical section.
LeaveCriticalSection(&CriticalSection);
...
}
首先看看構造和析構臨界區(qū)結構的函數(shù)。
InitializeCriticalSection 函數(shù)(ntosdll esource.c:1210)實際上是調(diào)用 InitializeCriticalSectionAndSpinCount 函數(shù)(resource.c:1266)完成功能的,只不過傳入一個值為0的初始Spin計數(shù)器;InitializeCriticalSectionAndSpinCount 函數(shù)主要完成兩部分工作:初始化 RTL_CRITICAL_SECTION 結構和 RTL_CRITICAL_SECTION_DEBUG 結構。前者是臨界區(qū)的核心結構,下面將著重討論;后者是調(diào)試用結構,Matt 那篇文章里面分析的很清楚了,我這兒就不羅嗦了 :P
RTL_CRITICAL_SECTION結構在winnt.h中定義如下:
以下為引用:
typedef struct _RTL_CRITICAL_SECTION {
PRTL_CRITICAL_SECTION_DEBUG DebugInfo;
//
// The following three fields control entering and exiting the critical
// section for the resource
//
LONG LockCount;
LONG RecursionCount;
HANDLE OwningThread; // from the thread''s
ClientId->UniqueThread
HANDLE LockSemaphore;
ULONG_PTR SpinCount; // force size on 64-bit systems when packed
} RTL_CRITICAL_SECTION, *PRTL_CRITICAL_SECTION;
InitializeCriticalSectionAndSpinCount 函數(shù)中首先對臨界區(qū)結構進行了初始化
DebugInfo 字段指向初始化臨界區(qū)時分配的RTL_CRITICAL_SECTION_DEBUG結構;
LockCount 字段是臨界區(qū)中最重要的字段,初始值為-1,當臨界區(qū)被獲取(Hold)時此字段大于等于0;
RecursionCount 字段保存當前臨界區(qū)所有者線程的獲取緩沖區(qū)嵌套層數(shù),初始值為0;
OwningThread 字段保存當前臨界區(qū)所有者線程的句柄,初始值為0;
LockSemaphore 字段實際上是一個auto-reset的事件句柄,用于喚醒等待獲取臨界區(qū)的阻塞線程,初始值為0;
SpinCount 字段用于在多處理器環(huán)境下完成輕量級的CPU見同步,單處理器時沒有使用(初始值為0),多處理器時設置為SpinCount參數(shù)值(最大為MAX_SPIN_COUNT=0x00ffffff)。此外 RtlSetCriticalSectionSpinCount 函數(shù)(resource.c:1374)的代碼與這兒設置SpinCount的代碼完全一樣。
初始化臨界區(qū)結構后,函數(shù)會根據(jù)SpinCount參數(shù)的一個標志位判斷是否需要預先初始化 LockSemaphore 字段,如果需要則使用NtCreateEvent創(chuàng)建一個具有訪問權限的同步用事件核心對象,初始狀態(tài)為沒有激發(fā)。這一初始化本來是在 EnterCriticalSection 函數(shù)中完成的,將之顯式提前可以進一步優(yōu)化 EnterCriticalSection 函數(shù)的性能。
值得注意的是,這一特性僅對Win2k有效。MSDN里面說明如下:
以下為引用:
Windows 2000: If the high-order bit is set, the function preallocates the event used by the EnterCriticalSection function. Do not set this bit if you are creating a large number of critical section objects, because it will consume a significant amount of nonpaged pool. This flag is not necessary on Windows XP and later, and it is ignored.
與之對應的 DeleteCriticalSection 函數(shù)完成關閉事件句柄和是否調(diào)試結構的功能。
臨界區(qū)真正的核心代碼在win2kprivate tosdlli386critsect.asm里面,包括_RtlEnterCriticalSection、_RtlTryEnterCriticalSection和_RtlLeaveCriticalSection三個函數(shù)。
_RtlEnterCriticalSection 函數(shù) (critsect.asm:85) 首先檢查SpinCount是否為0,如果不為0則處理多處理器架構下的問題[分支1];如為0則使用原子操作給LockCount加一,并判斷是否其值為0。如果加一后LockCount大于0,則此臨界區(qū)已經(jīng)被獲取[分支2];如為0則獲取當前線程TEB中的線程句柄,保存在臨界區(qū)的OwningThread字段中,并將RecursionCount設置為1。調(diào)試版本則調(diào)用RtlpCriticalSectionIsOwned函數(shù)在調(diào)試模式下驗證此緩沖區(qū)是被當前線程獲取的,否則在調(diào)試模式下激活調(diào)試器。最后還會更新TEB的CountOfOwnedCriticalSections計數(shù)器,以及臨界區(qū)調(diào)試結構中的EntryCount字段。
如果此臨界區(qū)已經(jīng)被獲取[分支2],則判斷獲取臨界區(qū)的線程句柄是否與當前線程相符。如果是同一線程則直接將RecursionCount和調(diào)試結構的EntryCount字段加一;如果不是當前線程,則調(diào)用RtlpWaitForCriticalSection函數(shù)等待此臨界區(qū),并從頭開始執(zhí)行獲取臨界區(qū)的程序。
多CPU情況的分支處理方式類似,只是多了對SpinCount的雙重檢查處理。
接著的_RtlTryEnterCriticalSection(critsect.asm:343)函數(shù)是一個輕量級的嘗試獲取臨界區(qū)的函數(shù)。偽代碼如下:
以下為引用:
if(CriticalSection->LockCount == -1)
{
// 臨界區(qū)可用
CriticalSection->LockCount = 0;
CriticalSection->OwningThread = TEB->ClientID;
CriticalSection->RecursionCount = 1;
return TRUE;
}
else
{
if(CriticalSection->OwningThread == TEB->ClientID)
{
// 臨界區(qū)是當前線程獲取
CriticalSection->LockCount++;
CriticalSection->RecursionCount++;
return TRUE;
}
else
{
// 臨界區(qū)已被其它線程獲取
return FALSE;
}
}
最后的_RtlLeaveCriticalSection(critsect.asm:271)函數(shù)釋放已獲取的臨界區(qū),實現(xiàn)就比較簡單了,實際上就是對嵌套計數(shù)器和鎖定計數(shù)器進行操作。偽代碼如下:
以下為引用:
if(--CriticalSection->RecursionCount == 0)
{
bsp; // 臨界區(qū)已不再被使用
CriticalSection->OwningThread = 0;
if(--CriticalSection->LockCount)
{
// 仍有線程鎖定在臨界區(qū)上
_RtlpUnWaitCriticalSection(CriticalSection)
}
}
else
{
--CriticalSection->LockCount
}
posted on 2008-12-01 14:05
Sandy 閱讀(1814)
評論(0) 編輯 收藏 引用 所屬分類:
c++學習