摘自:http://www.diybl.com/course/3_program/c++/cppjs/2008426/111619.html
去年11月的MSDN雜志曾刊登過(guò)一篇文章 Break Free of Code Deadlocks in Critical Sections Under Windows ,Matt Pietrek 和 Russ Osterlund 兩位對(duì)臨界區(qū)(Critical Section)的內(nèi)部實(shí)現(xiàn)做了一次簡(jiǎn)短的介紹,但點(diǎn)到為止,沒(méi)有繼續(xù)深入下去,當(dāng)時(shí)給我的感覺(jué)就是癢癢的,呵呵,于是用IDA和SoftIce大致分析了一下臨界區(qū)的實(shí)現(xiàn),大致弄明白了原理后也就沒(méi)有深究。現(xiàn)在乘著Win2k源碼的東風(fēng),重新分析一下這塊的內(nèi)容,做個(gè)小小的總結(jié)吧 :P
臨界區(qū)(Critical Section)是Win32中提供的一種輕量級(jí)的同步機(jī)制,與互斥(Mutex)和事件(Event)等內(nèi)核同步對(duì)象相比,臨界區(qū)是完全在用戶態(tài)維護(hù)的,所以僅能在同一進(jìn)程內(nèi)供線程同步使用,但也因此無(wú)需在使用時(shí)進(jìn)行用戶態(tài)和核心態(tài)之間的切換,工作效率大大高于其它同步機(jī)制。
臨界區(qū)的使用方法非常簡(jiǎn)單,使用 InitializeCriticalSection 或 InitializeCriticalSectionAndSpinCount 函數(shù)初始化一個(gè) CRITICAL_SECTION 結(jié)構(gòu);使用 SetCriticalSectionSpinCount 函數(shù)設(shè)置臨界區(qū)的Spin計(jì)數(shù)器;然后使用 EnterCriticalSection 或 TryEnterCriticalSection 獲取臨界區(qū)的所有權(quán);完成需要同步的操作后,使用 LeaveCriticalSection 函數(shù)釋放臨界區(qū);最后使用 DeleteCriticalSection 函數(shù)析構(gòu)臨界區(qū)結(jié)構(gòu)。
以下是MSDN中提供的一個(gè)簡(jiǎn)單的例子:
以下為引用:
// Global variable
CRITICAL_SECTION CriticalSection;
void main()
{
...
// Initialize the critical section one time only.
if (!InitializeCriticalSectionAndSpinCount(&CriticalSection, 0x80000400) )
return;
...
// Release resources used by the critical section object.
DeleteCriticalSection(&CriticalSection)
}
DWORD WINAPI ThreadProc( LPVOID lpParameter )
{
...
// Request ownership of the critical section.
EnterCriticalSection(&CriticalSection);
// Access the shared resource.
// Release ownership of the critical section.
LeaveCriticalSection(&CriticalSection);
...
}
首先看看構(gòu)造和析構(gòu)臨界區(qū)結(jié)構(gòu)的函數(shù)。
InitializeCriticalSection 函數(shù)(ntosdll esource.c:1210)實(shí)際上是調(diào)用 InitializeCriticalSectionAndSpinCount 函數(shù)(resource.c:1266)完成功能的,只不過(guò)傳入一個(gè)值為0的初始Spin計(jì)數(shù)器;InitializeCriticalSectionAndSpinCount 函數(shù)主要完成兩部分工作:初始化 RTL_CRITICAL_SECTION 結(jié)構(gòu)和 RTL_CRITICAL_SECTION_DEBUG 結(jié)構(gòu)。前者是臨界區(qū)的核心結(jié)構(gòu),下面將著重討論;后者是調(diào)試用結(jié)構(gòu),Matt 那篇文章里面分析的很清楚了,我這兒就不羅嗦了 :P
RTL_CRITICAL_SECTION結(jié)構(gòu)在winnt.h中定義如下:
以下為引用:
typedef struct _RTL_CRITICAL_SECTION {
PRTL_CRITICAL_SECTION_DEBUG DebugInfo;
//
// The following three fields control entering and exiting the critical
// section for the resource
//
LONG LockCount;
LONG RecursionCount;
HANDLE OwningThread; // from the thread''s
ClientId->UniqueThread
HANDLE LockSemaphore;
ULONG_PTR SpinCount; // force size on 64-bit systems when packed
} RTL_CRITICAL_SECTION, *PRTL_CRITICAL_SECTION;
InitializeCriticalSectionAndSpinCount 函數(shù)中首先對(duì)臨界區(qū)結(jié)構(gòu)進(jìn)行了初始化
DebugInfo 字段指向初始化臨界區(qū)時(shí)分配的RTL_CRITICAL_SECTION_DEBUG結(jié)構(gòu);
LockCount 字段是臨界區(qū)中最重要的字段,初始值為-1,當(dāng)臨界區(qū)被獲取(Hold)時(shí)此字段大于等于0;
RecursionCount 字段保存當(dāng)前臨界區(qū)所有者線程的獲取緩沖區(qū)嵌套層數(shù),初始值為0;
OwningThread 字段保存當(dāng)前臨界區(qū)所有者線程的句柄,初始值為0;
LockSemaphore 字段實(shí)際上是一個(gè)auto-reset的事件句柄,用于喚醒等待獲取臨界區(qū)的阻塞線程,初始值為0;
SpinCount 字段用于在多處理器環(huán)境下完成輕量級(jí)的CPU見(jiàn)同步,單處理器時(shí)沒(méi)有使用(初始值為0),多處理器時(shí)設(shè)置為SpinCount參數(shù)值(最大為MAX_SPIN_COUNT=0x00ffffff)。此外 RtlSetCriticalSectionSpinCount 函數(shù)(resource.c:1374)的代碼與這兒設(shè)置SpinCount的代碼完全一樣。
初始化臨界區(qū)結(jié)構(gòu)后,函數(shù)會(huì)根據(jù)SpinCount參數(shù)的一個(gè)標(biāo)志位判斷是否需要預(yù)先初始化 LockSemaphore 字段,如果需要?jiǎng)t使用NtCreateEvent創(chuàng)建一個(gè)具有訪問(wèn)權(quán)限的同步用事件核心對(duì)象,初始狀態(tài)為沒(méi)有激發(fā)。這一初始化本來(lái)是在 EnterCriticalSection 函數(shù)中完成的,將之顯式提前可以進(jìn)一步優(yōu)化 EnterCriticalSection 函數(shù)的性能。
值得注意的是,這一特性僅對(duì)Win2k有效。MSDN里面說(shuō)明如下:
以下為引用:
Windows 2000: If the high-order bit is set, the function preallocates the event used by the EnterCriticalSection function. Do not set this bit if you are creating a large number of critical section objects, because it will consume a significant amount of nonpaged pool. This flag is not necessary on Windows XP and later, and it is ignored.
與之對(duì)應(yīng)的 DeleteCriticalSection 函數(shù)完成關(guān)閉事件句柄和是否調(diào)試結(jié)構(gòu)的功能。
臨界區(qū)真正的核心代碼在win2kprivate tosdlli386critsect.asm里面,包括_RtlEnterCriticalSection、_RtlTryEnterCriticalSection和_RtlLeaveCriticalSection三個(gè)函數(shù)。
_RtlEnterCriticalSection 函數(shù) (critsect.asm:85) 首先檢查SpinCount是否為0,如果不為0則處理多處理器架構(gòu)下的問(wèn)題[分支1];如為0則使用原子操作給LockCount加一,并判斷是否其值為0。如果加一后LockCount大于0,則此臨界區(qū)已經(jīng)被獲取[分支2];如為0則獲取當(dāng)前線程TEB中的線程句柄,保存在臨界區(qū)的OwningThread字段中,并將RecursionCount設(shè)置為1。調(diào)試版本則調(diào)用RtlpCriticalSectionIsOwned函數(shù)在調(diào)試模式下驗(yàn)證此緩沖區(qū)是被當(dāng)前線程獲取的,否則在調(diào)試模式下激活調(diào)試器。最后還會(huì)更新TEB的CountOfOwnedCriticalSections計(jì)數(shù)器,以及臨界區(qū)調(diào)試結(jié)構(gòu)中的EntryCount字段。
如果此臨界區(qū)已經(jīng)被獲取[分支2],則判斷獲取臨界區(qū)的線程句柄是否與當(dāng)前線程相符。如果是同一線程則直接將RecursionCount和調(diào)試結(jié)構(gòu)的EntryCount字段加一;如果不是當(dāng)前線程,則調(diào)用RtlpWaitForCriticalSection函數(shù)等待此臨界區(qū),并從頭開(kāi)始執(zhí)行獲取臨界區(qū)的程序。
多CPU情況的分支處理方式類似,只是多了對(duì)SpinCount的雙重檢查處理。
接著的_RtlTryEnterCriticalSection(critsect.asm:343)函數(shù)是一個(gè)輕量級(jí)的嘗試獲取臨界區(qū)的函數(shù)。偽代碼如下:
以下為引用:
if(CriticalSection->LockCount == -1)
{
// 臨界區(qū)可用
CriticalSection->LockCount = 0;
CriticalSection->OwningThread = TEB->ClientID;
CriticalSection->RecursionCount = 1;
return TRUE;
}
else
{
if(CriticalSection->OwningThread == TEB->ClientID)
{
// 臨界區(qū)是當(dāng)前線程獲取
CriticalSection->LockCount++;
CriticalSection->RecursionCount++;
return TRUE;
}
else
{
// 臨界區(qū)已被其它線程獲取
return FALSE;
}
}
最后的_RtlLeaveCriticalSection(critsect.asm:271)函數(shù)釋放已獲取的臨界區(qū),實(shí)現(xiàn)就比較簡(jiǎn)單了,實(shí)際上就是對(duì)嵌套計(jì)數(shù)器和鎖定計(jì)數(shù)器進(jìn)行操作。偽代碼如下:
以下為引用:
if(--CriticalSection->RecursionCount == 0)
{
bsp; // 臨界區(qū)已不再被使用
CriticalSection->OwningThread = 0;
if(--CriticalSection->LockCount)
{
// 仍有線程鎖定在臨界區(qū)上
_RtlpUnWaitCriticalSection(CriticalSection)
}
}
else
{
--CriticalSection->LockCount
}
posted on 2008-12-01 14:05
Sandy 閱讀(1832)
評(píng)論(0) 編輯 收藏 引用 所屬分類:
c++學(xué)習(xí)