Blog @ Blog

當(dāng)華美的葉片落盡，生命的脈絡(luò)才歷歷可見。－－聶魯達(dá)

導(dǎo)航

公告

留言簿(20)

隨筆分類(156)

文章分類(1)

隨筆檔案(198)

文章檔案(2)

相冊(cè)

Meet or get-together

閱讀排行榜

評(píng)論排行榜

常用鏈接

統(tǒng)計(jì)

隨筆 - 198
文章 - 2
評(píng)論 - 156
引用 - 0

積分與排名

積分 - 663219
排名 - 25

BBS

Sohu Club

Blog

Web

CSDN
VC KBase

解開 Windows 下的臨界區(qū)中的代碼死鎖

摘要

臨界區(qū)是一種防止多個(gè)線程同時(shí)執(zhí)行一個(gè)特定代碼節(jié)的機(jī)制，這一主題并沒有引起太多關(guān)注，因而人們未能對(duì)其深刻理解。在需要跟蹤代碼中的多線程處理的性能時(shí)，對(duì) Windows 中臨界區(qū)的深刻理解非常有用。本文深入研究臨界區(qū)的原理，以揭示在查找死鎖和確認(rèn)性能問題過程中的有用信息。它還包含一個(gè)便利的實(shí)用工具程序，可以顯示所有臨界區(qū)及其當(dāng)前狀態(tài)。

在我們?cè)S多年的編程實(shí)踐中，對(duì)于 Win32® 臨界區(qū)沒有受到非常多的“under the hood”關(guān)注而感到非常奇怪。當(dāng)然，您可能了解有關(guān)臨界區(qū)初始化與使用的基礎(chǔ)知識(shí)，但您是否曾經(jīng)花費(fèi)時(shí)間來深入研究 WINNT.H 中所定義的 CRITICAL_SECTION 結(jié)構(gòu)呢？在這一結(jié)構(gòu)中有一些非常有意義的好東西被長期忽略。我們將對(duì)此進(jìn)行補(bǔ)充，并向您介紹一些很有意義的技巧，這些技巧對(duì)于跟蹤那些難以察覺的多線程處理錯(cuò)誤非常有用。更重要的是，使用我們的 MyCriticalSections 實(shí)用工具，可以明白如何對(duì) CRITICAL_SECTION 進(jìn)行微小地?cái)U(kuò)展，以提供非常有用的特性，這些特性可用于調(diào)試和性能調(diào)整（要下載完整代碼，參見本文頂部的鏈接）。

老實(shí)說，作者們經(jīng)常忽略 CRITICAL_SECTION 結(jié)構(gòu)的部分原因在于它在以下兩個(gè)主要 Win32 代碼庫中的實(shí)現(xiàn)有很大不同：Microsoft® Windows® 95 和 Windows NT®。人們知道這兩種代碼庫都已經(jīng)發(fā)展出大量后續(xù)版本（其最新版本分別為 Windows Me 和 Windows XP），但沒有必要在此處將其一一列出。關(guān)鍵在于 Windows XP 現(xiàn)在已經(jīng)發(fā)展得非常完善，開發(fā)商可能很快就會(huì)停止對(duì) Windows 95 系列操作系統(tǒng)的支持。我們?cè)诒疚闹芯褪沁@么做的。

誠然，當(dāng)今最受關(guān)注的是 Microsoft .NET Framework，但是良好的舊式 Win32 編程不會(huì)很快消失。如果您擁有采用了臨界區(qū)的現(xiàn)有 Win32 代碼，您會(huì)發(fā)現(xiàn)我們的工具以及對(duì)臨界區(qū)的說明都非常有用。但是請(qǐng)注意，我們只討論 Windows NT 及其后續(xù)版本，而沒有涉及與 .NET 相關(guān)的任何內(nèi)容，這一點(diǎn)非常重要。

臨界區(qū)：簡述

如果您非常熟悉臨界區(qū)，并可以不假思索地進(jìn)行應(yīng)用，那就可以略過本節(jié)。否則，請(qǐng)向下閱讀，以對(duì)這些內(nèi)容進(jìn)行快速回顧。如果您不熟悉這些基礎(chǔ)內(nèi)容，則本節(jié)之后的內(nèi)容就沒有太大意義。

臨界區(qū)是一種輕量級(jí)機(jī)制，在某一時(shí)間內(nèi)只允許一個(gè)線程執(zhí)行某個(gè)給定代碼段。通常在修改全局?jǐn)?shù)據(jù)（如集合類）時(shí)會(huì)使用臨界區(qū)。事件、多用戶終端執(zhí)行程序和信號(hào)量也用于多線程同步，但臨界區(qū)與它們不同，它并不總是執(zhí)行向內(nèi)核模式的控制轉(zhuǎn)換，這一轉(zhuǎn)換成本昂貴。稍后將會(huì)看到，要獲得一個(gè)未占用臨界區(qū)，事實(shí)上只需要對(duì)內(nèi)存做出很少的修改，其速度非常快。只有在嘗試獲得已占用臨界區(qū)時(shí)，它才會(huì)跳至內(nèi)核模式。這一輕量級(jí)特性的缺點(diǎn)在于臨界區(qū)只能用于對(duì)同一進(jìn)程內(nèi)的線程進(jìn)行同步。

臨界區(qū)由 WINNT.H 中所定義的 RTL_CRITICAL_SECTION 結(jié)構(gòu)表示。因?yàn)槟?C++ 代碼通常聲明一個(gè) CRITICAL_SECTION 類型的變量，所以您可能對(duì)此并不了解。研究 WINBASE.H 后您會(huì)發(fā)現(xiàn)：

typedef RTL_CRITICAL_SECTION CRITICAL_SECTION;

我們將在短時(shí)間內(nèi)揭示 RTL_CRITICAL_SECTION 結(jié)構(gòu)的實(shí)質(zhì)。此時(shí)，重要問題在于 CRITICAL_SECTION（也稱作 RTL_CRITICAL_SECTION）只是一個(gè)擁有易訪問字段的結(jié)構(gòu)，這些字段可以由 KERNEL32 API 操作。

在將臨界區(qū)傳遞給 InitializeCriticalSection 時(shí)（或者更準(zhǔn)確地說，是在傳遞其地址時(shí)），臨界區(qū)即開始存在。初始化之后，代碼即將臨界區(qū)傳遞給 EnterCriticalSection 和 LeaveCriticalSection API。一個(gè)線程自 EnterCriticalSection 中返回后，所有其他調(diào)用 EnterCriticalSection 的線程都將被阻止，直到第一個(gè)線程調(diào)用 LeaveCriticalSection 為止。最后，當(dāng)不再需要該臨界區(qū)時(shí)，一種良好的編碼習(xí)慣是將其傳遞給 DeleteCriticalSection。

在臨界區(qū)未被使用的理想情況中，對(duì) EnterCriticalSection 的調(diào)用非常快速，因?yàn)樗皇亲x取和修改用戶模式內(nèi)存中的內(nèi)存位置。否則（在后文將會(huì)遇到一種例外情況），阻止于臨界區(qū)的線程有效地完成這一工作，而不需要消耗額外的 CPU 周期。所阻止的線程以內(nèi)核模式等待，在該臨界區(qū)的所有者將其釋放之前，不能對(duì)這些線程進(jìn)行調(diào)度。如果有多個(gè)線程被阻止于一個(gè)臨界區(qū)中，當(dāng)另一線程釋放該臨界區(qū)時(shí)，只有一個(gè)線程獲得該臨界區(qū)。

深入研究：RTL_CRITICAL_SECTION 結(jié)構(gòu)

即使您已經(jīng)在日常工作中使用過臨界區(qū)，您也非常可能并沒有真正了解超出文檔之外的內(nèi)容。事實(shí)上存在著很多非常容易掌握的內(nèi)容。例如，人們很少知道一個(gè)進(jìn)程的臨界區(qū)是保存于一個(gè)鏈表中，并且可以對(duì)其進(jìn)行枚舉。實(shí)際上，WINDBG 支持 !locks 命令，這一命令可以列出目標(biāo)進(jìn)程中的所有臨界區(qū)。我們稍后將要談到的實(shí)用工具也應(yīng)用了臨界區(qū)這一鮮為人知的特征。為了真正理解這一實(shí)用工具如何工作，有必要真正掌握臨界區(qū)的內(nèi)部結(jié)構(gòu)。記著這一點(diǎn)，現(xiàn)在開始研究 RTL_CRITICAL_SECTION 結(jié)構(gòu)。為方便起見，將此結(jié)構(gòu)列出如下：

struct RTL_CRITICAL_SECTION
{
PRTL_CRITICAL_SECTION_DEBUG DebugInfo;
LONG LockCount;
LONG RecursionCount;
HANDLE OwningThread;
HANDLE LockSemaphore;
ULONG_PTR SpinCount;
};

以下各段對(duì)每個(gè)字段進(jìn)行說明。

DebugInfo 此字段包含一個(gè)指針，指向系統(tǒng)分配的伴隨結(jié)構(gòu)，該結(jié)構(gòu)的類型為 RTL_CRITICAL_SECTION_DEBUG。這一結(jié)構(gòu)中包含更多極有價(jià)值的信息，也定義于 WINNT.H 中。我們稍后將對(duì)其進(jìn)行更深入地研究。

LockCount 這是臨界區(qū)中最重要的一個(gè)字段。它被初始化為數(shù)值 -1；此數(shù)值等于或大于 0 時(shí)，表示此臨界區(qū)被占用。當(dāng)其不等于 -1 時(shí)，OwningThread 字段（此字段被錯(cuò)誤地定義于 WINNT.H 中 — 應(yīng)當(dāng)是 DWORD 而不是 HANDLE）包含了擁有此臨界區(qū)的線程 ID。此字段與 (RecursionCount -1) 數(shù)值之間的差值表示有多少個(gè)其他線程在等待獲得該臨界區(qū)。

RecursionCount 此字段包含所有者線程已經(jīng)獲得該臨界區(qū)的次數(shù)。如果該數(shù)值為零，下一個(gè)嘗試獲取該臨界區(qū)的線程將會(huì)成功。

OwningThread 此字段包含當(dāng)前占用此臨界區(qū)的線程的線程標(biāo)識(shí)符。此線程 ID 與 GetCurrentThreadId 之類的 API 所返回的 ID 相同。

LockSemaphore 此字段的命名不恰當(dāng)，它實(shí)際上是一個(gè)自復(fù)位事件，而不是一個(gè)信號(hào)。它是一個(gè)內(nèi)核對(duì)象句柄，用于通知操作系統(tǒng)：該臨界區(qū)現(xiàn)在空閑。操作系統(tǒng)在一個(gè)線程第一次嘗試獲得該臨界區(qū)，但被另一個(gè)已經(jīng)擁有該臨界區(qū)的線程所阻止時(shí)，自動(dòng)創(chuàng)建這樣一個(gè)句柄。應(yīng)當(dāng)調(diào)用 DeleteCriticalSection（它將發(fā)出一個(gè)調(diào)用該事件的 CloseHandle 調(diào)用，并在必要時(shí)釋放該調(diào)試結(jié)構(gòu)），否則將會(huì)發(fā)生資源泄漏。

SpinCount 僅用于多處理器系統(tǒng)。MSDN® 文檔對(duì)此字段進(jìn)行如下說明：“在多處理器系統(tǒng)中，如果該臨界區(qū)不可用，調(diào)用線程將在對(duì)與該臨界區(qū)相關(guān)的信號(hào)執(zhí)行等待操作之前，旋轉(zhuǎn) dwSpinCount 次。如果該臨界區(qū)在旋轉(zhuǎn)操作期間變?yōu)榭捎茫撜{(diào)用線程就避免了等待操作。”旋轉(zhuǎn)計(jì)數(shù)可以在多處理器計(jì)算機(jī)上提供更佳性能，其原因在于在一個(gè)循環(huán)中旋轉(zhuǎn)通常要快于進(jìn)入內(nèi)核模式等待狀態(tài)。此字段默認(rèn)值為零，但可以用 InitializeCriticalSectionAndSpinCount API 將其設(shè)置為一個(gè)不同值。

RTL_CRITICAL_SECTION_DEBUG 結(jié)構(gòu)

前面我們注意到，在 RTL_CRITICAL_SECTION 結(jié)構(gòu)內(nèi)，DebugInfo 字段指向一個(gè) RTL_CRITICAL_SECTION_DEBUG 結(jié)構(gòu)，該結(jié)構(gòu)給出如下：

struct _RTL_CRITICAL_SECTION_DEBUG
{
WORD   Type;
WORD   CreatorBackTraceIndex;
RTL_CRITICAL_SECTION *CriticalSection;
LIST_ENTRY ProcessLocksList;
DWORD EntryCount;
DWORD ContentionCount;
DWORD Spare[ 2 ];
}

這一結(jié)構(gòu)由 InitializeCriticalSection 分配和初始化。它既可以由 NTDLL 內(nèi)的預(yù)分配數(shù)組分配，也可以由進(jìn)程堆分配。RTL_CRITICAL_SECTION 的這一伴隨結(jié)構(gòu)包含一組匹配字段，具有迥然不同的角色：有兩個(gè)難以理解，隨后兩個(gè)提供了理解這一臨界區(qū)鏈結(jié)構(gòu)的關(guān)鍵，兩個(gè)是重復(fù)設(shè)置的，最后兩個(gè)未使用。

下面是對(duì) RTL_CRITICAL_SECTION 字段的說明。

Type 此字段未使用，被初始化為數(shù)值 0。

CreatorBackTraceIndex 此字段僅用于診斷情形中。在注冊(cè)表項(xiàng) HKLM\Software\Microsoft\Windows NT\CurrentVersion\Image File Execution Options\YourProgram 之下是 keyfield、GlobalFlag 和 StackTraceDatabaseSizeInMb 值。注意，只有在運(yùn)行稍后說明的 Gflags 命令時(shí)才會(huì)顯示這些值。這些注冊(cè)表值的設(shè)置正確時(shí)，CreatorBackTraceIndex 字段將由堆棧跟蹤中所用的一個(gè)索引值填充。在 MSDN 中搜索 GFlags 文檔中的短語“create user mode stack trace database”和“enlarging the user-mode stack trace database”，可以找到有關(guān)這一內(nèi)容的更多信息。

CriticalSection 指向與此結(jié)構(gòu)相關(guān)的 RTL_CRITICAL_SECTION。圖 1 說明該基礎(chǔ)結(jié)構(gòu)以及 RTL_CRITICAL_SECTION、RTL_CRITICAL_SECTION_DEBUG 和事件鏈中其他參與者之間的關(guān)系。

圖 1 臨界區(qū)處理流程

ProcessLocksList LIST_ENTRY 是用于表示雙向鏈表中節(jié)點(diǎn)的標(biāo)準(zhǔn) Windows 數(shù)據(jù)結(jié)構(gòu)。RTL_CRITICAL_SECTION_DEBUG 包含了鏈表的一部分，允許向前和向后遍歷該臨界區(qū)。本文后面給出的實(shí)用工具說明如何使用 Flink（前向鏈接）和 Blink（后向鏈接）字段在鏈表中的成員之間移動(dòng)。任何從事過設(shè)備驅(qū)動(dòng)程序或者研究過 Windows 內(nèi)核的人都會(huì)非常熟悉這一數(shù)據(jù)結(jié)構(gòu)。

EntryCount/ContentionCount 這些字段在相同的時(shí)間、出于相同的原因被遞增。這是那些因?yàn)椴荒荞R上獲得臨界區(qū)而進(jìn)入等待狀態(tài)的線程的數(shù)目。與 LockCount 和 RecursionCount 字段不同，這些字段永遠(yuǎn)都不會(huì)遞減。

Spares 這兩個(gè)字段未使用，甚至未被初始化（盡管在刪除臨界區(qū)結(jié)構(gòu)時(shí)將這些字段進(jìn)行了清零）。后面將會(huì)說明，可以用這些未被使用的字段來保存有用的診斷值。

即使 RTL_CRITICAL_SECTION_DEBUG 中包含多個(gè)字段，它也是常規(guī)臨界區(qū)結(jié)構(gòu)的必要成分。事實(shí)上，如果系統(tǒng)恰巧不能由進(jìn)程堆中獲得這一結(jié)構(gòu)的存儲(chǔ)區(qū)，InitializeCriticalSection 將返回為 STATUS_NO_MEMORY 的 LastError 結(jié)果，然后返回處于不完整狀態(tài)的臨界區(qū)結(jié)構(gòu)。

臨界區(qū)狀態(tài)

當(dāng)程序執(zhí)行、進(jìn)入與離開臨界區(qū)時(shí)，RTL_CRITICAL_SECTION 和 RTL_CRITICAL_SECTION_DEBUG 結(jié)構(gòu)中的字段會(huì)根據(jù)臨界區(qū)所處的狀態(tài)變化。這些字段由臨界區(qū) API 中的簿記代碼更新，在后面將會(huì)看到這一點(diǎn)。如果程序?yàn)槎嗑€程，并且其線程訪問是由臨界區(qū)保護(hù)的公用資源，則這些狀態(tài)就更有意義。

但是，不管代碼的線程使用情況如何，有兩種狀態(tài)都會(huì)出現(xiàn)。第一種情況，如果 LockCount 字段有一個(gè)不等于 -1 的數(shù)值，此臨界區(qū)被占用，OwningThread 字段包含擁有該臨界區(qū)的線程的線程標(biāo)識(shí)符。在多線程程序中，LockCount 與 RecursionCount 聯(lián)合表明當(dāng)前有多少線程被阻止于該臨界區(qū)。第二種情況，如果 RecursionCount 是一個(gè)大于 1 的數(shù)值，其告知您所有者線程已經(jīng)重新獲得該臨界區(qū)多少次（也許不必要），該臨界區(qū)既可以通過調(diào)用 EnterCriticalSection、也可以通過調(diào)用 TryEnterCriticalSection 獲得。大于 1 的任何數(shù)值都表示代碼的效率可能較低或者可能在以后發(fā)生錯(cuò)誤。例如，訪問公共資源的任何 C++ 類方法可能會(huì)不必要地重新進(jìn)入該臨界區(qū)。

注意，在大多數(shù)時(shí)間里，LockCount 與 RecursionCount 字段中分別包含其初始值 -1 和 0，這一點(diǎn)非常重要。事實(shí)上，對(duì)于單線程程序，不能僅通過檢查這些字段來判斷是否曾獲得過臨界區(qū)。但是，多線程程序留下了一些標(biāo)記，可以用來判斷是否有兩個(gè)或多個(gè)線程試圖同時(shí)擁有同一臨界區(qū)。

您可以找到的標(biāo)記之一是即使在該臨界區(qū)未被占用時(shí) LockSemaphore 字段中仍包含一個(gè)非零值。這表示：在某一時(shí)間，此臨界區(qū)阻止了一個(gè)或多個(gè)線程 — 事件句柄用于通知該臨界區(qū)已被釋放，等待該臨界區(qū)的線程之一現(xiàn)在可以獲得該臨界區(qū)并繼續(xù)執(zhí)行。因?yàn)?OS 在臨界區(qū)阻止另一個(gè)線程時(shí)自動(dòng)分配事件句柄，所以如果您在不再需要臨界區(qū)時(shí)忘記將其刪除，LockSemaphore 字段可能會(huì)導(dǎo)致程序中發(fā)生資源泄漏。

在多線程程序中可能遇到的另一狀態(tài)是 EntryCount 和 ContentionCount 字段包含一個(gè)大于零的數(shù)值。這兩個(gè)字段保存有臨界區(qū)對(duì)一個(gè)線程進(jìn)行阻止的次數(shù)。在每次發(fā)生這一事件時(shí)，這兩個(gè)字段被遞增，但在臨界區(qū)存在期間不會(huì)被遞減。這些字段可用于間接確定程序的執(zhí)行路徑和特性。例如，EntryCount 非常高時(shí)則意味著該臨界區(qū)經(jīng)歷著大量爭用，可能會(huì)成為代碼執(zhí)行過程中的一個(gè)潛在瓶頸。

在研究一個(gè)死鎖程序時(shí)，還會(huì)發(fā)現(xiàn)一種似乎無法進(jìn)行邏輯解釋的狀態(tài)。一個(gè)使用非常頻繁的臨界區(qū)的 LockCount 字段中包含一個(gè)大于 -1 的數(shù)值，也就是說它被線程所擁有，但是 OwningThread 字段為零（這樣就無法找出是哪個(gè)線程導(dǎo)致問題）。測試程序是多線程的，在單處理器計(jì)算機(jī)和多處理器計(jì)算機(jī)中都會(huì)出現(xiàn)這種情況。盡管 LockCount 和其他值在每次運(yùn)行中都不同，但此程序總是死鎖于同一臨界區(qū)。我們非常希望知道是否有任何其他開發(fā)人員也遇到了導(dǎo)致這一狀態(tài)的 API 調(diào)用序列。

構(gòu)建一個(gè)更好的捕鼠器

在我們學(xué)習(xí)臨界區(qū)的工作方式時(shí)，非常偶然地得到一些重要發(fā)現(xiàn)，利用這些發(fā)現(xiàn)可以得到一個(gè)非常好的實(shí)用工具。第一個(gè)發(fā)現(xiàn)是 ProcessLocksList LIST_ENTRY 字段的出現(xiàn)，這使我們想到進(jìn)程的臨界區(qū)可能是可枚舉的。另一個(gè)重大發(fā)現(xiàn)是我們知道了如何找出臨界區(qū)列表的頭。還有一個(gè)重要發(fā)現(xiàn)是可以在沒有任何損失的情況下寫 RTL_CRITICAL_SECTION 的 Spare 字段（至少在我們的所有測試中如此）。我們還發(fā)現(xiàn)可以很容易地重寫系統(tǒng)的一些臨界區(qū)例程，而不需要對(duì)源文件進(jìn)行任何修改。

最初，我們由一個(gè)簡單的程序開始，其檢查一個(gè)進(jìn)程中的所有臨界區(qū)，并列出其當(dāng)前狀態(tài)，以查看是否擁有這些臨界區(qū)。如果擁有，則找出由哪個(gè)線程擁有，以及該臨界區(qū)阻止了多少個(gè)線程？這種做法對(duì)于 OS 的狂熱者們比較適合，但對(duì)于只是希望有助于理解其程序的典型的程序員就不是非常有用了。

即使是在最簡單的控制臺(tái)模式“Hello World”程序中也存在許多臨界區(qū)。其中大部分是由 USER32 或 GDI32 之類的系統(tǒng) DLL 創(chuàng)建，而這些 DLL 很少會(huì)導(dǎo)致死鎖或性能問題。我們希望有一種方法能濾除這些臨界區(qū)，而只留下代碼中所關(guān)心的那些臨界區(qū)。RTL_CRITICAL_SECTION_DEBUG 結(jié)構(gòu)中的 Spare 字段可以很好地完成這一工作。可以使用其中的一個(gè)或兩個(gè)來指示：這些臨界區(qū)是來自用戶編寫的代碼，而不是來自 OS。

于是，下一個(gè)邏輯問題就變?yōu)槿绾未_定哪些臨界區(qū)是來自您編寫的代碼。有些讀者可能還記得 Matt Pietrek 2001 年 1 月的 Under The Hood 專欄中的 LIBCTINY.LIB。LIBCTINY 所采用的一個(gè)技巧是一個(gè) LIB 文件，它重寫了關(guān)鍵 Visual C++ 運(yùn)行時(shí)例程的標(biāo)準(zhǔn)實(shí)現(xiàn)。將 LIBCTINY.LIB 文件置于鏈接器行的其他 LIB 之前，鏈接器將使用這一實(shí)現(xiàn)，而不是使用 Microsoft 所提供的導(dǎo)入庫中的同名后續(xù)版本。

為對(duì)臨界區(qū)應(yīng)用類似技巧，我們創(chuàng)建 InitializeCriticalSection 的一個(gè)替代版本及其相關(guān)導(dǎo)入庫。將此 LIB 文件置于 KERNEL32.LIB 之前，鏈接器將鏈接我們的版本，而不是 KERNEL32 中的版本。對(duì) InitializeCriticalSection 的實(shí)現(xiàn)顯示在圖 2 中。此代碼在概念上非常簡單。它首先調(diào)用 KERNEL32.DLL 中的實(shí)際 InitializeCriticalSection。接下來，它獲得調(diào)用 InitializeCriticalSection 的代碼地址，并將其貼至 RTL_CRITICAL_SECTION_DEBUG 結(jié)構(gòu)的備用字段之一。我們的代碼如何確定調(diào)用代碼的地址呢？x86 CALL 指令將返回地址置于堆棧中。CriticalSectionHelper 代碼知道該返回地址位于堆棧幀中一個(gè)已知的固定位置。

實(shí)際結(jié)果是：與 CriticalSectionHelper.lib 正確鏈接的任何 EXE 或 DLL 都將導(dǎo)入我們的 DLL (CriticalSectionHelper.DLL)，并占用應(yīng)用了備用字段的臨界區(qū)。這樣就使事情簡單了許多。現(xiàn)在我們的實(shí)用工具可以簡單地遍歷進(jìn)程中的所有臨界區(qū)，并且只顯示具有正確填充的備用字段的臨界區(qū)信息。那么需要為這一實(shí)用工具付出什么代價(jià)呢？請(qǐng)稍等，還有更多的內(nèi)容！

因?yàn)槟乃信R界區(qū)現(xiàn)在都包含對(duì)其進(jìn)行初始化時(shí)的地址，實(shí)用工具可以通過提供其初始化地址來識(shí)別各個(gè)臨界區(qū)。原始代碼地址本身沒有那么有用。幸運(yùn)的是，DBGHELP.DLL 使代碼地址向源文件、行號(hào)和函數(shù)名稱的轉(zhuǎn)換變得非常容易。即使一個(gè)臨界區(qū)中沒有您在其中的簽名，也可以將其地址提交給 DBGHELP.DLL。如果將其聲明為一個(gè)全局變量，并且如果符號(hào)可用，則您就可以在原始源代碼中確定臨界區(qū)的名稱。順便說明一下，如果通過設(shè)置 _NT_SYMBOL_PATH 環(huán)境變量，并設(shè)置 DbgHelp 以使用其 Symbol Server 下載功能，從而使 DbgHelp 發(fā)揮其效用，則會(huì)得到非常好的結(jié)果。

MyCriticalSections 實(shí)用工具

我們將所有這些思想結(jié)合起來，提出了 MyCriticalSections 程序。MyCriticalSections 是一個(gè)命令行程序，在不使用參數(shù)運(yùn)行該程序時(shí)可以看到一些選項(xiàng)：

Syntax: MyCriticalSections <PID> [options]
Options:
/a = all critical sections
/e = show only entered critical sections
/v = verbose

唯一需要的參數(shù)是 Program ID 或 PID（十進(jìn)制形式）。可以用多種方法獲得 PID，但最簡單的方法可能就是通過 Task Manager。在沒有其他選項(xiàng)時(shí)，MyCriticalSections 列出了來自代碼模塊的所有臨界區(qū)狀態(tài)，您已經(jīng)將 CriticalSectionHelper.DLL 鏈接至這些代碼模塊。如果有可用于這一（些）模塊的符號(hào)，代碼將嘗試提供該臨界區(qū)的名稱，以及對(duì)其進(jìn)行初始化的位置。

要查看 MyCriticalSections 是如何起作用的，請(qǐng)運(yùn)行 Demo.EXE 程序，該程序包含在下載文件中。Demo.EXE 只是初始化兩個(gè)臨界區(qū)，并由一對(duì)線程進(jìn)入這兩個(gè)臨界區(qū)。圖 3 顯示運(yùn)行“MyCriticalSections 2040”的結(jié)果（其中 2040 為 Demo.EXE 的 PID）。

在該圖中，列出了兩個(gè)臨界區(qū)。在本例中，它們被命名為 csMain 和 yetAnotherCriticalSection。每個(gè)“Address:”行顯示了 CRITICAL_SECTION 的地址及其名稱。“Initialized in”行包含了在其中初始化 CRITICAL_SECTION 的函數(shù)名。代碼的“Initialized at”行顯示了源文件和初始化函數(shù)中的行號(hào)。

對(duì)于 csMain 臨界區(qū)，您將看到鎖定數(shù)為 0、遞歸數(shù)為 1，表示一個(gè)已經(jīng)被一線程獲得的臨界區(qū)，并且沒有其他線程在等待該臨界區(qū)。因?yàn)閺膩頉]有線程被阻止于該臨界區(qū)，所以 Entry Count 字段為 0。

現(xiàn)在來看 yetAnotherCriticalSection，會(huì)發(fā)現(xiàn)其遞歸數(shù)為 3。快速瀏覽 Demo 代碼可以看出：主線程調(diào)用 EnterCriticalSection 三次，所以事情的發(fā)生與預(yù)期一致。但是，還有一個(gè)第二線程試圖獲得該臨界區(qū)，并且已經(jīng)被阻止。同樣，LockCount 字段也為 3。此輸出顯示有一個(gè)等待線程。

MyCriticalSections 擁有一些選項(xiàng)，使其對(duì)于更為勇敢的探索者非常有用。/v 開關(guān)顯示每個(gè)臨界區(qū)的更多信息。旋轉(zhuǎn)數(shù)與鎖定信號(hào)字段尤為重要。您經(jīng)常會(huì)看到 NTDLL 和其他 DLL 擁有一些旋轉(zhuǎn)數(shù)非零的臨界區(qū)。如果一個(gè)線程在獲得臨界區(qū)的過程中曾被鎖定，則鎖定信號(hào)字段為非零值。/v 開關(guān)還顯示了 RTL_CRITICAL_SECTION_DEBUG 結(jié)構(gòu)中備用字段的內(nèi)容。

/a 開關(guān)顯示進(jìn)程中的所有臨界區(qū)，即使其中沒有 CriticalSectionHelper.DLL 簽名也會(huì)顯示。如果使用 /a，則請(qǐng)做好有大量輸出的準(zhǔn)備。真正的黑客希望同時(shí)使用 /a 和 /v，以顯示進(jìn)程中全部內(nèi)容的最多細(xì)節(jié)。使用 /a 的一個(gè)小小的好處是會(huì)看到 NTDLL 中的LdrpLoaderLock 臨界區(qū)。此臨界區(qū)在 DllMain 調(diào)用和其他一些重要時(shí)間內(nèi)被占用。LdrpLoaderLock 是許多不太明顯、表面上難以解釋的死鎖的形成原因之一。（為使 MyCriticalSection 能夠正確標(biāo)記 LdrpLoaderLock 實(shí)例，需要用于 NTDLL 的 PDB 文件可供使用。）

/e 開關(guān)使程序僅顯示當(dāng)前被占用的臨界區(qū)。未使用 /a 開關(guān)時(shí)，只顯示代碼中被占用的臨界區(qū)（如備用字段中的簽名所指示）。采用 /a 開關(guān)時(shí)，將顯示進(jìn)程中的全部被占用臨界區(qū)，而不考慮其來源。

那么，希望什么時(shí)候運(yùn)行 MyCriticalSections 呢？一個(gè)很明確的時(shí)間是在程序被死鎖時(shí)。檢查被占用的臨界區(qū)，以查看是否有什么使您驚訝的事情。即使被死鎖的程序正運(yùn)行于調(diào)試器的控制之下，也可以使用 MyCriticalSections。

另一種使用 MyCriticalSections 的時(shí)機(jī)是在對(duì)有大量多線程的程序進(jìn)行性能調(diào)整時(shí)。在阻塞于調(diào)試器中的一個(gè)使用頻繁、非重入函數(shù)時(shí)，運(yùn)行 MyCriticalSections，查看在該時(shí)刻占用了哪些臨界區(qū)。如果有很多線程都執(zhí)行相同任務(wù)，就非常容易導(dǎo)致一種情形：一個(gè)線程的大部分時(shí)間被消耗在等待獲得一個(gè)使用頻繁的臨界區(qū)上。如果有多個(gè)使用頻繁的臨界區(qū)，這造成的后果就像花園的澆水軟管打了結(jié)一樣。解決一個(gè)爭用問題只是將問題轉(zhuǎn)移到下一個(gè)容易造成阻塞的臨界區(qū)。

一個(gè)查看哪些臨界區(qū)最容易導(dǎo)致爭用的好方法是在接近程序結(jié)尾處設(shè)置一個(gè)斷點(diǎn)。在遇到斷點(diǎn)時(shí)，運(yùn)行 MyCriticalSections 并查找具有最大 Entry Count 值的臨界區(qū)。正是這些臨界區(qū)導(dǎo)致了大多數(shù)阻塞和線程轉(zhuǎn)換。

盡管 MyCriticalSections 運(yùn)行于 Windows 2000 及更新版本，但您仍需要一個(gè)比較新的 DbgHelp.DLL 版本－ 5.1 版或更新版本。Windows XP 中提供這一版本。也可以由其他使用 DbgHelp 的工具中獲得該版本。例如，Debugging Tools For Windows 下載中通常擁有最新的 DbgHelp.DLL。

深入研究重要的臨界區(qū)例程

此最后一節(jié)是為那些希望理解臨界區(qū)實(shí)現(xiàn)內(nèi)幕的勇敢讀者提供的。對(duì) NTDLL 進(jìn)行仔細(xì)研究后可以為這些例程及其支持子例程創(chuàng)建偽碼（見下載中的 NTDLL(CriticalSections).cpp）。以下 KERNEL32 API 組成臨界區(qū)的公共接口：

InitializeCriticalSection
InitializeCriticalSectionAndSpinCount
DeleteCriticalSection
TryEnterCriticalSection
EnterCriticalSection
LeaveCriticalSection

前兩個(gè) API 只是分別圍繞 NTDLL API RtlInitializeCriticalSection 和 RtlInitializeCriticalSectionAndSpinCount 的瘦包裝。所有剩余例程都被提交給 NTDLL 中的函數(shù)。另外，對(duì) RtlInitializeCriticalSection 的調(diào)用是另一個(gè)圍繞 RtlInitializeCriticalSectionAndSpinCount 調(diào)用的瘦包裝，其旋轉(zhuǎn)數(shù)的值為 0。使用臨界區(qū)的時(shí)候?qū)嶋H上是在幕后使用以下 NTDLL API：

RtlInitializeCriticalSectionAndSpinCount
RtlEnterCriticalSection
RtlTryEnterCriticalSection
RtlLeaveCriticalSection
RtlDeleteCriticalSection

在這一討論中，我們采用 Kernel32 名稱，因?yàn)榇蠖鄶?shù) Win32 程序員對(duì)它們更為熟悉。

InitializeCriticalSectionAndSpinCount 對(duì)臨界區(qū)的初始化非常簡單。RTL_CRITICAL_SECTION 結(jié)構(gòu)中的字段被賦予其起始值。與此類似，分配 RTL_CRITICAL_SECTION_DEBUG 結(jié)構(gòu)并對(duì)其進(jìn)行初始化，將 RtlLogStackBackTraces 調(diào)用中的返回值賦予 CreatorBackTraceIndex，并建立到前面臨界區(qū)的鏈接。

順便說一聲，CreatorBackTraceIndex 一般接收到的值為 0。但是，如果有 Gflags 和 Umdh 實(shí)用工具，可以輸入以下命令：

Gflags /i MyProgram.exe +ust
Gflags /i MyProgram.exe /tracedb 24

這些命令使得 MyProgram 的“Image File Execution Options”下添加了注冊(cè)表項(xiàng)。在下一次執(zhí)行 MyProgram 時(shí)會(huì)看到此字段接收到一個(gè)非 0 數(shù)值。有關(guān)更多信息，參閱知識(shí)庫文章 Q268343“Umdhtools.exe:How to Use Umdh.exe to Find Memory Leaks”。臨界區(qū)初始化中另一個(gè)需要注意的問題是：前 64 個(gè) RTL_CRITICAL_SECTION_DEBUG 結(jié)構(gòu)不是由進(jìn)程堆中分配，而是來自位于 NTDLL 內(nèi)的 .data 節(jié)的一個(gè)數(shù)組。

在完成臨界區(qū)的使用之后，對(duì) DeleteCriticalSection（其命名不當(dāng)，因?yàn)樗粍h除 RTL_CRITICAL_SECTION_ DEBUG）的調(diào)用遍歷一個(gè)同樣可理解的路徑。如果由于線程在嘗試獲得臨界區(qū)時(shí)被阻止而創(chuàng)建了一個(gè)事件，將通過調(diào)用 ZwClose 來銷毀該事件。接下來，在通過 RtlCriticalSectionLock 獲得保護(hù)之后（NTDLL 以一個(gè)臨界區(qū)保護(hù)它自己的內(nèi)部臨界區(qū)列表 — 您猜對(duì)了），將調(diào)試信息從鏈中清除，對(duì)該臨界區(qū)鏈表進(jìn)行更新，以反映對(duì)該信息的清除操作。該內(nèi)存由空值填充，并且如果其存儲(chǔ)區(qū)是由進(jìn)程堆中獲得，則調(diào)用 RtlFreeHeap 將使得其內(nèi)存被釋放。最后，以零填充 RTL_CRITICAL_SECTION。

有兩個(gè) API 要獲得受臨界區(qū)保護(hù)的資源 — TryEnterCriticalSection 和 EnterCriticalSection。如果一個(gè)線程需要進(jìn)入一個(gè)臨界區(qū)，但在等待被阻止資源變?yōu)榭捎玫耐瑫r(shí)，可執(zhí)行有用的工作，那么 TryEnterCriticalSection 正是您需要的 API。此例程測試此臨界區(qū)是否可用；如果該臨界區(qū)被占用，該代碼將返回值 FALSE，為該線程提供繼續(xù)執(zhí)行另一任務(wù)的機(jī)會(huì)。否則，其作用只是相當(dāng)于 EnterCriticalSection。

如果該線程在繼續(xù)進(jìn)行之前確實(shí)需要擁有該資源，則使用 EnterCriticalSection。此時(shí)，取消用于多處理器計(jì)算機(jī)的 SpinCount 測試。這一例程與 TryEnterCriticalSection 類似，無論該臨界區(qū)是空閑的或已經(jīng)被該線程所擁有，都調(diào)整對(duì)該臨界區(qū)的簿記。注意，最重要的 LockCount 遞增是由 x86“lock”前綴完成的，這一點(diǎn)非常重要。這確保了在某一時(shí)間內(nèi)只有一個(gè) CPU 可以修改該 LockCount 字段。（事實(shí)上，Win32 InterlockedIncrement API 只是一個(gè)具有相同鎖定前綴的 ADD 指令。）

如果調(diào)用線程無法立即獲得該臨界區(qū)，則調(diào)用 RtlpWaitForCriticalSection 將該線程置于等待狀態(tài)。在多處理器系統(tǒng)中，EnterCriticalSection 旋轉(zhuǎn) SpinCount 所指定的次數(shù)，并在每次循環(huán)訪問中測試該臨界區(qū)的可用性。如果此臨界區(qū)在循環(huán)期間變?yōu)榭臻e，該線程獲得該臨界區(qū)，并繼續(xù)執(zhí)行。

RtlpWaitForCriticalSection 可能是這里所給的所有過程中最為復(fù)雜、最為重要的一個(gè)。這并不值得大驚小怪，因?yàn)槿绻嬖谝粋€(gè)死鎖并涉及臨界區(qū)，則利用調(diào)試器進(jìn)入該進(jìn)程就可能顯示出 RtlpWaitForCriticalSection 內(nèi) ZwWaitForSingleObject 調(diào)用中的至少一個(gè)線程。

如偽碼中所顯示，在 RtlpWaitForCriticalSection 中有一點(diǎn)簿記工作，如遞增 EntryCount 和 ContentionCount 字段。但更重要的是：發(fā)出對(duì) LockSemaphore 的等待，以及對(duì)等待結(jié)果的處理。默認(rèn)情況是將一個(gè)空指針作為第三個(gè)參數(shù)傳遞給 ZwWaitForSingleObject 調(diào)用，請(qǐng)求該等待永遠(yuǎn)不要超時(shí)。如果允許超時(shí)，將生成調(diào)試消息字符串，并再次開始等待。如果不能從等待中成功返回，就會(huì)產(chǎn)生中止該進(jìn)程的錯(cuò)誤。最后，在從 ZwWaitForSingleObject 調(diào)用中成功返回時(shí)，則執(zhí)行從 RtlpWaitForCriticalSection 返回，該線程現(xiàn)在擁有該臨界區(qū)。

RtlpWaitForCriticalSection 必須認(rèn)識(shí)到的一個(gè)臨界條件是該進(jìn)程正在被關(guān)閉，并且正在等待加載程序鎖定 (LdrpLoaderLock) 臨界區(qū)。RtlpWaitForCriticalSection 一定不能允許該線程被阻止，但是必須跳過該等待，并允許繼續(xù)進(jìn)行關(guān)閉操作。

LeaveCriticalSection 不像 EnterCriticalSection 那樣復(fù)雜。如果在遞減 RecursionCount 之后，結(jié)果不為 0（意味著該線程仍然擁有該臨界區(qū)），則該例程將以 ERROR_SUCCESS 狀態(tài)返回。這就是為什么需要用適當(dāng)數(shù)目的 Leave 調(diào)用來平衡 Enter 調(diào)用。如果該計(jì)數(shù)為 0，則 OwningThread 字段被清零，LockCount 被遞減。如果還有其他線程在等待，例如 LockCount 大于或等于 0，則調(diào)用 RtlpUnWaitCriticalSection。此幫助器例程創(chuàng)建 LockSemaphore（如果其尚未存在），并發(fā)出該信號(hào)提醒操作系統(tǒng)：該線程已經(jīng)釋放該臨界區(qū)。作為通知的一部分，等待線程之一退出等待狀態(tài)，為運(yùn)行做好準(zhǔn)備。

最后要說明的一點(diǎn)是，MyCriticalSections 程序如何確定臨界區(qū)鏈的起始呢？如果有權(quán)訪問 NTDLL 的正確調(diào)試符號(hào)，則對(duì)該列表的查找和遍歷非常簡單。首先，定位符號(hào) RtlCriticalSectionList，清空其內(nèi)容（它指向第一個(gè) RTL_CRITICAL_SECTION_DEBUG 結(jié)構(gòu)），并開始遍歷。但是，并不是所有的系統(tǒng)都有調(diào)試符號(hào)，RtlCriticalSectionList 變量的地址會(huì)隨 Windows 的各個(gè)版本而發(fā)生變化。為了提供一種對(duì)所有版本都能正常工作的解決方案，我們?cè)O(shè)計(jì)了以下試探性方案。觀察啟動(dòng)一個(gè)進(jìn)程時(shí)所采取的步驟，會(huì)看到是以以下順序?qū)?NTDLL 中的臨界區(qū)進(jìn)行初始化的（這些名稱取自 NTDLL 的調(diào)試符號(hào)）：

RtlCriticalSectionLock
DeferedCriticalSection (this is the actual spelling!)
LoaderLock
FastPebLock
RtlpCalloutEntryLock
PMCritSect
UMLogCritSect
RtlpProcessHeapsListLock

因?yàn)闄z查進(jìn)程環(huán)境塊 (PEB) 中偏移量 0xA0 處的地址就可以找到加載程序鎖，所以對(duì)該鏈起始位置的定位就變得比較簡單。我們讀取有關(guān)加載程序鎖的調(diào)試信息，然后沿著鏈向后遍歷兩個(gè)鏈接，使我們定位于 RtlCriticalSectionLock 項(xiàng)，在該點(diǎn)得到該鏈的第一個(gè)臨界區(qū)。有關(guān)其方法的說明，請(qǐng)參見圖 4。

圖 4 初始化順序

小結(jié)

幾乎所有的多線程程序均使用臨界區(qū)。您遲早都會(huì)遇到一個(gè)使代碼死鎖的臨界區(qū)，并且會(huì)難以確定是如何進(jìn)入當(dāng)前狀態(tài)的。如果能夠更深入地了解臨界區(qū)的工作原理，則這一情形的出現(xiàn)就不會(huì)像首次出現(xiàn)時(shí)那樣的令人沮喪。您可以研究一個(gè)看來非常含糊的臨界區(qū)，并確定是誰擁有它，以及其他有用細(xì)節(jié)。如果您愿意將我們的庫加入您的鏈接器行，則可以容易地獲得有關(guān)您程序臨界區(qū)使用的大量信息。通過利用臨界區(qū)結(jié)構(gòu)中的一些未用字段，我們的代碼可以僅隔離并命名您的模塊所用的臨界區(qū)，并告知其準(zhǔn)確狀態(tài)。

有魄力的讀者可以很容易地對(duì)我們的代碼進(jìn)行擴(kuò)展，以完成更為異乎尋常的工作。例如，采用與 InitializeCriticalSection 掛鉤相類似的方式截獲 EnterCriticalSection 和 LeaveCriticalSection，可以存儲(chǔ)最后一次成功獲得和釋放該臨界區(qū)的位置。與此類似，CritSect DLL 擁有一個(gè)易于調(diào)用的 API，用于枚舉您自己的代碼中的臨界區(qū)。利用 .NET Framework 中的 Windows 窗體，可以相對(duì)容易地創(chuàng)建一個(gè) GUI 版本的 MyCriticalSections。對(duì)我們代碼進(jìn)行擴(kuò)展的可能性非常大，我們非常樂意看到其他人員所發(fā)現(xiàn)和創(chuàng)造的創(chuàng)新性辦法。

posted on 2008-01-02 13:45 isabc 閱讀(273) 評(píng)論(0) 編輯收藏引用所屬分類: C++基礎(chǔ)

只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。


相關(guān)文章: C/C++中Static的作用詳述變長結(jié)構(gòu)體 BOOL和bool的區(qū)別數(shù)據(jù)結(jié)構(gòu)復(fù)習(xí)筆記堆和棧的區(qū)別在哪里？用static聲明的函數(shù)和變量小結(jié)[轉(zhuǎn)] vc數(shù)據(jù)類型轉(zhuǎn)換大全 More Effective C++：指針與引用的區(qū)別堆、棧及靜態(tài)數(shù)據(jù)區(qū)詳解 DllMain詳解

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品