每天早晨叫醒你的不是鬧鐘,而是夢想

C++博客 :: 首頁 :: 聯(lián)系 :: 聚合

:: 管理

62 Posts :: 0 Stories :: 5 Comments :: 0 Trackbacks

常用鏈接

留言簿(1)

我參與的團隊

隨筆分類

隨筆檔案

搜索

閱讀排行榜

評論排行榜

volatile——編寫多線程程序的好幫手

http://www.c-view.org/journal/006/gp_aa.htm

并不是我故意想弄糟你的心情，但是在這期專欄里，我們將討論多線程編程這一話題。正如上一期Generic里所說的，編寫異常安全（exception-safe）的程序是非常困難的，但是和編寫多線程程序比起來，那簡直就是兒戲。

多線程的程序是出了名的難編寫、難驗證、難調(diào)試、難維護，這通常是件苦差事。不正確的多線程程序可能可以運行很多年也不出一點錯，直到滿足某些臨界的條件時，才出現(xiàn)意想不到的奇怪錯誤。

不用說，編寫多線程程序的程序員需要使用可能得到的所有幫助。這期專欄將專注于討論競爭條件（race conditions）——這通常是多線程程序中各種麻煩的根源——深入了解它并提供一些工具來防止競爭。令人驚異的是，我們將讓編譯器盡其所能來幫助你做這些事。

僅僅一個不起眼的關(guān)鍵字
盡管C和C++標準對于線程都明顯的“保持沉默”，但它們以volatile關(guān)鍵字的形式，確實為多線程保留了一點特權(quán)。

就象大家更熟悉的const一樣，volatile是一個類型修飾符（type modifier）。它是被設(shè)計用來修飾被不同線程訪問和修改的變量。如果沒有volatile，基本上會導致這樣的結(jié)果：要么無法編寫多線程程序，要么編譯器失去大量優(yōu)化的機會。下面我們來一個個說明。

考慮下面的代碼：

class Gadget
2

{
3

public:
4

void Wait()
5

{
6

while (!flag_)
7

{
8

Sleep(1000); // sleeps for 1000 milliseconds
9

}
10

}
11

void Wakeup()
12

{
13

flag_ = true;
14

}
15

private:
17

bool flag_;
18

};
19

上面代碼中Gadget::Wait的目的是每過一秒鐘去檢查一下flag_成員變量，當flag_被另一個線程設(shè)為true時，該函數(shù)才會返回。至少這是程序作
者的意圖，然而，這個Wait函數(shù)是錯誤的.假設(shè)編譯器發(fā)現(xiàn)Sleep(1000)是調(diào)用一個外部的庫函數(shù)，它不會改變成員變量flag_，那么編譯器就可
以斷定它可以把flag_緩存在寄存器中，以后可以訪問該寄存器來代替訪問較慢的主板上的內(nèi)存。這對于單線程代碼來說是一個很好的優(yōu)化，但
是在現(xiàn)在這種情況下，它破壞了程序的正確性：當你調(diào)用了某個Gadget的Wait函數(shù)后，即使另一個線程調(diào)用了Wakeup，Wait還是會一直循環(huán)下去。
這是因為flag_的改變沒有反映到緩存它的寄存器中去。編譯器的優(yōu)化未免有點太……樂觀了。

在大多數(shù)情況下，把變量緩存在寄存器中是一個非常有價值的優(yōu)化方法，如果不用的話很可惜。C和C++給你提供了顯式禁用這種緩存優(yōu)化的機會。
如果你聲明變量是使用了volatile修飾符，編譯器就不會把這個變量緩存在寄存器里——每次訪問都將去存取變量在內(nèi)存中的實際位置。這樣你
要對Gadget的Wait/Wakeup做的修改就是給flag_加上正確的修飾：

class Gadget
{
public:
    ... as above ...
private:
    volatile bool flag_;
};

大多數(shù)關(guān)于volatile的原理和用法的解釋就到此為止，并且建議你用volatile修飾在多個線程中使用的原生類型變量。然而，你可以用volatile
做更多的事，因為它是神奇的C++類型系統(tǒng)的一部分。

把volatile用于自定義類型
volatile修飾不僅可以用于原生類型，也可以用于自定義類型。這時候，volatile修飾方式類似于const（你也可以對一個類型同時使用const
和volatile）.

與const不同，volatile的作用對于原生類型和自定義類型是有區(qū)別的。就是說，原生類型有volatile修飾時，仍然支持它們的各種操作（加、
乘、賦值等等），然而對于class來說，就不是這樣。舉例來說，你可以把一個非volatile的int的值賦給一個volatile的int，但是你不能把一
個非volatile的對象賦給一個volatile對象。

讓我們舉個例子來說明自定義類型的volatile是怎么工作的。
class Gadget

{
public:
    void Foo() volatile;
    void Bar();
    ...
private:
    String name_;
    int state_;
};

...

Gadget regularGadget;

volatile Gadget volatileGadget;

如果你認為volatile對于對象來說沒有什么作用的話，那你可要大吃一驚了。
volatileGadget.Foo(); // ok, volatile fun called for
                          // volatile object
regularGadget.Foo();  // ok, volatile fun called for
                          // non-volatile object
volatileGadget.Bar(); // error! Non-volatile function called for
                          // volatile object!

從沒有volatile修飾的類型到相應(yīng)的volatile類型的轉(zhuǎn)換是很平常的。但是，就象const一樣，你不能反過來把volatile類型轉(zhuǎn)換為非volatile類型。你必須用類型轉(zhuǎn)換運算符：
Gadget& ref = const_cast<Gadget&>;(volatileGadget);
ref.Bar(); // ok

一個有volatile修飾的類只允許訪問其接口的一個子集，這個子集由類的實現(xiàn)者來控制。用戶只有用const_cast才可以訪問這個類型的全部接口。而且，象const一樣，類的volatile屬性會傳遞給它的成員（例如，volatileGadget.name_和volatileGadget.state_也是volatile變量）。

volatile，臨界區(qū)和競爭條件
多線程程序中最簡單也是最常用的同步機制要算是mutex（互斥對象）了。一個mutex只提供兩個基本操作：Acquire和Release。一旦某個線程調(diào)用了Acquire，其他線程再調(diào)用Acquire時就會被阻塞。當這個線程調(diào)用Release后，剛才阻塞在Acquire里的線程中，會有一個且僅有一個被喚醒。換句話說，對于一個給定的mutex，只有一個線程可以在Acquire和Release調(diào)用之間獲取處理器時間。在Acquire和Release調(diào)用之間執(zhí)行的代碼叫做臨界區(qū)（critical section）。（Windows的用語可能會引起一點混亂，因為Windows把mutex本身叫做臨界區(qū)，而Windows的mutex實際上指進程間的mutex。如果把它們分別叫作線程mutex和進程mutex可能會好些。）

Mutex是用來避免數(shù)據(jù)出現(xiàn)競爭條件。根據(jù)定義，所謂競爭條件就是這樣一種情況：多個線程對數(shù)據(jù)產(chǎn)生的作用要依賴于線程的調(diào)度順序的。當兩個線程競相訪問同一數(shù)據(jù)時，就會發(fā)生競爭條件。因為一個線程可以在任意一個時刻打斷其他線程，數(shù)據(jù)可能會被破壞或者被錯誤地解釋。因此，對數(shù)據(jù)的修改操作，以及有些情況下的訪問操作，必須用臨界區(qū)保護起來。在面向?qū)ο蟮木幊讨校@通常意味著你在一個類的成員變量中保存一個mutex，然后在你訪問這個類的狀態(tài)時使用這個mutex。

多線程編程高手看了上面兩個段落，可能已經(jīng)在打哈欠了，但是它們的目的只是提供一個準備練習，我們現(xiàn)在要和volatile聯(lián)系起來了。我們將把C++的類型和線程的語義作一個對比。

在一個臨界區(qū)以外，任意線程會在任何時間打斷別的線程；這是不受控制的，所以被多個線程訪問的變量容易被改得面目全非。這和volatile的原意[1]是一致的——所以需要用volatile來防止編譯器無意地緩存這樣的變量。

在由一個mutex限定的臨界區(qū)里，只有一個線程可以進入。因此，在臨界區(qū)中執(zhí)行的代碼有和單線程程序有相同的語義。被控制的變量不會再被意外改變——你可以去掉volatile修飾。

簡而言之，線程間共享的數(shù)據(jù)在臨界區(qū)之外是volatile的，而在臨界區(qū)之內(nèi)則不是。

你通過對一個mutex加鎖來進入一個臨界區(qū)，然后你用const_cast去掉某個類型的volatile修飾，如果我們能成功地把這兩個操作放到一起，那么我們就在C++類型系統(tǒng)和應(yīng)用程序的線程語義建立起聯(lián)系。這樣我們可以讓編譯器來幫我們檢測競爭條件。

LockingPtr
我們需要有一個工具來做mutex的獲取和const_cast兩個操作。讓我們來設(shè)計一個LockingPtr類，你需要用一個volatile的對象obj和一個mutex對象mtx來初始化它。在LockingPtr對象的生命期中，它會保證mtx處于被獲取狀態(tài)，而且也提供對去掉volatile修飾的obj的訪問。對obj的訪問類似于smart pointer，是通過operator->;和operator*來進行的。const_cast是在LockingPtr內(nèi)部進行。這個轉(zhuǎn)化在語義上是正確的，因為LockingPtr在其生存期中始終擁有mutex。

首先，我們來定義和LockingPtr一起工作的Mutex類的框架：

class Mutex

{

public:

    void Acquire();

    void Release();

    ...

};

為了使用LockingPtr，你需要用操作系統(tǒng)提供的數(shù)據(jù)結(jié)構(gòu)和底層函數(shù)來實現(xiàn)Mutex。
LockingPtr是一個模板，用被控制變量的類型作為模板參數(shù)。例如，如果你希望控制一個Widget，你就要這樣寫LockingPtr <Widget>;。

LockingPtr的定義很簡單，它只是實現(xiàn)了一個單純的smart pointer。它關(guān)注的焦點只是在于把const_cast和臨界區(qū)操作放在一起。

template <typename T>;

class LockingPtr
{

public:

   // Constructors/destructors

   LockingPtr(volatile T& obj, Mutex& mtx)

       : pObj_(const_cast<T*>;(&obj)),

        pMtx_(&mtx)

   {    mtx.Lock();    }

   ~LockingPtr()

   {    pMtx_->;Unlock();    }

   // Pointer behavior

   T& operator*()

   {    return *pObj_;    }

   T* operator->;()

   {   return pObj_;   }

private:
   T* pObj_;

   Mutex* pMtx_;

   LockingPtr(const LockingPtr&);

   LockingPtr& operator=(const LockingPtr&);

};

盡管很簡單，LockingPtr對于編寫正確的多線程代碼非常有用。你應(yīng)該把線程間共享的對象聲明為volatile，但是永遠不要對它們使用
const_cast——你應(yīng)該始終是用LockingPtr的自動對象（automatic objects）。讓我們舉例來說明。

比如說你有兩個線程需要共享一個vector<char>;對象：

class SyncBuf {

public:

    void Thread1();

    void Thread2();

private:

    typedef vector<char>; BufT;

    volatile BufT buffer_;

    Mutex mtx_; // controls access to buffer_

};

在一個線程的函數(shù)里，你只需要簡單地使用一個LockingPtr<BufT>;對象來獲取對buffer_成員變量的受控訪問：

void SyncBuf::Thread1() {

    LockingPtr<BufT>; lpBuf(buffer_, mtx_);

    BufT::iterator i = lpBuf->;begin();

    for (; i != lpBuf->;end(); ++i) {

        ... use *i ...

    }

}

這樣的代碼很容易編寫，也很容易理解——每當你需要使用buffer_時，你必須創(chuàng)建一個LockingPtr<BufT>;來指向它。當你這樣做了以后，你就
可以訪問vector的全部接口。

這個方法的好處是，如果你犯了錯誤，編譯器會指出它：


void SyncBuf::Thread2() {

    // Error! Cannot access 'begin' for a volatile object

    BufT::iterator i = buffer_.begin();

    // Error! Cannot access 'end' for a volatile object

    for (; i != lpBuf->;end(); ++i) {

        ... use *i ...

    }

}

你不能訪問buffer_的任何函數(shù)，除非你進行了const_cast或者用LockingPtr。這兩者的區(qū)別是LockingPtr提供了一個有規(guī)則的方法來對一個volatile變量進行const_cast。
LockingPtr有非常好的表達力。如果你只需要調(diào)用一個函數(shù)，你可以創(chuàng)建一個無名的臨時LockingPtr對象，然后直接使用它：

unsigned int SyncBuf::Size() {

    return LockingPtr<BufT>;(buffer_, mtx_)->;size();

}

回到原生類型
我們已經(jīng)看到了volatile對于保護對象免于不受控的訪問是多么出色，并且看到了LockingPtr是怎么提供了一個簡單有效的辦法來編寫線程安全的代碼。現(xiàn)在讓我們回到原生類型，volatile對它們的作用方式是不同的。

讓我們來考慮一個多個線程共享一個int變量的例子。


class Counter

{

public:

    ...

    void Increment() { ++ctr_; }

    void Decrement() { --ctr_; }

private:

    int ctr_;

};

如果Increment和Decrement是在不同的線程里被調(diào)用的，上面的代碼片斷里就有bug。首先，ctr_必須是volatile的。其次，即使是一個看上去是原子的操作，比如++ctr_，實際上也分為三個階段。內(nèi)存本身是沒有運算功能的，當對一個變量進行增量操作時，處理器會：
把變量讀入寄存器
對寄存器里的值加1
把結(jié)果寫回內(nèi)存
這個三步操作稱為RMW（Read-Modify-Write）。在一個RMW操作的Modify階段，大多數(shù)處理器都會釋放內(nèi)存總線，以使其他處理器能夠訪問內(nèi)存。
如果在這個時候另一個處理器對同一個變量也進行RMW操作，我們就遇到了一個競爭條件：第二次寫入會覆蓋掉第一次的值。

為了防止這樣的事發(fā)生，你又要用到LockingPtr：

class Counter

{

public:

    ...

    void Increment() { ++*LockingPtr<int>;(ctr_, mtx_); }

    void Decrement() { --*LockingPtr<int>;(ctr_, mtx_); }

private:

    volatile int ctr_;

    Mutex mtx_;

};

現(xiàn)在這段代碼正確了，但是和SyncBuf相比，這段代碼的質(zhì)量要差一些。為什么？因為對于Counter，編譯器不會在你錯誤地直接訪問ctr_（沒有對它加鎖）時產(chǎn)生警告。雖然ctr_是volatile的，但是編譯器還是可以編譯++ctr_，盡管產(chǎn)生的代碼絕對是不正確的。編譯器不再是你的盟友了，你只有自己留意競爭條件。
那么你該怎么做呢？很簡單，你可以用一個高層的結(jié)構(gòu)來包裝原生類型的數(shù)據(jù)，然后對那個結(jié)構(gòu)使用volatile。這有點自相矛盾，直接用volatile修飾原生類型是一個不好的用法，盡管這是volatile最初期望的用法！
到現(xiàn)在為止，我們討論了具有volatile數(shù)據(jù)成員的類；現(xiàn)在讓我們來考慮設(shè)計這樣的類，它會作為更大的對象的一部分并且在線程間共享。這里，volatile的成員函數(shù)可以幫很大的忙。

在設(shè)計類的時候，你只對那些線程安全的成員函數(shù)加volatile修飾。你必須假定外面的代碼會在任何地方任何時間調(diào)用volatile成員函數(shù)。不要忘記：volatile相當于自由的多線程代碼，并且沒有臨界區(qū)；非volatile相當于單線程的環(huán)境或者在臨界區(qū)內(nèi)。

比如說，你定義了一個Widget類，它用兩個方法實現(xiàn)了同一個操作——一個線程安全的方法和一個快速的不受保護的方法。

class Widget

{

public:

    void Operation() volatile;

    void Operation();

    ...

private:

    Mutex mtx_;

};

注意這里的重載（overloading）用法。現(xiàn)在Widget的用戶可以用一致的語法調(diào)用Operation，對于volatile對象可以得到線程安全性，對于普通對象可以得到速度。用戶必須注意把共享的Widget對象定義為volatile。
在實現(xiàn)volatile成員函數(shù)時，第一個操作通常是用LockingPtr對this進行加鎖，然后其余工作可以交給非volatile的同名函數(shù)做：

void Widget::Operation() volatile

{

    LockingPtr<Widget>; lpThis(*this, mtx_);

    lpThis->;Operation(); // invokes the non-volatile function

}

小結(jié)
在編寫對線程程序的時候，使用volatile將對你十分有益。你必須堅持下面的規(guī)則：

把所有共享對象聲明為volatile
不要對原生類型直接使用volatile
定義共享類時，用volatile成員函數(shù)來表示它的線程安全性。
如果你這么做了，而且用了簡單的通用組件LockingPtr，你就可以寫出線程安全的代碼，并且大大減少對競爭條件的擔心，因為編譯器會替你操心，并且勤勤懇懇地為你指出哪里錯了。

在我參與的幾個項目中，使用volatile和LockingPtr產(chǎn)生了很大效果。代碼十分整潔，也容易理解。我記得遇到過一些死鎖的情況，但是相對于競爭條件，我寧愿對付死鎖的情況，因為它們調(diào)試起來容易多了。那些項目實際上根本沒有碰到過有關(guān)競爭條件的問題。

致謝
非常感謝James Kanze和Sorin Jianu提供了很有洞察力的意見。
致謝
非常感謝James Kanze和Sorin Jianu提供了很有洞察力的意見。

附：濫用volatile的本質(zhì)？[2]
在上一期的專欄《Generic<Programming>;: volatile — Multithreaded Programmer's Best Friend》發(fā)表以后，我收到很多反饋意見。就像是注定的一樣，大部分稱贊都是私人信件，而抱怨都發(fā)到USENET新聞組comp.lang.c++.moderated和 comp.programming.threads里去了。隨后引起了很長很激烈的討論，如果你對這個主題有興趣，你可以去看看這個討論，它的標題是“volatile, was: memory visibility between threads.”。

我知道我從這個討論中學到了很多東西。比如說，文章開頭的Widget的例子不太切題。長話短說，在很多系統(tǒng)（比如POSIX兼容的系統(tǒng)）中，volatile修飾是不需要的，而在另一些系統(tǒng)中，即使加了volatile也沒有用，程序還是不正確。

關(guān)于volatile correctness，最重要的一個問題是它依賴于類似POSIX的mutex，如果在多處理器系統(tǒng)上，光靠mutex就不夠了——你必須用memory barriers。

另一個更哲理性的問題是：嚴格來說通過類型轉(zhuǎn)換把變量的volatile屬性去掉是不合法的，即使volatile屬性是你自己為了volatile correctness而加上去的。正如Anthony Williams指出的，可以想象一個系統(tǒng)可能把volatile數(shù)據(jù)放在一個不同于非volatile數(shù)據(jù)的存儲區(qū)中，在這種情況下，進行地址變換會有不確定的行為。

另一個批評是volatile correctness雖然可以在一個較低層次上解決競爭條件，但是不能正確的檢測出高層的、邏輯的競爭條件。例如，你有一個mt_vector模版類，用來模擬std::vector，成員函數(shù)經(jīng)過正確的線程同步修正。考慮這段代碼：

volatile mt_vector<int>; vec;
…
if (!vec.empty()) {
    vec.pop_back();
}

這段代碼的目的是刪除vector里的最后一個元素，如果它存在的話。在單線程環(huán)境里，他工作地很好。然而如果你把它用在多線程程序里，這段代碼還是有可能拋出異常，盡管empty和pop_back都有正確的線程同步行為。雖然底層的數(shù)據(jù)（vec）的一致性有保證，但是高層操作的結(jié)果還是不確定的。
無論如何，經(jīng)過辯論之后，我還是保持我的建議，在有類POSIX的mutex的系統(tǒng)上，volatile correctness還是檢測競爭條件的一個有價值的工具。但是如果你在一個支持內(nèi)存訪問重新排序的多處理器系統(tǒng)上，你首先需要仔細閱讀你的編譯器的文檔。你必須知己知彼。
最后，Kenneth Chiu提到了一篇非常有趣的文章http://theory.stanford.edu/~freunds/race.ps，猜猜題目是什么？“Type-Based Race Detection for Java”。這篇文章講了怎么對Java的類型系統(tǒng)作一點小小的補充，從而讓編譯器和程序員一起在編譯時檢測競爭條件。

Eppur si muove.[3]
譯注
[1] Volatile原意為易變的，反復無常的。

[2] 這是Andrei在他的下一篇Generic<Programming>;里對本文作的補充說明。

[3] 這是伽利略在被迫放棄他一直信仰的哥白尼的地動說時所說過的一句辯解的話，意思是“它（地球）畢竟仍在運動”。

posted on 2011-04-05 17:41 沛沛閱讀(447) 評論(0) 編輯收藏引用所屬分類: C++

只有注冊用戶登錄后才能發(fā)表評論。
【推薦】100%開源！大型工業(yè)跨平臺軟件C++源碼提供，建模，組態(tài)！

相關(guān)文章: C++中的返回值優(yōu)化 Copy On Write(寫時復制) 從一道面試題來闡釋一個普遍的認知誤區(qū)(轉(zhuǎn)) Ogre是如何實現(xiàn)低耦合的類間消息傳遞機制的？ C++著名程序庫的比較和學習經(jīng)驗程序員面試題精選題-C++ 靜態(tài)對象、全局對象與程序的運行機制 debug和release的區(qū)別 _STDCALL&_CDECL 調(diào)用約定類的成員函數(shù)指針(比較深入)

網(wǎng)站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理