前陣子寫靜態lib導出單實例多線程安全API時,出現了CRITICAL_SECTION初始化太晚的問題,之后查看了錯誤的資料,引導向了錯誤的理解,以至于今天凌晨看到另一份代碼,也不多想的以為singletone double check會出bug,本文做下記錄備忘。
相關知識點:Singleton Double Check、多線程下的局部Static對象、靜態Lib中的全局對象。
一、singleton double check
SingleInstance* volatile g_instance = NULL;
cswuyg::MyCritical g_cs;
SingleInstance* GetInstance()
{
if (g_instance == NULL)
{
cswuyg::Lock<> lock(g_cs);
if (g_instance == NULL)
{
g_instance = new SingleInstance;
}
}
return g_instance;
}
這樣的代碼一般(不考慮全局對象的初始化)沒有問題。之前只略看他人的文章,不思考,誤以為:g_instance = new SingleInstance ; 這句在線程A的執行會被線程B g_instance == NULL的判斷打斷,導致線程B返回的g_instance是一個半成品。實際上不會,因為g_instance的賦值是在內存分配、構造函數執行之后做的,而且賦值是原子操作,這沒有問題。
按照文檔的說法,g_instance變量應該加上volatile,避免編譯器優化,編譯器優化之后,可能會導致g_instance變量的賦值在SingleInstance構造函數執行之前。volatile用于表明這個變量是易變的,每一次都直接操作對應內存,而不是用寄存器緩存,不會去優化指令。這里如果不使用它,就可能導致編譯器調整匯編指令的順序,分配完內存就直接把地址賦值給g_instance指針,后面再調用構造函數,它這樣調整的理由可能是這樣子:分配到的內存指針在后續的執行中沒有被修改,先賦值給g_instance和晚賦值給g_instance沒有區別。
二、導出Lib中慎用全局對象
我的Lib的導出API提供的數據只需要獲取一次就夠了,不能多次獲取,所以它必須是單實例的、多線程安全的,再考慮到不能浪費頻繁的鎖消耗,很直接的做法便是用singleton double check。
首先我選擇使用臨界區實現鎖,而臨界區在API被調用之前需要先初始化,于是定義一個Lock封裝了臨界區的初始化,什么時候初始化?必須是全局對象,如果為定義局部static對象會導致多線程不安全。
static對象不是多線程安全的:
從上圖的匯編指令可以看到static對象的構造函數是否被執行的判斷邏輯:
1、通過標識值判斷是否該執行構造函數(這里的構造函數內聯了);
2、執行構造函數,首先把標志值置位托福答案 www.yztrans.com
有可能多個線程都同時通過了1的判斷,導致構造函數被多次執行。
使用了全局對象之后發現也不可行:導出函數依賴全局對象的初始化,雖然全局對象會在main函數之前初始化,但初始化時機還是可能太晚了,譬如這種情況:lib的使用者也定義了全局對象,并且初始化得更早,使用者的全局對象構造函數里調用了lib的導出函數,導出函數使用了還沒初始化的臨界區全局對象導致崩潰,更麻煩的是,使用者的dump捕獲機制是在main函數里初始化的,生效得太晚,導致dump無法捕獲,使這個crash更加隱蔽。C++的全局對象應該盡量少用。exe里面如果使用了全局對象,則需要保證dump捕獲機制對所有的代碼都生效。
既然臨界區初始化問題無法解決,局部static對象、全局對象都無法使用,需要找到一個不需要初始化又能實現鎖的方法:那就是原子操作。
單純的原子操作并沒有鎖的功能,需要配合上:if + Sleep.
代碼如下:
SingleInstance* volatile g_instance;
LONG volatile g_for_lock;
SingleInstance* GetInstance()
{
if (g_instance == NULL)
{
LONG pre_value = ::InterlockedExchange(&g_for_lock, 1);
if (pre_value != 0)
{
while(g_instance == NULL)
{
::Sleep(55);
}
}
if (g_instance == NULL)
{
g_instance = new SingleInstance;
}
}
return g_instance;
}
全局的g_for_lock在PE文件裝入內存時就初始化為0,所以不存在初始化問題;InterlockedExchange 適用于xp、win7、win8,不存在系統限制;多個線程同時調用InterlockedExchange,只能有一個線程得到0,保證只初始化一次,其余線程進入while循環等待,直到g_point非空。問題不逼你,你就不會想到還有這么好的實現思路 :)
使用原子操作還可以很容易的實現臨界區鎖的功能,這里就不說了托福答案 www.lefeng123.com
三、PE文件中的Lib庫全局變量
像上邊定義的全局變量,如果DLL和EXE都使用這個lib,它們各自有一份獨立的全局變量。