今天遇到一個比較奇怪的crash問題,這里記錄下。這個crash是由QA設(shè)置了一些不合理的參數(shù)引起的,還好QA當(dāng)時保存了Dump文件,讓我們可以慢慢分析,從而找出代碼中隱藏的問題。
這里先簡單介紹下ATL/WTL里字符串的設(shè)計(jì):
(1)每個CString都有自己的串頭(內(nèi)含引用計(jì)數(shù),數(shù)據(jù)長度,已分配內(nèi)存長度),緊接著后面是真正的數(shù)據(jù)。
因?yàn)槭腔谝糜?jì)數(shù),所以相同的多個CString可以共享同一份數(shù)據(jù)。
struct CStringData
{
long nRefs; // reference count
int nDataLength;
int nAllocLength;
// TCHAR data[nAllocLength]
TCHAR* data()
{ return (TCHAR*)(this + 1); }
};
(2)每個未初始化CString都會指向同一固定的全局?jǐn)?shù)據(jù),內(nèi)部引用計(jì)數(shù)、數(shù)據(jù)長度、已分配內(nèi)存長度、內(nèi)容分別為-1,0,0,0
// Globals
// For an empty string, m_pchData will point here
// (note: avoids special case of checking for NULL m_pchData)
// empty string data (and locked)
_declspec(selectany)
int rgInitData[] = { -1, 0, 0, 0 };
_declspec(selectany) CStringData* _atltmpDataNil = (CStringData*)&rgInitData;
_declspec(selectany) LPCTSTR _atltmpPchNil = (LPCTSTR)(((BYTE*)&rgInitData) +
sizeof(CStringData));
inline CString::CString()
{
Init();
}
inline void CString::Init()
{ m_pchData = _GetEmptyString().m_pchData; }
static const CString& __stdcall _GetEmptyString()
{
return *(CString*)&_atltmpPchNil;
}
(3)字符串析構(gòu)時會檢測是否已經(jīng)分配內(nèi)存,是否其他沒有人用(引用計(jì)數(shù)小于0),都滿足后才會最終釋放內(nèi)存。
inline CString::~CString()
// free any attached data
{
if (GetData() != _atltmpDataNil)
{
if (InterlockedDecrement(&GetData()->nRefs) <= 0)
delete[] (BYTE*)GetData();
}
}
用Windbg打開Dump文件,輸入!analyze -v 讓它自動分析Crash時的情況,最終發(fā)現(xiàn)Crash在ATL/WTL字符串的析構(gòu)函數(shù)
~CString()里的delete語句, 然后我們通過分析傳入?yún)?shù),發(fā)現(xiàn)外部傳入的是一個沒有初始化的CString,既然是沒有初始化的CString,那應(yīng)該都是指向初始字符串的固定內(nèi)存,也就不會滿足條件
if (GetData() != _atltmpDataNil),為什么會跑到里面去呢?
這里關(guān)鍵原因就是這個CString是跨模塊傳遞過來的,比如你DLL里有個導(dǎo)出函數(shù)void SetValue(CString strValue), 然后你外部Exe傳遞一個未出始化的字符串CString str; SetValue(str); 這時就會Crash。根本原因是因?yàn)閭魅氲淖址窃贓xe里構(gòu)造,但是在DLL里析構(gòu),Exe里的未初始化str指向的是Exe模塊自己的全局初始值Exe!
_atltmpDataNil, 而DLL內(nèi)CString的全局初始值是Dll自己的Dll!_atltmpDataNil, 兩者比較當(dāng)然不相等,而后面的
if (InterlockedDecrement(&GetData()->nRefs) <= 0)又會把引用計(jì)數(shù)從-1改成-2, 接下來就會試圖delete這塊不是new出來的全局內(nèi)存,當(dāng)然會Crash了。
這個Bug一直沒有發(fā)現(xiàn)的原因是QA一直設(shè)置的都是有效參數(shù),也就不會引起傳入未初始化的CString的情況,但這次意外卻暴露了我們代碼中隱藏的問題。
知道了原因,接下來就是如何改了?方法很多,可以用傳引用的方式CString&;也可以傳C方式的字符串LPCTSTR;也可以還是傳CString, 但是在傳之前先做下長度判斷,以確保已經(jīng)出始化。
另外提醒下如果要在模塊(DLL)之間傳遞內(nèi)存,要確保C/C++運(yùn)行庫要用DLL的方式(MD), 這樣跨模塊new和delete時他們會共享同一個內(nèi)存堆,不同模塊之間相互new和delete才不會有問題。
測試工程: DllStringTest
posted on 2012-07-13 21:27
Richard Wei 閱讀(3885)
評論(4) 編輯 收藏 引用 所屬分類:
windbg