今天遇到一個比較奇怪的crash問題,這里記錄下。這個crash是由QA設置了一些不合理的參數引起的,還好QA當時保存了Dump文件,讓我們可以慢慢分析,從而找出代碼中隱藏的問題。
這里先簡單介紹下ATL/WTL里字符串的設計:
(1)每個CString都有自己的串頭(內含引用計數,數據長度,已分配內存長度),緊接著后面是真正的數據。
因為是基于引用計數,所以相同的多個CString可以共享同一份數據。
struct CStringData
{
long nRefs; // reference count
int nDataLength;
int nAllocLength;
// TCHAR data[nAllocLength]
TCHAR* data()
{ return (TCHAR*)(this + 1); }
};
(2)每個未初始化CString都會指向同一固定的全局數據,內部引用計數、數據長度、已分配內存長度、內容分別為-1,0,0,0
// Globals
// For an empty string, m_pchData will point here
// (note: avoids special case of checking for NULL m_pchData)
// empty string data (and locked)
_declspec(selectany)
int rgInitData[] = { -1, 0, 0, 0 };
_declspec(selectany) CStringData* _atltmpDataNil = (CStringData*)&rgInitData;
_declspec(selectany) LPCTSTR _atltmpPchNil = (LPCTSTR)(((BYTE*)&rgInitData) +
sizeof(CStringData));
inline CString::CString()
{
Init();
}
inline void CString::Init()
{ m_pchData = _GetEmptyString().m_pchData; }
static const CString& __stdcall _GetEmptyString()
{
return *(CString*)&_atltmpPchNil;
}
(3)字符串析構時會檢測是否已經分配內存,是否其他沒有人用(引用計數小于0),都滿足后才會最終釋放內存。
inline CString::~CString()
// free any attached data
{
if (GetData() != _atltmpDataNil)
{
if (InterlockedDecrement(&GetData()->nRefs) <= 0)
delete[] (BYTE*)GetData();
}
}
用Windbg打開Dump文件,輸入!analyze -v 讓它自動分析Crash時的情況,最終發現Crash在ATL/WTL字符串的析構函數
~CString()里的delete語句, 然后我們通過分析傳入參數,發現外部傳入的是一個沒有初始化的CString,既然是沒有初始化的CString,那應該都是指向初始字符串的固定內存,也就不會滿足條件
if (GetData() != _atltmpDataNil),為什么會跑到里面去呢?
這里關鍵原因就是這個CString是跨模塊傳遞過來的,比如你DLL里有個導出函數void SetValue(CString strValue), 然后你外部Exe傳遞一個未出始化的字符串CString str; SetValue(str); 這時就會Crash。根本原因是因為傳入的字符串是在Exe里構造,但是在DLL里析構,Exe里的未初始化str指向的是Exe模塊自己的全局初始值Exe!
_atltmpDataNil, 而DLL內CString的全局初始值是Dll自己的Dll!_atltmpDataNil, 兩者比較當然不相等,而后面的
if (InterlockedDecrement(&GetData()->nRefs) <= 0)又會把引用計數從-1改成-2, 接下來就會試圖delete這塊不是new出來的全局內存,當然會Crash了。
這個Bug一直沒有發現的原因是QA一直設置的都是有效參數,也就不會引起傳入未初始化的CString的情況,但這次意外卻暴露了我們代碼中隱藏的問題。
知道了原因,接下來就是如何改了?方法很多,可以用傳引用的方式CString&;也可以傳C方式的字符串LPCTSTR;也可以還是傳CString, 但是在傳之前先做下長度判斷,以確保已經出始化。
另外提醒下如果要在模塊(DLL)之間傳遞內存,要確保C/C++運行庫要用DLL的方式(MD), 這樣跨模塊new和delete時他們會共享同一個內存堆,不同模塊之間相互new和delete才不會有問題。
測試工程: DllStringTest
posted on 2012-07-13 21:27
Richard Wei 閱讀(3886)
評論(4) 編輯 收藏 引用 所屬分類:
windbg