Author : Kevin Lynx
當軟件作為release模式被發布給用戶時,當程序崩潰時我們很難去查找原因。常見的手法是輸出LOG文件,根據LOG文件分析
程序崩潰時的運行情況。我們可以通過SEH來捕獲程序錯誤,然后輸出一些有用的信息作為我們分析錯誤的資料。一般我們需要
輸出的信息包括:系統信息、CPU寄存器信息、堆棧信息、調用堆棧等。而調用堆棧則是最有用的部分,它可以直接幫我們定位
到程序崩潰時所處的位置(在何處崩潰)。(codeproject上關于這個專題的常見開場白 = =#)
要獲取call stack(所謂的調用堆棧),就需要查看(unwind)stack的內容。We could conceivably attempt to unwind the
stack ourselves using inline assembly. But stack frames can be organized in different ways, depending on compiler
optimizations and calling conventions, so it could become complicated to do it that way.(摘自vld文檔)要獲取棧的
內容,我們可以自己使用內聯匯編獲取,但是考慮到兼容性,內聯匯編并不是一個好的解決方案。我們可以使用微軟的dbghelp
中的StackWalk64來獲取棧的內容。
StackWalk64聲明如下:
BOOL StackWalk64(
DWORD MachineType,
HANDLE hProcess,
HANDLE hThread,
LPSTACKFRAME64 StackFrame,
PVOID ContextRecord,
PREAD_PROCESS_MEMORY_ROUTINE64 ReadMemoryRoutine,
PFUNCTION_TABLE_ACCESS_ROUTINE64 FunctionTableAccessRoutine,
PGET_MODULE_BASE_ROUTINE64 GetModuleBaseRoutine,
PTRANSLATE_ADDRESS_ROUTINE64 TranslateAddress
);
具體每個參數的含義可以參見MSDN。這里說下ContextRecord參數,該參數指定了CPU各個寄存器的內容。StackFrame指定了stack
frame的內容。stack frame是什么,我也不知道。(= =) StackWalk64函數需要用戶指定當前frame的地址,以及當前程序的指令
地址。這兩個信息都被填充進ContextRecord,然后傳進StackWalk64函數。
那么如何獲取當前的stack frame地址和當前程序指令地址呢?如前所說,你可以使用內聯匯編。(對于程序指令地址,因為要獲取
EIP寄存器的內容,而該寄存器不能被軟件訪問)也可以使用GetThreadContext一次性獲取當前線程當前運行情況下的CPU各個寄存器
內容。補充下,當前frame地址被放在EBP寄存器里,當前程序指令地址放在EIP寄存器里。但是,如同MSDN對GetThreadContext函數
的說明一樣,該函數可能獲取到錯誤的寄存器內容(You cannot get a valid context for a running thread)。
另一種獲取Context(包含EBP and EIP)的方法就是使用SEH(結構化異常處理),在__except中使用GetExceptionInformation獲取。
GetExceptionInformation 傳回一個LPEXCEPTION_POINTERS指針,該指針指向一個EXCEPTION_POINTERS結構,該結構里包含一個
Context的指針,即達到目標,可以使用StackWalk函數。
補充一下,你可以直接使用StackWalk函數,StackWalk被define為StackWalk64(windows平臺相關)。
unwind棧后,可以進一步獲取一個stack frame的內容,例如函數名。這里涉及到SymFromAddr函數,該函數可以根據一個地址返回
符號名(函數名)。還有一個有意思的函數:SymGetLineFromAddr,可以獲取函數對應的源代碼的文件名和行號。
當然,這一切都依賴于VC產生的程序數據庫文件(pdb),以及提供以上API函數的dbghelp.dll。
參考一段簡單的代碼:

/**////
///
///
#include <windows.h>
#include <stdio.h>
#include <dbghelp.h>

#pragma comment( lib, "dbghelp.lib" )

void dump_callstack( CONTEXT *context )


{
STACKFRAME sf;
memset( &sf, 0, sizeof( STACKFRAME ) );

sf.AddrPC.Offset = context->Eip;
sf.AddrPC.Mode = AddrModeFlat;
sf.AddrStack.Offset = context->Esp;
sf.AddrStack.Mode = AddrModeFlat;
sf.AddrFrame.Offset = context->Ebp;
sf.AddrFrame.Mode = AddrModeFlat;

DWORD machineType = IMAGE_FILE_MACHINE_I386;

HANDLE hProcess = GetCurrentProcess();
HANDLE hThread = GetCurrentThread();

for( ; ; )

{
if( !StackWalk(machineType, hProcess, hThread, &sf, context, 0, SymFunctionTableAccess, SymGetModuleBase, 0 ) )

{
break;
}

if( sf.AddrFrame.Offset == 0 )

{
break;
}
BYTE symbolBuffer[ sizeof( SYMBOL_INFO ) + 1024 ];
PSYMBOL_INFO pSymbol = ( PSYMBOL_INFO ) symbolBuffer;
pSymbol->SizeOfStruct = sizeof( symbolBuffer );
pSymbol->MaxNameLen = 1024;

DWORD64 symDisplacement = 0;
if( SymFromAddr( hProcess, sf.AddrPC.Offset, 0, pSymbol ) )

{
printf( "Function : %s\n", pSymbol->Name );
}
else

{
printf( "SymFromAdd failed!\n" );
}


IMAGEHLP_LINE lineInfo =
{ sizeof(IMAGEHLP_LINE) };
DWORD dwLineDisplacement;

if( SymGetLineFromAddr( hProcess, sf.AddrPC.Offset, &dwLineDisplacement, &lineInfo ) )

{
printf( "[Source File : %s]\n", lineInfo.FileName );
printf( "[Source Line : %u]\n", lineInfo.LineNumber );
}
else

{
printf( "SymGetLineFromAddr failed!\n" );
}
}
}

DWORD excep_filter( LPEXCEPTION_POINTERS lpEP )


{

/**//// init dbghelp.dll
if( SymInitialize( GetCurrentProcess(), NULL, TRUE ) )

{
printf( "Init dbghelp ok.\n" );
}

dump_callstack( lpEP->ContextRecord );

if( SymCleanup( GetCurrentProcess() ) )

{
printf( "Cleanup dbghelp ok.\n" );
}

return EXCEPTION_EXECUTE_HANDLER;
}

void func1( int i )


{
int *p = 0;
*p = i;
}

void func2( int i )


{
func1( i - 1 );
}

void func3( int i )


{
func2( i - 1 );
}

void test( int i )


{
func3( i - 1 );
}

int main()


{
__try

{
test( 10 );
}
__except( excep_filter( GetExceptionInformation() ) )

{
printf( "Some exception occures.\n" );
}

return 0;
}


以上代碼在release模式下需要關掉優化,否則調用堆棧顯示不正確(某些函數被去掉了?),同時需要pdb文件。
參考資料:
http://www.codeproject.com/KB/threads/StackWalker.aspx
http://www.cnblogs.com/protalfox/articles/84723.html
http://www.codeproject.com/KB/debug/XCrashReportPt1.aspx
http://www.codeproject.com/KB/applications/visualleakdetector.aspx
ps,本文技術淺嘗輒止,部分內容是否完全準確(正確)我個人都持保留態度,僅供參考。:D