作者:阿半
語言調(diào)用規(guī)范是指進(jìn)行一次函數(shù)調(diào)用所采用的傳遞參數(shù)的方法,返回值的處理以及調(diào)用堆棧的清理。Microsoft C/C++ 語言中采用了五種調(diào)用規(guī)范,分別是__cdecl, __stdcall, __fastcall,thiscall和nake每一中調(diào)用規(guī)范都是利用eax作為返回值,如果函數(shù)返回值是64位的,則利用edx:eax對來返回值。Nake調(diào)用規(guī)范非常的靈活,足以獨(dú)立的一篇文章描述,這里就不再描述nake調(diào)用規(guī)范。下表列出了前面四種規(guī)范調(diào)用的特點(diǎn):
關(guān)鍵字 堆棧清理者 參數(shù)傳遞順序
__cdecl 調(diào)用者 從右至左
__stdcall 被調(diào)用者 從右至左
__fastcall 被調(diào)用者 從右至左,前兩個參數(shù)由寄存器ecx,edx傳遞
thiscall 被調(diào)用者或者調(diào)用者 從右至左
__cdecl 最大好處在于由于是調(diào)用者清理棧,它可以處理可變參數(shù),缺點(diǎn)則在于它增加了程序的大小,因為在每個調(diào)用返回的時候,需要多執(zhí)行一條清理棧的指令。
__stdcall 是在windows程序設(shè)計中出現(xiàn)的最多的調(diào)用規(guī)則,所有的不可變參數(shù)的API調(diào)用都使用這個規(guī)則。
__fastcall 在windows內(nèi)核設(shè)計中被廣泛的使用,由于兩個參數(shù)由寄存器直接傳遞,采用這種規(guī)則的函數(shù)效率要比以上兩種規(guī)則高。
thiscall是C++成員函數(shù)的默認(rèn)調(diào)用規(guī)范,編譯期間,這種調(diào)用會根據(jù)函數(shù)是否支持可變參數(shù)表來決定采用什么方式清理堆棧。如果成員函數(shù)不支持可變參數(shù),那么它就是用參數(shù)入棧,ecx保存this指針的方式進(jìn)行調(diào)用,如果成員函數(shù)支持可變參數(shù),那么它的調(diào)用和__cdecl類似,唯一不同的是將this指針最后壓入棧中進(jìn)行傳遞。
調(diào)用者和被調(diào)用者必須采用同樣的規(guī)則才能保證程序的正常執(zhí)行,曾經(jīng)看到很多程序員犯的錯誤就是由于調(diào)用規(guī)范的不一樣,致使程序異常,比如:
DWORD ThreadFunc(LPVOID lpParam)
{
//…
}
CreateThread(..,(LPTHREAD_START_ROUTINE)ThreadFunc, …); 如果在編譯期間沒有指定編譯選項/Gz(指定未指明調(diào)用規(guī)范的函數(shù)采用__stdcall方式),那么編譯器自動將ThreadFunc處理成__cdecl調(diào)用規(guī)范(/Gd),這樣可能在線程開始的時候正常執(zhí)行,然而退出的時候由于堆棧沒有正常清理,造成訪問違例或者非法指令錯誤。
以上說了很多清理棧的問題,那么為什么清理棧很重要呢。堆棧是線程相關(guān)的,也就是說每一個線程含有一個堆棧,這個堆棧上保存了局部變量,調(diào)用返回地址等很多線程相關(guān)的數(shù)據(jù),這也是為什么獨(dú)立運(yùn)行的線程可以調(diào)用同樣一個函數(shù)而互不干擾的原因。堆棧的特點(diǎn)恐怕大家已經(jīng)非常熟悉了,那么根據(jù)上面的每一種調(diào)用,我給出一個簡單的圖示來說明清理堆棧的重要性,以及為什么上面的例子代碼會出錯。
圖一 這是線程堆棧在運(yùn)行的時候的樣子
調(diào)用前和后esp的差值中間包含了函數(shù)參數(shù)表,返回地址這樣的重要信息,舉個簡單的調(diào)用例子.假設(shè)有某個函數(shù)定義是這樣的:
Int __cdecl func(void* p);再假設(shè)esp調(diào)用函數(shù)前的數(shù)值為0x1234,那么在進(jìn)入這個函數(shù)體內(nèi)看到的堆棧是這樣的:
122C 1230 1234
Next p 這里的next指調(diào)用函數(shù)后的下一條指令的位置。調(diào)用函數(shù)的匯編碼:
Push p
Call func
Add esp,4 《--注意這里,由于是cdecl調(diào)用,需要調(diào)用者清棧。而一個__stdcall調(diào)用的匯編碼:
Push p
Call func 這里沒有了add esp,4這個指令,因為在func函數(shù)返回的時候自己將esp已經(jīng)復(fù)原了。再來看剛才舉的錯誤的例子,由于強(qiáng)制轉(zhuǎn)換的作用,線程開始函數(shù)被設(shè)置成了stdcall調(diào)用,而實(shí)際的線程函數(shù)被編譯后,并沒有執(zhí)行堆棧的清理工作,線程函數(shù)返回的時候,由于堆棧的不正確,當(dāng)然會發(fā)生錯誤。修改這個bug的方法只要在線程函數(shù)的定義前把__cdecl改成_stdcall即可。
有了上面的例子做基礎(chǔ)來理解可變參數(shù)表就簡單的多了,由于各種調(diào)用規(guī)范的限定,致使只有__cdecl調(diào)用規(guī)范可以采用可變參數(shù)表。先來看看可變參數(shù)表的定義(可以參考sdk目錄下src\crt\varargs.h):
typedef char *va_list;
#define _INTSIZEOF(n) ( (sizeof(n) + sizeof(int) - 1) & ~(sizeof(int) - 1) )
#define va_dcl va_list va_alist;
#define va_start(ap) ap = (va_list)&va_alist
#define va_arg(ap,t) ( *(t *)((ap += _INTSIZEOF(t)) - _INTSIZEOF(t)) )
#define va_end(ap) ap = (va_list)0 va_list居然被定義成char* ?沒錯,這實(shí)際是用來定義了一個指針,指針的sizeof()就是操作系統(tǒng)可訪問的地址空間的大小,也就是CPU相關(guān)的字長。_INTSIZEOF宏很簡單,就是用來將數(shù)據(jù)以n的數(shù)據(jù)大小對齊。va_start宏有點(diǎn)模糊,可是如果你看懂了上面的堆棧數(shù)據(jù)結(jié)構(gòu),那么顯然它就是獲得最后一個固定參數(shù)的地址,也就是堆棧上的地址,va_arg先使得ap指向下一個參數(shù),然后取得當(dāng)前參數(shù)的值(注意,這個值正是堆棧上的值),va_end使得取參數(shù)過程結(jié)束。
這幾個宏完成的動作很簡單了,實(shí)際就是取得可變參數(shù)表在堆棧上的起始位置,然后根據(jù)參數(shù)類型,依次從堆棧上取出每一個參數(shù)。
本文簡單的介紹了微軟C/C++支持的調(diào)用類型,結(jié)合實(shí)例描述了規(guī)范的實(shí)際應(yīng)用,最后根據(jù)CRT提供的源代碼分析了可變參數(shù)表的實(shí)現(xiàn)。
本文來自CSDN博客,轉(zhuǎn)載請標(biāo)明出處:file:///E:/library/VC++%206_0%20中如何使用%20CRT%20調(diào)試功能來檢測內(nèi)存泄漏(轉(zhuǎn))%20-%20bairny的專欄%20-%20CSDN博客.mht
posted on 2010-12-30 18:38
李陽 閱讀(575)
評論(0) 編輯 收藏 引用 所屬分類:
C++