作者:南風(fēng)
下載源代碼
摘要:介紹了如何取成員函數(shù)的地址以及調(diào)用該地址.
關(guān)鍵字:C++成員函數(shù) this指針 調(diào)用約定
一、成員函數(shù)指針的用法
在C++中,成員函數(shù)的指針是個比較特殊的東西。對普通的函數(shù)指針來說,可以視為一個地址,在需要的時(shí)候可以任意轉(zhuǎn)換并直接調(diào)用。但對成員函數(shù)來說,常規(guī)類型轉(zhuǎn)換是通不過編譯的,調(diào)用的時(shí)候也必須采用特殊的語法。C++專門為成員指針準(zhǔn)備了三個運(yùn)算符: "::*"用于指針的聲明,而"->*"和".*"用來調(diào)用指針指向的函數(shù)。比如:
class tt
{
public: void foo(int x){ printf("\n %d \n",x); }
};
typedef void ( tt::* FUNCTYPE)(int );
FUNCTYPE ptr = tt::foo; //給一個成員函數(shù)指針賦值.
tt a;
(a.*ptr)(5); //調(diào)用成員函數(shù)指針.
tt *b = new tt;
(b->*ptr)(6); //調(diào)用成員函數(shù)指針.
注意調(diào)用函數(shù)指針時(shí)括號的用法,因?yàn)?.* 和 ->* 的優(yōu)先級比較低,必須把它們和兩邊要結(jié)合的元素放到一個括號里面,否則通不過編譯。不僅如此,更重要的是,無法為成員函數(shù)指針進(jìn)行任何的類型轉(zhuǎn)換,比如你想將一個成員函數(shù)的地址保存到一個整數(shù)中(就是取類成員函數(shù)的地址),按照一般的類型轉(zhuǎn)換方法是辦不到的.下面的代碼:
DWORD dwFooAddrPtr= 0;
dwFooAddrPtr = (DWORD) &tt::foo; /* Error C2440 */
dwFooAddrPtr = reinterpret_cast (&tt::foo); /* Error C2440 */
你得到只是兩個c2440錯誤而已。當(dāng)然你也無法將成員函數(shù)類型轉(zhuǎn)換為其它任何稍有不同的類型,簡單的說,每個成員函數(shù)指針都是一個獨(dú)有的類型,無法轉(zhuǎn)換到任何其它類型。即使兩個類的定義完全相同也不能在其對應(yīng)成員函數(shù)指針之間做轉(zhuǎn)換。這有點(diǎn)類似于結(jié)構(gòu)體的類型,每個結(jié)構(gòu)體都是唯一的類型,但不同的是,結(jié)構(gòu)體指針的類型是可以強(qiáng)制轉(zhuǎn)換的。 有了這些特殊的用法和嚴(yán)格的限制之后,類成員函數(shù)的指針實(shí)際上是變得沒什么用了。這就是我們平常基本看不到代碼里有"::*", ".*" 和 "->*"的原因。
二、取成員函數(shù)的地址
當(dāng)然,引用某位大師的話:"在windows中,我們總是有辦法的"。同樣,在C++中,我們也總是有辦法的。這個問題,解決辦法已經(jīng)存在了多年,并且廣為使用(在MFC中就使用了)。一般有兩個方法,一是使用內(nèi)嵌的匯編語言直接取函數(shù)地址,二是使用union類型來逃避C++的類型轉(zhuǎn)換檢測。兩種方法都是利用了某種機(jī)制逃避C++的類型轉(zhuǎn)換檢測,為什么C++編譯器干脆不直接放開這個限制,一切讓程序員自己作主呢?當(dāng)然是有原因的,因?yàn)轭惓蓡T函數(shù)和普通函數(shù)還是有區(qū)別的,允許轉(zhuǎn)換后,很容易出錯,這個在后面會有詳細(xì)的說明。現(xiàn)在先看看取類成員函數(shù)地址的兩種方法:
第一種方法:
template
void GetMemberFuncAddr_VC6(ToType& addr,FromType f)
{
union
{
FromType _f;
ToType _t;
}ut;
ut._f = f;
addr = ut._t;
}
這樣使用:
DWORD dwAddrPtr;
GetMemberFuncAddr_VC6(dwAddrPtr,&tt::foo);
為什么使用模版? 呵呵,如果不使用模版,第二個參數(shù)該怎么些,寫成函數(shù)指針且不說太繁瑣,關(guān)鍵是沒有通用性,每個成員函數(shù)都要單獨(dú)寫一個轉(zhuǎn)換函數(shù)。
第二種方法:
#define GetMemberFuncAddr_VC8(FuncAddr,FuncType)\
{ \
__asm \
{ \
mov eax,offset FuncType \
}; \
__asm \
{ \
mov FuncAddr, eax \
}; \
}
這樣使用:
DWORD dwAddrPtr;
GetMemberFuncAddr_VC8(dwAddrPtr,&tt::foo);
本來是想寫成一個模版函數(shù)的,可惜雖然通過了編譯,卻不能正確運(yùn)行。估計(jì)在匯編代碼中使用模版參數(shù)不太管用,用offset取偏移量直接就得0。
上面的宏是可以正確運(yùn)行的,并且還有一個額外的好處,就是可以直接取私有成員函數(shù)的地址(大概在asm括號中,編譯器不再檢查代碼的可訪問性)。不過缺點(diǎn)是它在vc6下是無法通過編譯的,只能在VC8下使用。
三、調(diào)用成員函數(shù)地址
通過上面兩個方法,我們可以取到成員函數(shù)的地址。不過,如果不能通過地址來調(diào)用成員函數(shù)的話,那也還是沒有任何用處。當(dāng)然,這是可行的。不過在這之前,需要了解關(guān)于成員函數(shù)的一些知識。
我們知道,成員函數(shù)和普通函數(shù)最大的區(qū)別就是成員函數(shù)包含一個隱藏的參數(shù)this指針,用來表明成員函數(shù)當(dāng)前作用在那一個對象實(shí)例上。根據(jù)調(diào)用約定(Calling Convention)的不同,成員函數(shù)實(shí)現(xiàn)this指針的方式也不同。如果使用__thiscall調(diào)用約定,那么this指針保存在寄存器ECX中,VC編譯器缺省情況下就是這樣的。如果是__stdcall或__cdecl調(diào)用約定,this指針將通過棧進(jìn)行傳遞,且this指針是最后一個被壓入棧的參數(shù),相當(dāng)于編譯器在函數(shù)的參數(shù)列表中最左邊增加了一個this參數(shù)。
這里還有件事不得不提,雖然vc將__thiscall類型作為成員函數(shù)的默認(rèn)類型,但是vc6卻沒有定義__thiscall關(guān)鍵字!如果你使用__thiscall來定義一個函數(shù),編譯器報(bào)錯:'__thiscall' keyword reserved for future use。
知道這些就好辦了,我們只要根據(jù)不同的調(diào)用約定,準(zhǔn)備好this指針,然后象普通函數(shù)指針一樣的使用成員函數(shù)地址就可以了。
對__thiscall類型的成員函數(shù)(注意,這個是VC的默認(rèn)類型),我們在調(diào)用之前加一句: mov ecx, this; 然后就可以調(diào)用成員函數(shù)指針。例如:
class tt
{
public:
void foo(int x,char c,char *s)//沒有指定類型,默認(rèn)是__thiscall.
{
printf("\n m_a=%d, %d,%c,%s\n",m_a,x,c,s);
}
int m_a;
};
typedef void (__stdcall *FUNCTYPE)(int x,char c,char *s);//定義對應(yīng)的非成員函數(shù)指針類型,注意指定__stdcall.
tt abc;
abc.m_a = 123;
DWORD ptr;
DWORD This = (DWORD)&abc;
GetMemberFuncAddr_VC6(ptr,tt::foo); //取成員函數(shù)地址.
FUNCTYPE fnFooPtr = (FUNCTYPE) ptr;//將函數(shù)地址轉(zhuǎn)化為普通函數(shù)的指針.
__asm //準(zhǔn)備this指針.
{
mov ecx, This;
}
fnFooPtr(5,'a',"7xyz"); //象普通函數(shù)一樣調(diào)用成員函數(shù)的地址.
對其它類型的成員函數(shù),我們只要申明一個與原成員函數(shù)定義完全類似的普通函數(shù)指針,但在參數(shù)中最左邊加一個void * 參數(shù)。代碼如下:
class tt
{
public:
void __stdcall foo(int x,char c,char *s)//成員函數(shù)指定了__stdcall調(diào)用約定.
{
printf("\n m_a=%d, %d,%c,%s\n",m_a,x,c,s);
}
int m_a;
};
typedef void (__stdcall *FUNCTYPE)(void *This,int x,char c,char *s);//注意多了一個void *參數(shù).
tt abc;
abc.m_a = 123;
DWORD ptr;
GetMemberFuncAddr_VC6(ptr,tt::foo); //取成員函數(shù)地址.
FUNCTYPE fnFooPtr = (FUNCTYPE) ptr;//將函數(shù)地址轉(zhuǎn)化為普通函數(shù)的指針.
fnFooPtr(&abc,5,'a',"7xyz"); //象普通函數(shù)一樣調(diào)用成員函數(shù)的地址,注意第一個參數(shù)是this指針. 每次都定義一個函數(shù)類型并且進(jìn)行一次強(qiáng)制轉(zhuǎn)化,這個事是比較煩的,能不能將這些操作寫成一個函數(shù),然后每次調(diào)用是指定函數(shù)地址和參數(shù)就可以了呢?當(dāng)然是可以的,并且我已經(jīng)寫了一個這樣的函數(shù)。
//調(diào)用類成員函數(shù)
//callflag:成員函數(shù)調(diào)用約定類型,0--thiscall,非0--其它類型.
//funcaddr:成員函數(shù)地址.
//This:類對象的地址.
//count:成員函數(shù)參數(shù)個數(shù).
//...:成員函數(shù)的參數(shù)列表.
DWORD CallMemberFunc(int callflag,DWORD funcaddr,void *This,int count,...)
{
DWORD re;
if(count>0)//有參數(shù),將參數(shù)壓入棧.
{
__asm
{
mov ecx,count;//參數(shù)個數(shù),ecx,循環(huán)計(jì)數(shù)器.
mov edx,ecx;
shl edx,2;
add edx,0x14; edx = count*4+0x14;
next: push dword ptr[ebp+edx];
sub edx,0x4;
dec ecx
jnz next;
}
}
//處理this指針.
if(callflag==0) //__thiscall,vc默認(rèn)的成員函數(shù)調(diào)用類型.
{
__asm mov ecx,This;
}
else//__stdcall
{
__asm push This;
}
__asm//調(diào)用函數(shù)
{
call funcaddr;
mov re,eax;
}
return re;
}使用這個函數(shù),則上面的兩個調(diào)用可以這樣寫:
CallMemberFunc(0,ptr1,&abc,3,5,'a',"7xyz");//第一個參數(shù)0,表示采用__thiscall調(diào)用.
CallMemberFunc(1,ptr2,&abc,3,5,'a',"7xyz");//第一個參數(shù)1,表示采用非__thiscall調(diào)用.
需要說明的是,CallMemberFunc是有很多限制的,它并不能對所有的情況都產(chǎn)生正確的調(diào)用序列。原因之一是它假定每個參數(shù)都使用了4個字節(jié)的棧空間。這在大多數(shù)情況下是正確的,比如參數(shù)為指針,char,short,int,long以及對應(yīng)的無符號類型,這些參數(shù)確實(shí)都是每一個參數(shù)使用了4字節(jié)的棧空間。但是還有很多情況下,參數(shù)不使用4字棧空間,比如double,自定義的結(jié)構(gòu)或類.float雖然是占了4字節(jié),但編譯器還產(chǎn)生了一些浮點(diǎn)指令,而這些無法在CallMemberFunc被模擬出來,因此對float參數(shù)也是不行的。
總結(jié)一下,如果成員函數(shù)的參數(shù)都是整型兼容類型,則可以使用CallMemberFunc調(diào)用函數(shù)地址。如果不是,那就只有按前面的方法,先定義對應(yīng)的普通函數(shù)類型,強(qiáng)制轉(zhuǎn)化,準(zhǔn)備this指針,然后調(diào)用普通函數(shù)指針。
四、進(jìn)一步的討論
到目前為止,已經(jīng)討論了如何取成員函數(shù)的地址,然后如何使用這個地址。但是還有些重要的情況沒有討論,我們知道成員函數(shù)可分為三種:普通成員函數(shù),靜態(tài),虛擬。另外更重要的是,在繼承甚至多繼承下情況如何。
首先看看最簡單的單繼承,非虛擬函數(shù)的情況。
class tt1
{
public:
void foo1(){ printf("\n hi, i am in tt1::foo1\n"); }
};
class tt2 : public tt1
{
public:
void foo2(){ printf("\n hi, i am in tt2::foo2\n"); }
};
注意,tt2中沒有定義函數(shù)foo1,它的foo1函數(shù)是從tt1中繼承過來的。這種情況下,我們直接取tt2::foo1的地址行會發(fā)生什么?
DWORD tt2_foo1;
tt1 x;
GetMemberFuncAddr_VC6(tt2_foo1,&tt2::foo1);
CallMemberFunc(0,tt2_foo1,&x,0); // tt2::foo1 = tt1::foo1
運(yùn)行結(jié)果表明,一切正常!當(dāng)我們寫下tt2::foo1的時(shí)候,編譯器知道那實(shí)際上是tt1::foo1,因此它會暗中作替換。編譯器(VC6)產(chǎn)生的代碼如下:
GetMemberFuncAddr_VC6(tt2_foo1,&tt2::foo1); //源代碼.
//VC6編譯器產(chǎn)生的匯編代碼:
push offset @ILT+235(tt1::foo1) (004010f0) //直接用tt1::foo1 替換 tt2::foo1.
...
再看看稍微復(fù)雜些的情況,繼承情況下的虛擬函數(shù)。
class tt1
{
public:
void foo1(){ printf("\n hi, i am in tt1::foo1\n"); }
virtual void foo3(){ printf("\n hi, i am in tt1::foo3\n"); }
};
class tt2 : public tt1
{
public:
void foo2(){ printf("\n hi, i am in tt2::foo2\n"); }
virtual void foo3(){ printf("\n hi, i am in tt2::foo3\n"); }
};現(xiàn)在tt1和tt2都定義了虛函數(shù)foo3,按C++語法,如果通過指針調(diào)用foo3,應(yīng)該發(fā)生多態(tài)行為。下面的代碼:
DWORD tt1_foo3,tt2_foo3;
GetMemberFuncAddr_VC6(tt1_foo3,&tt1::foo3);
GetMemberFuncAddr_VC6(tt2_foo3,&tt2::foo3);
tt1 x;
tt2 y;
CallMemberFunc(0,tt1_foo3,&x,0); // tt1::foo3
CallMemberFunc(0,tt2_foo3,&x,0); // tt2::foo3
CallMemberFunc(0,tt1_foo3,&y,0); // tt1::foo3
CallMemberFunc(0,tt2_foo3,&y,0); // tt2::foo3
輸出如下:
hi, i am in tt1::foo3
hi, i am in tt1::foo3
hi, i am in tt2::foo3
hi, i am in tt2::foo3
請注意第二行輸出,tt2_foo3取的是&tt2::foo3,但由于傳遞的this指針產(chǎn)生是&x,所以實(shí)際上調(diào)用了tt1::foo3。同樣,第三行輸出,取的是基類的函數(shù)地址,但由于實(shí)際對象是派生類,最后調(diào)用了派生類的函數(shù)。 這說明取得的成員函數(shù)地址在虛擬函數(shù)的情況下仍然保持了正確的行為。
你若真的理解了上面所說的,一定會覺得奇怪。取函數(shù)地址的時(shí)候就得到了一個整數(shù)(成員函數(shù)地址),為何調(diào)用的時(shí)候卻進(jìn)了不同的函數(shù)? 只要看看匯編代碼就都清楚了,"源碼之前,了無秘密"。源代碼: GetMemberFuncAddr_VC6(tt1_foo3,&tt1::foo3); 產(chǎn)生的匯編代碼如下:
push offset @ILT+90(`vcall') (0040105f)
...
原來取tt1::foo3地址的時(shí)候,并不是真的就將tt1::foo3的地址傳給了函數(shù),而是傳了一個vcall函數(shù)的地址。顧名思義,vcall當(dāng)然是虛擬調(diào)用的意思。我們找到地址0040105f,看看這個函數(shù)到底干了些什么。
@ILT+90(??_9@$BA@AE):
0040105F jmp `vcall' (00401380)
該地址只是ILT的一個項(xiàng),直接跳轉(zhuǎn)到真正的vcall函數(shù),00401380。找到00401380,就可以看到vcall的代碼。
`vcall':
00401380 mov eax,dword ptr [ecx] ;//將this指針視為dword類型,并將指向的內(nèi)容(對象的首個dword)放入eax.
00401382 jmp dword ptr [eax] ;//跳轉(zhuǎn)到eax所指向的地址.
代碼執(zhí)行的時(shí)候,ecx就是this指針,具體說就是上面對象x或y的地址。而eax就是對象x或y的第一個dword的值。我們知道,對于有虛擬函數(shù)的類對象,其對象的首地址處總是一個指針,該指針指向一個虛函數(shù)的地址表。上面的對象由于只有一個虛函數(shù),所以虛函數(shù)表也只有一項(xiàng)。因此,直接跳轉(zhuǎn)到eax指向的地址就好。如果有多個虛函數(shù),則eax還要加上一個偏移量,以定位到不同的虛函數(shù)。比如,如果有兩個虛函數(shù),則會有兩個vcall代碼,分別對應(yīng)不同的虛函數(shù),其代碼大概是下面的樣子:
`vcall':
00401BE0 mov eax,dword ptr [ecx]
00401BE2 jmp dword ptr [eax]
`vcall':
00401190 mov eax,dword ptr [ecx]
00401192 jmp dword ptr [eax+4]
編譯器根據(jù)取的是哪個虛函數(shù)的地址,則相應(yīng)的用對應(yīng)的vcall地址代替。
總結(jié)一下:用前面方法取得的成員函數(shù)地址在虛擬函數(shù)的情況下仍然保持正確的行為,是因?yàn)榫幾g器實(shí)際上傳遞了對應(yīng)的vcall地址。而vcall代碼會根據(jù)上下文this指針定位到對應(yīng)的虛函數(shù)表,進(jìn)而調(diào)用正確的虛函數(shù)。
最后,我們看一下多繼承情況。很明顯,現(xiàn)在情況要復(fù)雜得多。如果實(shí)際試一下,會碰到很多困難。首先,指定成員函數(shù)的時(shí)候可能會碰到?jīng)_突。其次,給定this指針的時(shí)候需要經(jīng)過調(diào)整。另外,對虛擬繼承可能還要特別處理。解決所有這些問題已經(jīng)超出了這篇文章的范圍,并且我想要的成員函數(shù)指針是一個真正的指針,而在多繼承的情況下,很多時(shí)候成員函數(shù)指針已經(jīng)變成了一個結(jié)構(gòu)體(見參考文獻(xiàn)),這時(shí)要正確調(diào)用該指針就變得格外困難。因此結(jié)論是,上面討論的方法并不適用于多繼承的情況,要想在多繼承的情況下直接調(diào)用成員函數(shù)地址,必須手工處理各種調(diào)整,沒有簡單的統(tǒng)一方法。