peakflys原創作品,轉載請注明源作者和源鏈接!
virtual function是很多公司面試題的重點考察內容,雖然對于C++而言這是一個老生常談的話題了,但是工作中我發現還是有很多人理解的不透徹。
先看下面的一個例子:
/**
*\brief virtual function test case
*\author peakflys
*\date Sun Dec 1 14:52:47 CST 2013
*/
#include <iostream>
using namespace std;
class Base
{
public:
virtual void print(const int a = 10) {cout<<"Base: "<<a<<endl;}
};
class Derive : public Base
{
public:
virtual void print(const int a = 100) {cout<<"Derive: "<<a<<endl;}
};
int main()
{
Base *pb = new Derive;
pb->print();
Base& rb = *pb;
rb.print();
Derive d;
d.print();
Base *pbb = &d;
pbb->print();
Base& rbb = d;
rbb.print();
Base b;
b.print();
Derive *pd = (Derive*)&b;
pd->print();
Derive& rd = *(Derive*)&b;
rd.print();
delete pb;
return 0;
}
你認為運行后的結果是什么呢?
下面是在我機器上的運行結果(Linux dev 2.6.32,gcc (GCC) 4.8.1)
Derive: 10
Derive: 10
Derive: 100
Derive: 10
Derive: 10
Base: 10
Base: 100
Base: 100
上面例子主要考察的內容有四塊:虛函數的執行、引用和指針的關系、函數調用過程、類型強轉后的行為。如果你能答對所有的結果,下面的內容可以略過。
下面我們來一一回顧一下所涉及到的這四塊內容。
1、虛函數的運行機理:
虛函數是C++實現多態性的必要手段,它在運行時刻才決定具體該調用哪個函數。對于虛函數的完整細節實現標準并未給出,但是大多數編譯器廠商,包括GCC、VS的常見實現都是在含有虛函數的類對象起始地址增加一個虛表指針,虛表指針指向的數組空間稱之為虛表,這個數組包含了類對象的所有虛函數地址。詳細內容大家可以參看《Inside The C++ Object Model》的Function語義學(注:這本書里有部分結論和例子運行同現在主流編譯器的實現有出入)。
2、引用的行為
在常見的編譯器中,引用一般都是通過指針來實現的,它同指針的區別就是它比指針有更多的約束,使用上有更多的限制。
3、虛函數的調用過程:
虛函數的調用過程通常是以下三個步驟:
①、參數壓棧
②、從虛表指針指向的虛表中找出函數的地址
③、調用函數。
這些操作都是在編譯時期就確定的,所不同的是運行時刻對象不同,其對應的虛表中函數地址自然也就是運行時真實對象的函數,這也就是虛函數實現的本質。
而這個過程中,參數的入棧是對象無關的,而且是在編譯時期就確定下來的。所以上面例子中所有指針和引用所調用函數的參數,都是指針和引用本身類型對應的函數默認參數,同運行時刻他們真實指向的對象內存無關。
4、類型強轉后的行為
通常的類型強轉是告訴編譯器必須按照指定結構的內存布局來解析對應內存,正如上例中”Derive *pd = (Derive*)&b; “ ,編譯器就會把b對應的內存來當做Derive的內存布局來解析,但是內存里的內容不變,所以虛函數運行正常。
注:這種行為很危險,如果使用的內存布局并不適合真實內存,很可能造成訪問越界等問題,所以要格外小心強轉操作的使用!對于例子中的downcasting行為,建議使用C++提供的dynamic_cast來轉換。
為了大家更好的理解上面的內容,特附上使用指針和引用分別調用虛函數過程的gcc匯編代碼和注釋:
Base *pb = new Derive;
400b49: bf 08 00 00 00 mov $0x8,%edi
400b4e: e8 6d fe ff ff callq 4009c0 <_Znwm@plt>
400b53: 48 89 c3 mov %rax,%rbx
400b56: 48 89 df mov %rbx,%rdi
400b59: e8 f4 01 00 00 callq 400d52 <_ZN6DeriveC1Ev> //以上均為Derive對象的構造
400b5e: 48 89 5d e8 mov %rbx,-0x18(%rbp) //pb指針的賦值
pb->print();
400b62: 48 8b 45 e8 mov -0x18(%rbp),%rax //pb指針指向的內存的首地址,即Derive對象的起始地址,亦即虛表指針的地址
400b66: 48 8b 00 mov (%rax),%rax //取虛表地址
400b69: 48 8b 00 mov (%rax),%rax //取虛表中的第一項內容(因Derive和Base只有一個虛函數),即print函數地址
400b6c: 48 8b 55 e8 mov -0x18(%rbp),%rdx //this指針傳入rdx
400b70: be 0a 00 00 00 mov $0xa,%esi //參數10入棧(可見在編譯時期就已經確定了)
400b75: 48 89 d7 mov %rdx,%rdi //this指針借rdx傳給rdi
400b78: ff d0 callq *%rax //調用虛函數(通過真實對象的虛表來確定的真正被調函數)
Base& rb = *pb;
400b7a: 48 8b 45 e8 mov -0x18(%rbp),%rax
400b7e: 48 89 45 e0 mov %rax,-0x20(%rbp)
rb.print();
400b82: 48 8b 45 e0 mov -0x20(%rbp),%rax
400b86: 48 8b 00 mov (%rax),%rax
400b89: 48 8b 00 mov (%rax),%rax
400b8c: 48 8b 55 e0 mov -0x20(%rbp),%rdx
400b90: be 0a 00 00 00 mov $0xa,%esi
400b95: 48 89 d7 mov %rdx,%rdi
400b98: ff d0 callq *%rax //以上為通過引用調用虛函數的過程,可見同指針調用的實現完全相同,注釋略
通過上面的分析,相信大家應該都能輕松的明白上面例子的運行結果,此處不再一一解讀。
--by peakflys 15:57:06 Sunday, December 01, 2013