什么是EBC和EBO
EBC英文全稱為“Empty Base Class”,中文全稱“空基類”。那什么是空基類呢?簡單的
說就是沒有任何數據成員的類就稱之為空基類。也就是EBC的類定義中不包含任何數據成員,
那么這樣一來可能大家會認為一個EBC的尺寸(sizeof)因該是0,確實按照定義而言因該是
這樣的,但是我們知道即使是一個EBC也可以定義一個對象,而對象是一個運行時的內存實
體,也就是說對象是必須要能夠通過內存地址進行區分的,那么即使是一個EBC類的對象也
必須占有內存空間,這樣一來一般情況下編譯器會將EBC的尺寸看作1字節,也就是讓其對象
占用一個字節的空間,這樣一來既可以達到對象的地址鑒別,同時也是一個比較節約內存的
分配策略。例如:
#include <cassert>
struct CEmptyClass {};
int main( int argc, char *argv[] )
{
CEmptyClass emptyObject;
assert( sizeof( CEmptyClass ) == 1 );
assert( sizeof( emptyObject ) == 1 );
return 0;
}
通過上面的討論已經知道什么是空基類了,那么下面這些的類屬于空基類么?
struct CEmptyClass1 { CEmptyClass1() {}; ~CEmptyClass1() {} };
struct CEmptyClass2 { void print() {} };
struct CEmptyClass3 { virtual ~CEmptyClass3() {} };
struct CEmptyClass4 : public CEmptyClass1 {};
struct CEmptyClass5 : public CEmptyClass3 {};
struct CEmptyClass6 { uint32_t v; };
struct CEmptyClass7 : public CEmptyClass6 {};
struct CEmptyClass10 : virtual public CEmptyClass1 {};
struct CEmptyClass11 : virtual public CEmptyClass1 {};
struct CEmptyClass12 : public CEmptyClass10, public CEmptyClass11 {};
根據上面的定義“沒有任何數據成員”,這里的數據成員不僅僅包括類的成員變量,同
時還包括編譯器為了某種目的引入的數據成員,比如:為了支持多態而引入的虛指針vptr、
為了支持虛繼承而引入的必要的虛基類指針等,而且還包括從基類繼承直接或間接繼承而
來的上述的數據成員。那么這樣一來,上面的問題就很清楚了,CEmptyClass3、
CEmptyClass5、CEmptyClass6、CEmptyClass7、CEmptyClass10、CEmptyClass11、
CEmptyClass12就不是EBC了,而CEmptyClass1、CEmptyClass2、CEmptyClass4仍然是EBC。
那么可能有些人會看出來如果這樣的一個類,他的尺寸是多少呢?
struct CEmptyClass20 : public CEmptyClass1, public CEmptyClass2 {};
struct CEmptyClass21 : public CEmptyClass1 { uint32_t v; };
struct CEmptyClass22 : public CEmptyClass1, public CEmptyClass2 { uint32_t v; };
struct CEmptyClass23 : public CEmptyClass1, public CEmptyClass6 {};
在VC++8和g++3.4.x(g++4以上版本編譯上述代碼出現編譯錯誤)版本時所出現的結果
會比較出人意料:
sizeof( CEmptyClass20 ) == 1
sizeof( CEmptyClass21 ) == 4
sizeof( CEmptyClass22 ) == 8
sizeof( CEmptyClass23 ) == 4
為什么會出現上述的結果呢?這個主要是因為編譯器實施EBO所致的。那什么是EBO呢?
EBO英文全稱“Empty Base Class Optimize”,中文全稱“空基類優化”。其實就是在EBC類被
繼承的是時候由于空基類沒有任何數據成員所以可以讓其在子類的對象布局中優化掉EBC所
占用的那一個字節,用子類對象的首地址作為EBC的子對象的首地址(也就是this指針)。
需要注意的是并不是每一次EBO優化都回被成功的實施,有時候由于繼承關系和對象布局
問題會導致無法實施EBO優化,從而導致EBC的子對象必然會在子類的對象中占用一定的空
間(一般會大于1個字節,主要是因為內存對齊的需要)。
我們來分析上面的的4個繼承類的尺寸現象問題:
1. sizeof( CEmptyClass20 ) == 1;CEmptyClass20類繼承于兩個EBC類,同時自己也
是一個EBC類,所以編譯器會自動地優化掉兩個基類的子對象的內存空間,所以尺寸
仍然是1字節;
2. sizeof( CEmptyClass21 ) == 4;CEmptyClass21類繼承于一個EBC類,同時自己也
包含一個4字節的成員變量,此時可以成功的實施EBO優化將EBC的內存空間優化掉;
3. sizeof( CEmptyClass22 ) == 8;CEmptyClass22類繼承于兩個EBC類,同時自己也
包含一個4字節的成員變量,按一般常理而言此時編譯器應該可以優化掉兩個EBC所
需要的內存空間,從而使得其尺寸僅僅只有4個字節,可是為什么會有8個字節呢?
也就是說此時編譯器并沒有實施EBO優化,使得每一個EBC子對象都回占用1個字節的
內存,從而占用2字節內存,再加上32位系統下的對齊需要填充2個字節已形成4字節
對齊,所以會導致其成為8個字節;
4. sizeof( CEmptyClass23 ) == 4;CEmptyClass23類繼承于一個EBC類和一個非EBC類,
而CEmptyClass6因為含有一個vptr所以具有4字節尺寸,而CEmtpyClass23內本身不
包含任何數據成員,通過EBO優化掉第一個EBC的內存,所以其尺寸就是4字節。
通過上面的分析可以看出來,一般情況下如果子類的基類列表中只有一個EBC時時一定
可以成功實施EBO優化的,而如果出現多繼承于多個EBC時會根據子類是否包含數據成員而
確定能夠實施EBO優化,同時會和編譯器的優化策略具有較大的關系。
在boost庫中有非常多的機制依賴于EBO優化,比如:nocopyable等,充分的理解EBC/EBO
并利用其所具有的內存優化特征,會在類繼承體系中引入行為/策略的同時不導致對象的膨脹。
EBC英文全稱為“Empty Base Class”,中文全稱“空基類”。那什么是空基類呢?簡單的
說就是沒有任何數據成員的類就稱之為空基類。也就是EBC的類定義中不包含任何數據成員,
那么這樣一來可能大家會認為一個EBC的尺寸(sizeof)因該是0,確實按照定義而言因該是
這樣的,但是我們知道即使是一個EBC也可以定義一個對象,而對象是一個運行時的內存實
體,也就是說對象是必須要能夠通過內存地址進行區分的,那么即使是一個EBC類的對象也
必須占有內存空間,這樣一來一般情況下編譯器會將EBC的尺寸看作1字節,也就是讓其對象
占用一個字節的空間,這樣一來既可以達到對象的地址鑒別,同時也是一個比較節約內存的
分配策略。例如:
#include <cassert>
struct CEmptyClass {};
int main( int argc, char *argv[] )
{
CEmptyClass emptyObject;
assert( sizeof( CEmptyClass ) == 1 );
assert( sizeof( emptyObject ) == 1 );
return 0;
}
通過上面的討論已經知道什么是空基類了,那么下面這些的類屬于空基類么?
struct CEmptyClass1 { CEmptyClass1() {}; ~CEmptyClass1() {} };
struct CEmptyClass2 { void print() {} };
struct CEmptyClass3 { virtual ~CEmptyClass3() {} };
struct CEmptyClass4 : public CEmptyClass1 {};
struct CEmptyClass5 : public CEmptyClass3 {};
struct CEmptyClass6 { uint32_t v; };
struct CEmptyClass7 : public CEmptyClass6 {};
struct CEmptyClass10 : virtual public CEmptyClass1 {};
struct CEmptyClass11 : virtual public CEmptyClass1 {};
struct CEmptyClass12 : public CEmptyClass10, public CEmptyClass11 {};
根據上面的定義“沒有任何數據成員”,這里的數據成員不僅僅包括類的成員變量,同
時還包括編譯器為了某種目的引入的數據成員,比如:為了支持多態而引入的虛指針vptr、
為了支持虛繼承而引入的必要的虛基類指針等,而且還包括從基類繼承直接或間接繼承而
來的上述的數據成員。那么這樣一來,上面的問題就很清楚了,CEmptyClass3、
CEmptyClass5、CEmptyClass6、CEmptyClass7、CEmptyClass10、CEmptyClass11、
CEmptyClass12就不是EBC了,而CEmptyClass1、CEmptyClass2、CEmptyClass4仍然是EBC。
那么可能有些人會看出來如果這樣的一個類,他的尺寸是多少呢?
struct CEmptyClass20 : public CEmptyClass1, public CEmptyClass2 {};
struct CEmptyClass21 : public CEmptyClass1 { uint32_t v; };
struct CEmptyClass22 : public CEmptyClass1, public CEmptyClass2 { uint32_t v; };
struct CEmptyClass23 : public CEmptyClass1, public CEmptyClass6 {};
在VC++8和g++3.4.x(g++4以上版本編譯上述代碼出現編譯錯誤)版本時所出現的結果
會比較出人意料:
sizeof( CEmptyClass20 ) == 1
sizeof( CEmptyClass21 ) == 4
sizeof( CEmptyClass22 ) == 8
sizeof( CEmptyClass23 ) == 4
為什么會出現上述的結果呢?這個主要是因為編譯器實施EBO所致的。那什么是EBO呢?
EBO英文全稱“Empty Base Class Optimize”,中文全稱“空基類優化”。其實就是在EBC類被
繼承的是時候由于空基類沒有任何數據成員所以可以讓其在子類的對象布局中優化掉EBC所
占用的那一個字節,用子類對象的首地址作為EBC的子對象的首地址(也就是this指針)。
需要注意的是并不是每一次EBO優化都回被成功的實施,有時候由于繼承關系和對象布局
問題會導致無法實施EBO優化,從而導致EBC的子對象必然會在子類的對象中占用一定的空
間(一般會大于1個字節,主要是因為內存對齊的需要)。
我們來分析上面的的4個繼承類的尺寸現象問題:
1. sizeof( CEmptyClass20 ) == 1;CEmptyClass20類繼承于兩個EBC類,同時自己也
是一個EBC類,所以編譯器會自動地優化掉兩個基類的子對象的內存空間,所以尺寸
仍然是1字節;
2. sizeof( CEmptyClass21 ) == 4;CEmptyClass21類繼承于一個EBC類,同時自己也
包含一個4字節的成員變量,此時可以成功的實施EBO優化將EBC的內存空間優化掉;
3. sizeof( CEmptyClass22 ) == 8;CEmptyClass22類繼承于兩個EBC類,同時自己也
包含一個4字節的成員變量,按一般常理而言此時編譯器應該可以優化掉兩個EBC所
需要的內存空間,從而使得其尺寸僅僅只有4個字節,可是為什么會有8個字節呢?
也就是說此時編譯器并沒有實施EBO優化,使得每一個EBC子對象都回占用1個字節的
內存,從而占用2字節內存,再加上32位系統下的對齊需要填充2個字節已形成4字節
對齊,所以會導致其成為8個字節;
4. sizeof( CEmptyClass23 ) == 4;CEmptyClass23類繼承于一個EBC類和一個非EBC類,
而CEmptyClass6因為含有一個vptr所以具有4字節尺寸,而CEmtpyClass23內本身不
包含任何數據成員,通過EBO優化掉第一個EBC的內存,所以其尺寸就是4字節。
通過上面的分析可以看出來,一般情況下如果子類的基類列表中只有一個EBC時時一定
可以成功實施EBO優化的,而如果出現多繼承于多個EBC時會根據子類是否包含數據成員而
確定能夠實施EBO優化,同時會和編譯器的優化策略具有較大的關系。
在boost庫中有非常多的機制依賴于EBO優化,比如:nocopyable等,充分的理解EBC/EBO
并利用其所具有的內存優化特征,會在類繼承體系中引入行為/策略的同時不導致對象的膨脹。