雖然沒有現(xiàn)實(shí)意義,但對(duì)理解C++的對(duì)象模型是很有幫助的。
前幾天,在論壇里看到一個(gè)帖子,內(nèi)容是:
(原帖見:http://community.csdn.net/Expert/topic/5014/5014384.xml?temp=.3018152)
========================================
class a
{
private:
int k;
};
要求不用友元,不在這個(gè)類里添加任何代碼,去訪問成員變量k。
能做出的高手,請(qǐng)貼出完整源碼,以便大家測(cè)試。
========================================
這道題目本身所要解決的問題并沒有多少現(xiàn)實(shí)意義,但如果試著去解決它,以及比它更復(fù)雜的情況,我認(rèn)為至少對(duì)理解C++的對(duì)象模型是很有幫助的。
開始討論之前不得不說,這道題做為一個(gè)題目存在邏輯上的重大缺陷:“不給類增加一行代碼”,我實(shí)在想不出如何在驗(yàn)正解題人所提供方案的正確性。只有一個(gè)private,難道用解題人所提供的讀出方案來驗(yàn)證他自己所提供的寫入方案?你用你的方法讀出來,然后告訴我那就是你用你的方法寫進(jìn)去的值——那能讓人信服嗎?所以我決定還是把問題改一改,并稍微具體化如下:
class Test {
public:
int get_value() { return value; }
private:
int value;
};
要求不用友元,不在這個(gè)類里添加任何代碼,把成員變量k的值改為100,結(jié)果自然是通過公共成員函數(shù)get_value來驗(yàn)證。
“不在類里添加任何代碼”,除了
#define private public
我實(shí)在想不出其它的“偏門”方法了。那就想想不偏門的吧,論壇里好幾位朋友提供了相當(dāng)于如下代碼的方法(為控制篇幅,本文中所有程序段都假設(shè)已包含了<iostream>頭文件并引入了std名字空間,必要時(shí)還有其它頭文件):
Test t;
*(int*)&t = 100;
cout << t.get_value() << endl;
這種方式利用對(duì)象內(nèi)存布局的特點(diǎn):整個(gè)類只有一個(gè)整型成員,沒有繼承或虛擬繼承,也沒有任何虛函數(shù),那么這個(gè)對(duì)象的地址也就是它的第一個(gè)成員變量的地址,所以只需要把對(duì)象地址強(qiáng)轉(zhuǎn)成整型,那么獲得的就是那個(gè)成員變量的地址,然后對(duì)轉(zhuǎn)換后的地址再解引用,修改即可,在VC2003中驗(yàn)證,結(jié)果是正確的。
但指針的強(qiáng)制轉(zhuǎn)換總給人帶來不爽,不大安全的感覺,上面那條最關(guān)鍵的語(yǔ)句相當(dāng)于:
*reinterpret_cast<int*>(&t) = 100;
也就是說,它動(dòng)用了C++語(yǔ)言中最“強(qiáng)”的指針轉(zhuǎn)換方式(說它最強(qiáng),是因?yàn)闆]有什么指針之間他不能轉(zhuǎn)換的)。其實(shí)我們完全可以做得更“文明”一點(diǎn),方法是再定義一個(gè)聯(lián)合體,比如:
union TestInt {
Test t;
int i;
};
然后再:
TestInt ti;
ti.i = 100;
cout << ti.t.get_value() << endl;
同樣達(dá)到了目的,但實(shí)質(zhì)上依據(jù)的機(jī)理跟上面的指針轉(zhuǎn)換是一致的。
這個(gè)方法沒啥大問題,就是有局限性,只能用于修改類的第一個(gè)成員,如果在value之前再加一個(gè)成員,比如:
class Test {
public:
int get_value() { return value; }
private:
char ch;
int value;
};
這種方法就不靈了。
當(dāng)然,你可以手工算,認(rèn)為char占一個(gè)字節(jié),于是會(huì)試圖取對(duì)象地址再加1得到成員value的地址。但第一,這種方法無法不跨平臺(tái)跨實(shí)現(xiàn),char及int類型在不同的平臺(tái)和編譯器實(shí)現(xiàn)中的長(zhǎng)度都可能是不一樣的;第二,沒有考慮字對(duì)齊問題,在內(nèi)存中,value成員一般不會(huì)緊接著排布在ch之后,而是中間間開幾個(gè)字節(jié),最后將int類型對(duì)齊到另一個(gè)位置,比如4的倍數(shù)的地址上;而更糟糕的是,字對(duì)齊不僅跟平臺(tái)相關(guān),還跟預(yù)編譯指令,甚至編譯選項(xiàng)都會(huì)有關(guān)。所以,這種手工計(jì)算的方式還是放棄了吧。
有朋友提到了使用一種宏求出value成員相對(duì)于整個(gè)對(duì)象起始地址的偏移量,即定義一個(gè)宏:
#define OFFSET(TYPE,MEM) ((int)(char*)&(((TYPE*)0)->MEM))
這個(gè)宏通過把0地址轉(zhuǎn)換為TYPE指針類型,然后從這個(gè)指針上“取”MEM成員,而MEM成員的地址轉(zhuǎn)換后結(jié)果就是MEM成員相對(duì)于整個(gè)對(duì)象的偏移量(我們既然是從0地址開始算的,就不用再減去起始地址0)。
然后同,我們通過使用這個(gè)宏作用于原來的類和目標(biāo)字段,即:
OFFSET(Test, value)
就可以獲得value字段在Test類型對(duì)象中的偏移量,用對(duì)象的首地址加上這個(gè)偏移量,就可以得到value變量的地址,從而可以像上面一樣解引用,修改。
這種方法不僅看起來難受,費(fèi)解。事實(shí)上也根本行不通,因?yàn)檫@個(gè)宏所用到的技巧是從Test類型的指針上訪問value成員——而valuee是private的!所以連編譯都通不過。
論壇里有位朋友提出了另外一種方法可以巧妙地對(duì)付這個(gè)復(fù)雜一點(diǎn)的類,先做一個(gè)輔助類,它跟Test類很像,唯一的不同是它的成員都是public的:
class TestTwin {
public:
int get_value() { return value; }
public:
char ch;
int value;
};
于是,這個(gè)TestTwin類跟原來的Test類在內(nèi)存布局上不會(huì)有什么不同,通過指針轉(zhuǎn)換,很容易借助于它來修改Test類對(duì)象的value成員:
Test t;
TestTwin* p = reinterpret_cast<TestTwin*>(&t);
p->value = 100;
cout << t.get_value() << endl;
如果你不熟悉C++的顯式指針轉(zhuǎn)換方式:reinterpret_cast,在這里可以認(rèn)為它相當(dāng)于C風(fēng)格的:
TestTwin* p = (TestTwin*)&t;
而前述的兩條語(yǔ)句也可以合在一起,直接寫成:
reinterpret_cast<TestTwin*>(&t)->value = 100;
還有,厭惡指針操作的朋友仍可采用前面介紹的聯(lián)合體方法來運(yùn)用這個(gè)模具類,只是這次定義的聯(lián)合體是這樣:
union TestTestTwin {
Test t;
TestTwin tw;
};
而程序是這樣:
TestTestTwin ttw;
ttw.tw.value = 100;
cout << ttw.t.get_value() << endl;
問題都解決了嗎?如果類更復(fù)雜一些,會(huì)不會(huì)還有局限性呢?我們?cè)侔杨惛囊桓模?
class Test {
public:
int get_value() { return value; }
~Test() {}
private:
char ch;
int value;
public:
int a;
double b;
protected:
string e;
private:
short d;
};
這次不僅成員多了許多,有string類型的成員(須include <string>),還弄出個(gè)虛析構(gòu)函數(shù)來(我們都知道擁有虛函數(shù)的類會(huì)導(dǎo)致其實(shí)例中多一個(gè)虛表指針)。但后面會(huì)看到,虛函數(shù)對(duì)我們討論的問題影響不大,我們加上它只是想證明:只要方法足夠好,不怕對(duì)象更復(fù)雜。
那上面的模具辦法問題出在哪里呢?為什么不能同樣再搞一個(gè)類,把那個(gè)value改為public的,然后用它來“套住”原來對(duì)象中value成員呢?
原因是C++語(yǔ)言只保證類中同一個(gè)access section(即從一個(gè)訪問權(quán)限修飾符public/private/protected到另一個(gè)修飾符之間的部分)中定義的非靜態(tài)成員變量會(huì)按照聲明時(shí)的順序分布的內(nèi)存中,但并不保證跨越了不同access section的所有成員變量都在內(nèi)存中按聲明時(shí)的順序存放,某種編譯器完全有可能把所有的private塊都合成一塊,甚至整個(gè)給扔到所有protected成員的后邊去(雖然VC并沒這么做)。
換句話說:改掉了一個(gè)成員的訪問權(quán)限,就可能改變了對(duì)象的內(nèi)存布局。于是,改變了的模子也就不再能夠套住相應(yīng)位置上的成員。
但辦法還是有,只需要將原來的改進(jìn)一下:
在現(xiàn)有的C++對(duì)象模型中,為類增加一個(gè)非虛成員函數(shù),不會(huì)改變對(duì)象的內(nèi)存布局,我們可以利用這一點(diǎn)來寫一個(gè)TestTwin:
class TestTwin {
public:
int get_value() { return value; }
void set_value(int v) { value = v; }
~TestTwin() {}
private:
char ch;
int value;
public:
int a;
double b;
protected:
float e;
private:
short d;
};
這個(gè)模具跟原來的Test類也是只有一點(diǎn)不同:增加了一個(gè)公共的,非虛的set_value方法,用來給私有成員value賦值。于是,程序可以這么寫:
Test t;
reinterpret_cast<TestTwin*>(&t)->set_value(100);
cout << t.get_value() << endl;
驗(yàn)證通過。
增加的虛函數(shù)純粹是個(gè)障眼物而已,它跟我們采用的方法幾乎沒有絲毫聯(lián)系,所以也就絲毫不用擔(dān)心虛函數(shù)對(duì)內(nèi)存分布的影響會(huì)影響到這個(gè)方法的正確性。但被它一搞,那個(gè)使用聯(lián)合體的方法這一次還真是不管用了,因?yàn)橛辛宋鰳?gòu)函數(shù)的類不能再放進(jìn)聯(lián)合體中了——否則當(dāng)聯(lián)合體實(shí)例的生命周期結(jié)束時(shí),析構(gòu)誰呢?
想了關(guān)天,能想到的只有這么多了。
最后,不行不承認(rèn),“增加一個(gè)非虛成員函數(shù),不會(huì)改變對(duì)象的內(nèi)存布局”這句話也無法從C++標(biāo)準(zhǔn)中得到直接支持,只是對(duì)于目前大多數(shù)編譯器來說,這都是沒問題的。因?yàn)檫@種“讓類的每個(gè)實(shí)例擁有一份獨(dú)立的成員變量,而類的所有實(shí)例共享一份成員函數(shù)”的C++對(duì)象模型是C++之父Bjarne Stroustrup先生本人所提出的,其時(shí)間、空間效率都很好地符合了C++語(yǔ)言的設(shè)計(jì)初衷,不僅現(xiàn)代C++編譯器沒有不這么做的,就連Java/C#編譯器也都這么做。所以,也算是個(gè)“相對(duì)真理”了。
原文地址:http://community.csdn.net/Expert/topic/5039/5039857.xml?temp=.728924