[ECPP讀書(shū)筆記 條目4] 確保對(duì)象在使用前得到初始化
C++在對(duì)象值的初始化問(wèn)題上顯得變幻莫測(cè)。比如說(shuō),你寫(xiě)下了下面的代碼:
int x;
在一些上下文里,x會(huì)確保得到初始化(為零),但是另一些情況下則不會(huì),如果你這樣編寫(xiě):
p的數(shù)據(jù)成員在一些情況下會(huì)確保得到初始化(為零),但是另一些情況則不會(huì)。如果你以前學(xué)習(xí)的語(yǔ)言沒(méi)有對(duì)象初始化的概念,那么請(qǐng)你注意了,因?yàn)檫@很重要。
讀取未初始化的數(shù)據(jù)將導(dǎo)致未定義行為。在一些語(yǔ)言平臺(tái)中,通常情況下讀取未初始化的數(shù)據(jù)僅僅是使你的程序無(wú)法運(yùn)行罷了。更典型的情況是,這樣的讀取操作可能會(huì)得到內(nèi)存中某些位置上的半隨機(jī)的數(shù)據(jù),這些數(shù)據(jù)將會(huì)“污染”需要賦值的對(duì)象,最終,程序的行為將變得十分令人費(fèi)解,你也會(huì)陷入煩人的除錯(cuò)工作中。
現(xiàn)在,人們制定了規(guī)則來(lái)規(guī)定對(duì)象在什么時(shí)候必須被初始化,以及什么時(shí)候不會(huì)。但是遺憾的是,這些規(guī)則太過(guò)復(fù)雜了——在我看來(lái),你根本沒(méi)必要去記憶它們。整體上講,如果你正在使用C++中C語(yǔ)言的一部分(參見(jiàn)條目1),并且這里的初始化會(huì)引入運(yùn)行時(shí)開(kāi)銷(xiāo),那么此時(shí)初始化工作無(wú)法確保完成。但當(dāng)你使用非C的C++部分時(shí),情況有時(shí)就會(huì)改變。這便可以解釋為什么數(shù)組(C++中的C語(yǔ)言)不會(huì)確保得到初始化,而一個(gè)vector(C++中的STL)會(huì)。
解決這類(lèi)表面上的不確定性問(wèn)題最好的途徑就是:總是在使用對(duì)象之前對(duì)它們進(jìn)行初始化。對(duì)于內(nèi)建類(lèi)型的非成員對(duì)象,你需要手動(dòng)完成這一工作。請(qǐng)看下邊的示例:
int x = 0; // 手動(dòng)初始化一個(gè)int值
const char * text = "A C-style string"; // 手動(dòng)初始化一個(gè)指針(見(jiàn)條目3)
double d;
std::cin >> d; // 通過(guò)讀取輸入流進(jìn)行“初始化”
對(duì)于其他大多數(shù)情況而言,初始化的重?fù)?dān)就落在了構(gòu)造函數(shù)的肩上。這里的規(guī)則很簡(jiǎn)單:確保所有構(gòu)造函數(shù)都對(duì)整個(gè)對(duì)象做出完整的初始化。
遵守這一規(guī)則是件很容易的事情,但是還有件重要的事:不要把賦值和初始化搞混了。請(qǐng)看下邊示例中的構(gòu)造函數(shù),它是通訊錄中用于表示條目的類(lèi):
class ABEntry { // ABEntry = "Address Book Entry"
public:
ABEntry(const std::string& name, const std::string& address,
const std::list<PhoneNumber>& phones);
private:
std::string theName;
std::string theAddress;
std::list<PhoneNumber> thePhones;
int num TimesConsulted;
};
ABEntry::ABEntry(const std::string& name, const std::string& address,
const std::list<PhoneNumber>& phones)
{
theName = name; // 以下這些是賦值,而不是初始化
theAddress = address;
thePhones = phones;
numTimesConsulted = 0;
}
上邊的做法可以讓你得到一個(gè)包含你所期望值的ABEntry對(duì)象,但是這仍不是最優(yōu)的做法。C++的規(guī)則約定:一個(gè)對(duì)象的數(shù)據(jù)成員要在進(jìn)入構(gòu)造函數(shù)內(nèi)部之前得到初始化。在ABEntry的構(gòu)造函數(shù)內(nèi)部,theName、theAddress以及thePhones并不是得到了初始化,而是被賦值了。初始化工作應(yīng)該在更早的時(shí)候進(jìn)行:在進(jìn)入ABEntry構(gòu)造函數(shù)內(nèi)部之前,這些數(shù)據(jù)成員的默認(rèn)構(gòu)造函數(shù)應(yīng)該自動(dòng)得到調(diào)用。注意這對(duì)于numTimesConsulted不成立,因?yàn)樗莾?nèi)建數(shù)據(jù)類(lèi)型的。對(duì)它而言,在被賦值以前,誰(shuí)也不能確保它得到了初始化。
編寫(xiě)ABEntry的構(gòu)造函數(shù)的一個(gè)更好的辦法是使用成員初始化表,而不是為成員一一賦值:
ABEntry::ABEntry(const std::string& name, const std::string& address,
const std::list<PhoneNumber>& phones)
: theName(name),
theAddress(address), // 現(xiàn)在這些是初始化
thePhones(phones),
numTimesConsulted(0)
{} // 現(xiàn)在構(gòu)造函數(shù)內(nèi)部是空的
如果僅看運(yùn)行結(jié)果,上面的構(gòu)造函數(shù)與更靠前一些的那個(gè)是一樣的,但是后者的效率更高些。為數(shù)據(jù)成員賦值的版本首先調(diào)用了theName、theAddress以及thePhones的默認(rèn)構(gòu)造函數(shù)來(lái)初始化它們,在默認(rèn)構(gòu)造函數(shù)已經(jīng)為它們分配好了值之后,立即又為它們重新賦了一遍值。于是默認(rèn)構(gòu)造函數(shù)的所有工作就都白費(fèi)了。使用成員初始化表的方法可以避免這一浪費(fèi),這是因?yàn)椋撼跏蓟碇械膮?shù)對(duì)于各種數(shù)據(jù)成員均使用構(gòu)造函數(shù)參數(shù)的形式出現(xiàn)。這樣,theName就通過(guò)復(fù)制name的值完成了構(gòu)造,theAddress通過(guò)復(fù)制address的值完成構(gòu)造,thePhones通過(guò)復(fù)制phones的值完成構(gòu)造。對(duì)于大多數(shù)類(lèi)型來(lái)說(shuō),相對(duì)于“先調(diào)用默認(rèn)構(gòu)造函數(shù)再調(diào)用拷貝運(yùn)算符”而言,通過(guò)單一的調(diào)用拷貝構(gòu)造函數(shù)更加高效——在一些情況下尤其明顯。
對(duì)于內(nèi)建類(lèi)型的對(duì)象,比如numTimeConsulted,初始化與賦值的開(kāi)銷(xiāo)是完全相同的,但是為了保證程序的一致性,最好通過(guò)成員初始化的方式對(duì)所有成員進(jìn)行初始化。類(lèi)似地,即使你期望讓默認(rèn)構(gòu)造函數(shù)來(lái)構(gòu)造一個(gè)數(shù)據(jù)成員,你仍可以使用成員初始化表,只是不為初始化參數(shù)指定一個(gè)具體的值而已。比如,如果ABEntry擁有一個(gè)沒(méi)有參數(shù)的構(gòu)造函數(shù),它可以這樣實(shí)現(xiàn):
:theName(), // 調(diào)用theName的默認(rèn)構(gòu)造函數(shù);
theAddress(), // theAddress和thePhones同上;
thePhones(), // 但是numTimesConsulted
numTimesConsulted(0) // 一定要顯性初始化為零
{}
由于成員初始化表中沒(méi)有為用戶(hù)定義類(lèi)型的數(shù)據(jù)成員指定初始值時(shí),編譯器會(huì)自動(dòng)為這些成員調(diào)用默認(rèn)構(gòu)造函數(shù),因此一些程序員會(huì)認(rèn)為上文中的做法顯得有些多余。這是可以理解的,但是“總將每個(gè)數(shù)據(jù)成員列在初始化表中”這一策略可以避免你去回憶列表中是哪個(gè)成員被忽略了從而無(wú)法得到初始化。比如說(shuō),如果你因?yàn)?span style="font-family:"Courier New";">numTimesConsulted是內(nèi)建數(shù)據(jù)類(lèi)型的,就不將其列入成員初始化表中,那么你的代碼便極有可能呈現(xiàn)出未定義行為。
有些時(shí)候使用初始化表是必須的,即使是對(duì)于內(nèi)建類(lèi)型。舉例說(shuō),const或者引用的數(shù)據(jù)成員必須得到初始化,它們不能被賦值(另請(qǐng)參看條目5)。至于數(shù)據(jù)成員什么時(shí)候必須在成員初始化表中進(jìn)行初始化,什么時(shí)候沒(méi)有必要,如果你不希望去記憶這些規(guī)則,那么最簡(jiǎn)便的選擇就是永遠(yuǎn)都使用初始化表。一些時(shí)候初始化表是必須的,而且通常會(huì)獲得比賦值更高的效率。
許多類(lèi)都包含多個(gè)構(gòu)造函數(shù),每個(gè)構(gòu)造函數(shù)都有自己的成員初始化表。如果某個(gè)類(lèi)擁有非常多的數(shù)據(jù)成員和/或基類(lèi)時(shí),這些初始化列表中將會(huì)存在不少無(wú)意義的重復(fù)代碼,程序員們也會(huì)感到厭煩。在這種情況下,忽略表中的一些條目也并非毫無(wú)意義,這些忽略的數(shù)據(jù)成員應(yīng)符合這一條件:對(duì)它們進(jìn)行賦值還是真正的初始化沒(méi)有什么差別??梢园堰@些賦值語(yǔ)句放在一個(gè)單一(當(dāng)然是私有的)的函數(shù)里,并讓所有的構(gòu)造函數(shù)在必要的時(shí)候調(diào)用這個(gè)函數(shù)。在數(shù)據(jù)成員要接收的真實(shí)的初始化數(shù)據(jù)需要從某個(gè)文件中讀取時(shí),或者要到某個(gè)數(shù)據(jù)庫(kù)中去查找時(shí),這一方法尤其有用。但是總體而言,真正的成員初始化終究要比通過(guò)賦值進(jìn)行偽初始化要好。
C++也不是總那么變幻莫測(cè),對(duì)象中數(shù)據(jù)的初始化的順序就是C++的穩(wěn)定因素之一。這個(gè)次序通常情況下是一致的:基類(lèi)應(yīng)在派生類(lèi)之前得到初始化(另參見(jiàn)條目12),在類(lèi)的內(nèi)部,數(shù)據(jù)成員應(yīng)以它們聲明的順序得到初始化。比如說(shuō)在ABEntry內(nèi)部,theName永遠(yuǎn)都是第一個(gè)得到初始化的,theAddress第二,thePhones第三,numTimesConsulted最后。即使它們?cè)诔蓡T初始化表中的排列順序不同于聲明次序,(盡管這樣做看上去應(yīng)該算作非法,但不幸的是事實(shí)并非這樣。)上述初始化順序也會(huì)得到遵循。為了不使讀者陷入困惑,也為了避免日后出現(xiàn)讓人難以理解的bug,你應(yīng)該保證初始化表中成員的順序與它們被聲明時(shí)的順序嚴(yán)格一致。
在你完成了對(duì)內(nèi)建類(lèi)型的非成員對(duì)象的顯式初始化,并且確保了構(gòu)造函數(shù)使用成員初始化表對(duì)基類(lèi)和數(shù)據(jù)成員進(jìn)行了初始化之后,需要你關(guān)心的內(nèi)容就僅剩下了一個(gè),那就是(先長(zhǎng)舒一口氣):在不同的置換單元中,非局部靜態(tài)對(duì)象的初始化次序是怎樣的。
讓我們來(lái)抽絲剝繭分析這個(gè)問(wèn)題:
【靜態(tài)對(duì)象(static object)】一個(gè)靜態(tài)對(duì)象在被構(gòu)造之后,它的壽命一直延續(xù)到程序結(jié)束。保存在?;蚨阎械膶?duì)象都不是這樣。靜態(tài)對(duì)象包括:全局對(duì)象、名字空間域?qū)ο?、?lèi)內(nèi)部的static對(duì)象、函數(shù)內(nèi)部的static對(duì)象,文件域的static對(duì)象。函數(shù)內(nèi)部的靜態(tài)對(duì)象通常叫做局部靜態(tài)對(duì)象(這是因?yàn)樗鼈儗?duì)于函數(shù)而言是局部的),其它類(lèi)型的靜態(tài)對(duì)象稱(chēng)為非局部靜態(tài)對(duì)象。靜態(tài)對(duì)象在程序退出的時(shí)候會(huì)被自動(dòng)銷(xiāo)毀,換句話(huà)說(shuō),在main中止運(yùn)行的時(shí)候,靜態(tài)對(duì)象的析構(gòu)函數(shù)會(huì)自動(dòng)得到調(diào)用。
【置換單元(translation unit)】一個(gè)置換單元是這樣一段源代碼:由它可以生成一個(gè)目標(biāo)文件。總的來(lái)說(shuō)置換單元就是單一一個(gè)代碼文件,以及所有被#include進(jìn)來(lái)的文件。
于是,我們所要解決的問(wèn)題中,至少包含兩個(gè)需要單獨(dú)編譯的源碼文件,每一個(gè)都至少包含一個(gè)非局部靜態(tài)對(duì)象(換句話(huà)說(shuō),是一個(gè)全局的,或者名字空間域的,或類(lèi)內(nèi)部或者文件域的static對(duì)象)。真正的問(wèn)題是:如果一個(gè)置換單元內(nèi)的一個(gè)非局部靜態(tài)對(duì)象的初始化工作利用了另一個(gè)置換空間內(nèi)的另一個(gè)非局部靜態(tài)變量,那么所使用的對(duì)象應(yīng)該是未經(jīng)初始化的,這是因?yàn)椋憾x在不同置換單元內(nèi)的非靜態(tài)對(duì)象的初始化工作的順序是未定義的。
這里一個(gè)示例可以幫助我們理解這一問(wèn)題。假設(shè)你編寫(xiě)了一個(gè)FileSystem類(lèi),它可以讓Internet上的文件看上去像是本地的。由于你的類(lèi)要使得整個(gè)世界看上去像是一個(gè)單一的文件系統(tǒng),你應(yīng)該創(chuàng)建一個(gè)專(zhuān)門(mén)的類(lèi)來(lái)代表這個(gè)單一的文件系統(tǒng),讓這個(gè)類(lèi)擁有全局的或者名字空間的作用域:
class FileSystem { // 來(lái)自你的庫(kù)
public:
...
std::size_t numDisks() const; // 許多成員函數(shù)中的一個(gè)
...
};
extern FileSystem tfs; // 供客戶(hù)端使用的對(duì)象
// "tfs" = "the file system"
一個(gè)FileSystem對(duì)象絕對(duì)是重量級(jí)的,所以說(shuō)在tfs對(duì)象被構(gòu)造之前使用它會(huì)帶來(lái)災(zāi)難性后果。
現(xiàn)在設(shè)想一下,一些客戶(hù)為文件系統(tǒng)創(chuàng)建了一個(gè)文件夾的類(lèi)。很自然地,他們的類(lèi)會(huì)使用tfs對(duì)象。
class Directory { // 由類(lèi)庫(kù)的客戶(hù)創(chuàng)建
public:
Directory( params );
...
};
Directory::Directory( params )
{
...
std::size_t disks = tfs.numDisks(); // 使用 tfs 對(duì)象
...
}
進(jìn)一步設(shè)想,客戶(hù)可能會(huì)為臨時(shí)文件創(chuàng)建一個(gè)單獨(dú)的Directory對(duì)象:
Directory tempDir( params ); // 存放臨時(shí)文件的文件夾
現(xiàn)在,初始化次序的重要性已然浮出水面:除非tfs在tempDir初始化之前得到初始化,否則tempDir的構(gòu)造函數(shù)將會(huì)嘗試在tfs被初始化之前使用它。但是tfs和tempDir是由不同的人、在不同的時(shí)間、在不同的源碼文件中創(chuàng)建的——這兩者都是非局部靜態(tài)對(duì)象,它們定義于不同的置換單元中。那么你如何保證tfs在tempDir之前得到初始化呢?
事實(shí)上這是不可能的。重申一遍,定義在不同置換單元內(nèi)的非靜態(tài)對(duì)象的初始化工作的順序是未定義的。當(dāng)然這是有理由的:為非局部靜態(tài)對(duì)象確定“恰當(dāng)?shù)?#8221;初始化順序是一件很有難度的工作。非常有難度。難到根本無(wú)法解決。在其大多數(shù)形式——由隱式模板實(shí)例化產(chǎn)生的多個(gè)置換單元和非局部靜態(tài)對(duì)象(也許它們是通過(guò)隱式模板實(shí)例化自行生成的)——這不僅使得確認(rèn)初始化的順序變得不可能,甚至尋找一種可行的初始化順序的特殊情況,都顯得毫無(wú)意義。
幸運(yùn)的是,一個(gè)小小的方法可以完美的解決這個(gè)難題。所要做的僅僅是把每個(gè)非局部靜態(tài)對(duì)象移入為它創(chuàng)建的專(zhuān)用函數(shù)中,函數(shù)要聲明為static的。這些函數(shù)返回一個(gè)它們所屬對(duì)象的引用。于是客戶(hù)就可以調(diào)用這些函數(shù),而不是直接使用那些對(duì)象。也就是說(shuō),非局部靜態(tài)對(duì)象被局部靜態(tài)對(duì)象取代了。(設(shè)計(jì)模式迷們很容易發(fā)現(xiàn),這是單例模式(Singleton Pattern)一個(gè)通用實(shí)現(xiàn)。)
這一方法基于C++的一個(gè)約定,那就是:對(duì)于局部靜態(tài)對(duì)象來(lái)說(shuō),在其被上述函數(shù)調(diào)用的時(shí)候,程序中第一次引入了該對(duì)象的定義,它在此時(shí)就一定會(huì)得到初始化。所以如果你不去直接訪問(wèn)非局部靜態(tài)對(duì)象,而改用“通過(guò)函數(shù)返回的引用來(lái)調(diào)用局部靜態(tài)對(duì)象”,那么你就保證了你得到的這一引用將指向一個(gè)已經(jīng)初始化的對(duì)象。作為獎(jiǎng)勵(lì),如果你從未調(diào)用過(guò)模仿非局部靜態(tài)對(duì)象的函數(shù),你的程序就永遠(yuǎn)不會(huì)引入對(duì)這類(lèi)對(duì)象進(jìn)行構(gòu)造和析構(gòu)的開(kāi)銷(xiāo),而這對(duì)于真正的非局部靜態(tài)對(duì)象來(lái)說(shuō)是不可能的。
下面是關(guān)于tfs和tempDir對(duì)這一技術(shù)的應(yīng)用:
class FileSystem { ... }; // 同上
FileSystem& tfs() // 這一函數(shù)代替了tfs對(duì)象;它在
// FileSystem類(lèi)中應(yīng)該是static的
{
static FileSystem fs; // 對(duì)局部靜態(tài)對(duì)象的定義和初始化
return fs; // 返回該對(duì)象的引用
}
class Directory { ... }; // 同上
Directory::Directory( params ) // 同上,但對(duì)tfs的引用現(xiàn)在為對(duì)tfs()
{
...
std::size_t disks = tfs().numDisks();
...
}
Directory& tempDir() // 這個(gè)函數(shù)取代了tempDir對(duì)象;它在
// Directory類(lèi)中應(yīng)該是static的
{
static Directory td; // 對(duì)局部靜態(tài)對(duì)象的定義和初始化
return td; // 返回該對(duì)象的引用
}
這一改進(jìn)系統(tǒng)不需要客戶(hù)做出任何改變,除了他們所引用的是tfs()和tempDir()而不是tfs和tempDir。也就是說(shuō),他們使用的是返回引用的函數(shù)而不是直接使用對(duì)象本身。
編寫(xiě)這一類(lèi)返回引用的函數(shù)所需要遵循的方針總是十分簡(jiǎn)單的:第1行定義和初始化一個(gè)局部靜態(tài)對(duì)象,第2行返回它的引用。如此的簡(jiǎn)單易用使得這類(lèi)函數(shù)非常適合作為內(nèi)聯(lián)函數(shù),尤其是對(duì)它們的調(diào)用非常頻繁時(shí)(參見(jiàn)條目30)。另外,這些函數(shù)中包含著靜態(tài)對(duì)象,這一事實(shí)使得他們?cè)诙嗑€程系統(tǒng)中也會(huì)遇到問(wèn)題。在此聲明,任何種類(lèi)的非const靜態(tài)對(duì)象,無(wú)論是局部的還是非局部的,它們面對(duì)多線程都會(huì)碰到這樣那樣的問(wèn)題。解決這一問(wèn)題的方法之一是:在程序還以單線程狀態(tài)運(yùn)行時(shí),手動(dòng)調(diào)用所有的這類(lèi)返回引用的函數(shù)。這可以排除與初始化相關(guān)的競(jìng)爭(zhēng)狀態(tài)的出現(xiàn)。
當(dāng)然,使用此類(lèi)返回引用的函數(shù)來(lái)防止初始化次序問(wèn)題的理念,首先基于此處存在一個(gè)合理的初始化次序。如果你的系統(tǒng)要求對(duì)象A必須在對(duì)象B之前得到初始化,但是A的初始化需要以B的初始化為前提,你將會(huì)面臨一個(gè)問(wèn)題,坦白說(shuō),你是咎由自取。然而,如果你能夠駕馭這一不正常的境況,這里介紹的解決方法仍然可以良好的為你服務(wù),至少對(duì)于單線程應(yīng)用程序來(lái)說(shuō)是這樣的。
為了避免在對(duì)象初始化之前使用它,你僅僅需要做三件事。第一,手動(dòng)初始化內(nèi)建類(lèi)型的非成員對(duì)象。第二,使用成員初始化表來(lái)初始化對(duì)象的每一部分。最后,初始化順序的不確定性使得定義于不同置換空間里非局部靜態(tài)對(duì)象難以正常運(yùn)行,你需要尋求一個(gè)新的設(shè)計(jì)方案。
時(shí)刻牢記
l 由于C++只在某些情況下對(duì)于內(nèi)建類(lèi)型對(duì)象進(jìn)行初始化,所以對(duì)它們要進(jìn)行手動(dòng)初始化。
l 對(duì)于構(gòu)造函數(shù),要盡量使用成員初始化表,避免在構(gòu)造函數(shù)內(nèi)部進(jìn)行復(fù)制。初始化表中的次序要與成員在類(lèi)中被聲明的次序相一致。
l 要避免跨置換單元的初始化次序問(wèn)題發(fā)生,可以使用局部靜態(tài)對(duì)象來(lái)代替非局部靜態(tài)對(duì)象的方案來(lái)解決。
posted on 2007-04-15 20:23 ★ROY★ 閱讀(1619) 評(píng)論(4) 編輯 收藏 引用 所屬分類(lèi): Effective C++