持久對(duì)象(persistent objects)廣泛應(yīng)用于游戲、分布式數(shù)據(jù)庫系統(tǒng)、多媒體以及圖形應(yīng)用程序中。目前C++并不直接支持持久性(persistence)(但有一些在C++未來版本中添加持久性和反射(reflection)的建議)。持久對(duì)象可以在創(chuàng)建它的程序的作用域之外保持自身狀態(tài)。把對(duì)象寫入一個(gè)文件并在以后重建之,或者把對(duì)象傳送到一臺(tái)遠(yuǎn)程機(jī)器,就是這樣的例子。對(duì)持久性的支持并不象第一眼看上去那樣簡(jiǎn)單,同一對(duì)象的大小和內(nèi)存布局在不同的平臺(tái)上可能并不相同,而不同的字節(jié)次序(byte ordering),或稱為endian-ness,使事情更加復(fù)雜化。在下文中我將討論如何實(shí)現(xiàn)持久性,而無須求助于DCOM和 Corba之類的第三方框架。對(duì)于小型和可移植的應(yīng)用程序而言,這是一種有效并令人滿意的方案。
?
序列化(serialization
)基礎(chǔ)
為了使一個(gè)對(duì)象持久存在,必須把它的狀態(tài)保存在非易失的存儲(chǔ)設(shè)備中。考慮一個(gè)錄制和播放mp3文件的應(yīng)用程序,每首單曲都表示為一個(gè)包含標(biāo)題、唱片、歌手、時(shí)間、速率、錄制日期以及相應(yīng)的 MP3文件的對(duì)象,該應(yīng)用程序在跟蹤列表中顯示最近播放的曲目。你的目標(biāo)是通過序列化,也就是把對(duì)象寫入一個(gè)文件,使MP3對(duì)象成為持久對(duì)象,同時(shí)通過反序列化(deserialization)在下一個(gè) session中重建這些對(duì)象。
?
序列化內(nèi)置數(shù)據(jù)類型
每個(gè)對(duì)象最終都由內(nèi)置數(shù)據(jù)成員組成,如int, bool, char[]等等。你的第一個(gè)任務(wù)是把這樣的類型寫入一個(gè)輸出文件流(ofstream)中。應(yīng)用程序必須這些值存儲(chǔ)為相應(yīng)的二進(jìn)制形式,基于這個(gè)目的,應(yīng)使用write() 和read() 成員函數(shù)。write() 以某個(gè)變量的地址和大小為參數(shù),把該變量的位模式寫入一個(gè)文件流中。read() 的兩個(gè)參數(shù)為char*和long類型,分別指示內(nèi)存緩沖區(qū)的地址和字節(jié)大小。下面的例子演示如何在ofstream中保存兩個(gè)整數(shù):
?
#include <fstream>
using namespace std;
int main()
{
?int x,y; // mouse coordinates
?// ..assign values to x and y
?ofstream archive("coord.dat", ios::binary);
?archive.write(reinterpret_cast<char *>(&x), sizeof (x));
?archive.write(reinterpret_cast<char *>(&x), sizeof (x));
?archive.close();
}
?
使用reinterpret_cast<>是必要的,因?yàn)閣rite()的第一個(gè)參數(shù)類型為const char*,但&x和&y是int*類型。
?
以下代碼讀取剛才存儲(chǔ)的值:
?
#include <fstream>
using namespace std;
int main()
{
?int x,y;
?ifstream archive("coord.dat");
?archive.read((reinterpret_cast<char *>(&x), sizeof(x));
?archive.read((reinterpret_cast<char *>(&y), sizeof(y));
}
?
序列化對(duì)象
要序列化一個(gè)完整的對(duì)象,應(yīng)把每個(gè)數(shù)據(jù)成員寫入文件中:
?
class MP3_clip
{
private:
?std::time_t date;
?std::string name;
?int bitrate;
?bool stereo;
public:
?void serialize();
?void deserialize();
?//..
};
?
void MP3_clip::serialize()
{
{
?int size=name.size();// store name's length
?//empty file if it already exists before writing new data
?ofstream arc("mp3.dat", ios::binary|ios::trunc);
?arc.write(reinterpret_cast<char *>(&date),sizeof(date));
?arc.write(reinterpret_cast<char *>(&size),sizeof(size));
?arc.write(name.c_str(), size+1); // write final '\0' too
?arc.write(reinterpret_cast<char *>(&bitrate),
?sizeof(bitrate));
?arc.write(reinterpret_cast<char *>(&stereo),
?sizeof(stereo));
}
?
實(shí)現(xiàn)deserialize() 需要一些技巧,因?yàn)槟阈枰獮樽址峙湟粋€(gè)臨時(shí)緩沖區(qū)。做法如下:
?
void MP3_clip::deserialize()
{
?ifstream arce("mp3.dat");
?int len=0;
?char *p=0;
?arc.read(reinterpret_cast<char *>(&date), sizeof(date));
?arc.read(reinterpret_cast<char *>(&len), sizeof(len));
?p=new char [len+1]; // allocate temp buffer for name
?arc.read(p, len+1); // copy name to temp, including '\0'
?name=p; // copy temp to data member
?delete[] p;
?arc.read(reinterpret_cast<char *>(&bitrate),
?sizeof(bitrate));
?arc.read(reinterpret_cast<char *>(&stereo),
?sizeof(stereo));
}
?
性能
優(yōu)化
你可能會(huì)感到迷惑,為什么不把整個(gè)對(duì)象一次性轉(zhuǎn)儲(chǔ)到文件中,而必須對(duì)每個(gè)數(shù)據(jù)成員進(jìn)行序列化呢?換句話說,難道不能用下面的方式實(shí)現(xiàn)serialize() 嗎?
?
void MP3_clip::serialize()
{
?ofstream arc("mp3.dat", ios::binary|ios::trunc);
?arc.write(reinterpret_cast<char *>(this),sizeof(*this));
}
?
不行,不能這樣做。這種方式至少存在兩個(gè)問題。通常,當(dāng)被序列化的對(duì)象還包含其它一些對(duì)象時(shí),你不能簡(jiǎn)單地把該對(duì)象轉(zhuǎn)儲(chǔ)到一個(gè)文件中并指望以后從中重建一個(gè)有效的對(duì)象。在我們的例子中,外層對(duì)象包含一個(gè)std::string成員,一個(gè)淺拷貝(tips/tipview.
?
另一個(gè)問題設(shè)計(jì)到多態(tài)對(duì)象。每個(gè)多態(tài)對(duì)象都含有一個(gè)vtpr,即一個(gè)指向虛擬函數(shù)地址分配表的隱藏指針。vtpr的值是時(shí)變的,如果你把整個(gè)多態(tài)對(duì)象轉(zhuǎn)儲(chǔ)到一個(gè)文件中,然后強(qiáng)行把歸檔后的數(shù)據(jù)添加到一個(gè)新的對(duì)象上,則其vptr可能無效并導(dǎo)致未定義的行為。再次提醒,解決方案是只對(duì)非時(shí)變的數(shù)據(jù)成員進(jìn)行序列化和反序列化。另一種方法是計(jì)算vptr的確切偏移量,在從文件重建對(duì)象時(shí)不要?jiǎng)铀?。記住,vptr的位置是與實(shí)現(xiàn)相關(guān)的,因此這樣的代碼是不可移植的。
?
小結(jié)
雖然C++不直接支持對(duì)象持久性,但手工實(shí)現(xiàn)它并不難,只要你遵從一些基本的準(zhǔn)則:首先把每個(gè)復(fù)合對(duì)象分解為原始數(shù)據(jù)類型,然后對(duì)這些原始數(shù)據(jù)類型進(jìn)行序列化。當(dāng)序列化數(shù)據(jù)時(shí),記住要跳過時(shí)變的值。在反序列化過程中,讀取剛才存儲(chǔ)的值。處理string對(duì)象、數(shù)組和句柄需要一些技巧:總是要對(duì)它們解引用,存儲(chǔ)它們所指向的值。記住在一個(gè)單獨(dú)的字段中存儲(chǔ)string或數(shù)組的大小。
?