序列化文件可能要注意的幾點:(不足給予補充)
1.不同cpu體系結構的硬件所支持的字節序不同,所以序列化的目標數據要以一種字節序為主,一般分為小端,大端,本地端(根據程序運行的機器來的)。
2.在序列化的時候就要考慮反序列化的一些便利,可以對原始數據類型做分類,所有組合原始數據的高級數據一般通過索引原始數據來獲取(這樣也降低了數據冗余),這樣你就可以保證數據的chunk化。
3.盡可能地讓文件格式不同于其他,為了此文件格式的擴展可以做一些版本指定。
4.如果你考慮到serialize的靈活性,就一定要抽象device以及stream這2個概念,device控制著使用什么stream去讀寫,而stream直接操縱buffer,所以在stream你可以控制讀寫數據的安全性(多線程)與效率。
5.現在不只考慮serialize單個文件,而考慮序列化一個文件層次結構到硬盤,一般會抽象出個archive來,這個archive存儲在硬盤上,所以首先這些數據的序列化必須滿足os的文件系統格式(這個不用擔心了,直接操作FILE,fstream就ok了),而后為了數據包裝(一是為了安全,二是為了大小,三是為了不凌亂),我們一般要對archive進行拓展,拓展archive的行為,比如在內存寫到硬件這個基本函數的進行壓縮并加密,而在硬盤恢復到內存這個基本函數上進行解壓縮并解密,這里存在個問題,archive不是一次性讀取到內存,所以最好給每個archive做個頭數據,至少保證這個頭數據一定要讀到內存,頭數據的意義就是選擇性地讀取archive的數據段,羅列archive的層次結構等(至于大小寫敏感的問題,盡量做一些協調)。