4. 常用內存數據庫
4.1 SQLite
SQLite是一個小型的C程序庫,實現了獨立的,可嵌入的,零配置的SQL數據庫引擎。特性包括:
- 事務操作是原子,一致,孤立,并且持久的(ACID),即使在系統崩潰和電源故障之后。
- 零配置——不需要安裝和管理。
- 實現了絕大多數SQL92標準。
- 整個數據庫存儲在一個單一的文件中。
- 數據庫文件可以在不同字節序的機器之間自由地共享。
- 支持最大可達2T的數據庫。 (241
字節)
SQLite發行版包含一個獨立的命令行訪問程序(sqlite),可用于管理SQLite數據庫,并適合作為一個如何使用SQLite庫的例子。
License: SQLite使用Public domain授權(注),對于個人使用和商業使用都是免費的。
技術上的優點和特性
SQLite是一個輕量級、跨平臺的關系型數據庫。
◇輕量級
先說它的第一個特色:輕量級。想必SQLite的作者很看重這個特性,連它的Logo都是用的“羽毛”,來顯擺它的輕飄飄。SQLite和C/S模式的數據庫軟件不同,它是進程內的數據庫引擎,因此不存在數據庫的客戶端和服務器。使用SQLite一般只需要帶上它的一個動態庫,就可以享受它的全部功能。而且那個動態庫的尺寸也挺小,以版本3.6.11為例,Windows下487KB、Linux下347KB。
◇ 綠色軟件
SQLite的另外一個特點是綠色:它的核心引擎本身不依賴第三方的軟件,使用它也不需要“安裝”。所以在部署的時候能夠省去不少麻煩。
◇單一文件
所謂的“單一文件”,就是數據庫中所有的信息(比如表、視圖、觸發器、等)都包含在一個文件內。這個文件可以copy到其它目錄或其它機器上,也照用不誤。
★技術上的缺點和不足
◇并發訪問的鎖機制
SQLite在并發(包括多進程和多線程)讀寫方面的性能一直不太理想。數據庫可能會被寫操作獨占,從而導致其它讀寫操作阻塞或出錯。
SQL標準支持不全
在它的官方網站上,具體列舉了不支持哪些SQL92標準。我個人感覺比較不爽的是不支持外鍵約束。
◇網絡文件系統(以下簡稱NFS)
有時候需要訪問其它機器上的SQLite數據庫文件,就會把數據庫文件放置到網絡共享目錄上。這時候你就要小心了。當SQLite文件放置于NFS時,在并發讀寫的情況下可能會出問題(比如數據損壞)。原因據說是由于某些NFS的文件鎖實現上有Bug。
★編程語言接口
SQLite支持很多種語言的編程接口。這對于我這種喜歡混用多種編程語言的人來說,是很爽的。下面我大概介紹一下。
◇C/C++
由于SQLite本身是C寫的,它自帶的API也是C接口的。所以C/C++用起來最直接了。假如你不喜歡面向過程的C API風格,可以另外找個C++的包裝庫。想重新發明輪子的同學,也可以自己包裝一個。
◇Java
如果要用Java訪問SQLite,可以通過SQLite的JDBC驅動,或者通過專門的SQLite包裝庫。我個人建議走JDBC方式,萬一將來要換數據庫,代碼就不用大改。
◇Python
pysqlite是Python操作SQLite的首選。從Python 2.5開始,它已經被整合到Python的標準庫中。看來Python社區還是蠻喜歡SQLite嘛。
◇.Net
對于喜歡.Net的同學,可以通過SQLite的ADO.NET驅動來訪問。
◇Ruby
Ruby可以通過SQLite-Ruby操作SQLite數據庫,不過我沒用過。
◇Perl
在CPAN上有DBD::SQLite,不過我也沒用過。
★一些非技術的參考因素
需要根據“如何選擇開源項目”里面提到的幾個參考因素,再評估一下。
◇授權協議(License)
SQLite使用的是Public Domain協議,這是最爽一種,可以放心大膽地用。
◇用戶的普及程度
最近這幾年,使用SQLite的人越來越多。包括一些大公司也開始把它整合到產品中(比如Google的Gears、Apple的Safari、Adobe的AIR)。
◇開發的活躍程度
如果到SQLite的Change Log上大致了解一下,可以看出最近5年基本上每1-2個月都會有更新。說明開發的活躍度還是非常高的。
SQLite不同于其他大部分的SQL數據庫引擎,因為它的首要設計目標就是簡單化:
- 易于管理
- 易于使用
- 易于嵌入其他大型程序
- 易于維護和配置
許多人喜歡SQLite因為它的小巧和快速. 但是這些特性只是它的部分優點, 使用者還會發現SQLite是非常穩定的. 出色的穩定性源于它的簡單, 越簡單就越不容易出錯. 除了上述的簡單、小巧和穩定性外, 最重要的在于SQLite力爭做到簡單化.
簡單化在一個數據庫引擎中可以說是一個優點, 但也可能是個缺點, 主要決定于你想要做什么. 為了達到簡單化, SQLite省略了一些人們認為比較有用的特性, 例如高并發性、 嚴格的存取控制、豐富的內置功能、 存儲過程、復雜的SQL語言特性、 XML以及Java的擴展, 超大的萬億級別的數據測量等等. 如果你需要使用上述的這些特性并且不介意它們的復雜性, 那么SQLite也許就不適合你了. SQLite沒有打算作為一個企業級的數據庫引擎, 也并不打算和Oracle或者PostgreSQL競爭.
僅憑經驗來說SQLite適用于以下場合: 當你更看中簡單的管理、使用和維護數據庫, 而不是那些企業級數據庫提供的不計其數的復雜功能的時候,使用SQLite是一個比較明智的選擇. 事實也證明, 人們在許多情況下已經清楚的認識到簡單就是最好的選擇.
4.1.1 SQLite最佳試用場合
· 網站
作為數據庫引擎SQLite適用于中小規模流量的網站(也就是說, 99.9%的網站). SQLite可以處理多少網站流量在于網站的數據庫有多大的壓力. 通常來說, 如果一個網站的點擊率少于100000次/天的話, SQLite是可以正常運行的. 100000次/天是一個保守的估計, 不是一個準確的上限. 事實證明, 即使是10倍的上述流量的情況下SQLite依然可以正常運行.
· 嵌入式設備和應用軟件
因為SQLite數據庫幾乎不需要管理, 因此對于那些無人值守運行或無人工技術支持的設備或服務, SQLite是一個很好的選擇. SQLite能很好的適用于手機, PDA, 機頂盒, 以及其他儀器. 作為一個嵌入式數據庫它也能夠很好的應用于客戶端程序.
· 應用程序文件格式
SQLite作為桌面應用程序的本地磁盤文件格式取得了巨大成功.例如金融分析工具、CAD 包、檔案管理程序等等. 一般的數據庫打開操作需要調用sqlite3_open()函數,并且標記一個顯式本地事務的起始點(BEGIN TRANSACTION)來保證以獨占的方式得到文件的內容. 文件保存將執行一個提交(COMMIT)同時標記另一個顯式本地事務起始點. 這種事務處理的作用就是保證對于應用程序數據文件的更新是原子的、持久的、獨立的和一致的.
數據庫里可以加入一些臨時的觸發器,用來把所有的改變記錄在一張臨時的取消/重做日志表中. 當用戶按下取消/重做按鈕的時候這些改變將可以被回滾. 應用這項技術實現一個無限級的取消/重做功能只需要編寫很少的代碼.
· 替代某些特別的文件格式
許多程序使用fopen(), fread(), 或 fwrite()函數創建和管理一些自定義的文件用來保存數據. 使用SQLite替代這些自定義的文件格式將是一種很好的選擇.
· 內部的或臨時的數據庫
對于那些有大量的數據需要用不同的方式篩選分類的程序, 相對于編寫同樣功能的代碼, 如果你把數據讀入一個內存中的SQLite數據庫, 然后使用連接查詢和ORDER BY子句按一定的順序和排列提取需要的數據, 通常會更簡單和快速. 按照上述的方法使用內嵌的SQLite數據庫將會使程序更富有靈活性, 因為添加新的列或索引不用重寫任何查詢語句.
· 命令行數據集分析工具
有經驗的SQL用戶可以使用SQLite命令行程序去分析各種混雜的數據集. 原是數據可以從CSV(逗號分隔值文件)文件中導入, 然后被切分產生無數的綜合數據報告. 可能得用法包括網站日志分析, 運動統計分析, 編輯規劃標準, 分析試驗結果.
當然你也可以用企業級的客戶端/服務器數據庫來做同樣的事情. 在這種情況下使用SQLite的好處是: SQLite的部署更為簡單并且結果數據庫是一個單獨的文件, 你可以把它存儲在軟盤或者優盤或者直接通過email發給同事.
· 在Demo或測試版的時候作為企業級數據庫的替代品
如果你正在編寫一個使用企業級數據庫引擎的客戶端程序, 使用一個允許你連接不同SQL數據庫引擎的通用型數據庫后臺將是很有意義的. 其更大的意義在于將SQLite數據庫引擎靜態的連接到客戶端程序當中,從而內嵌SQLite作為混合的數據庫支持. 這樣客戶端程序就可以使用SQLite數據庫文件做獨立的測試或者驗證.
· 數據庫教學
因為SQLite的安裝和使用非常的簡單(安裝過程幾乎忽略不計, 只需要拷貝SQLite源代碼或sqlite.exe可執行文件到目標主機, 然后直接運行就可以) 所以它非常適合用來講解SQL語句. 同學們可以非常簡單的創建他們喜歡的數據庫, 然后通過電子郵件發給老師批注或打分. 對于那些感興趣怎樣實現一個關系型數據庫管理系統(RDBMS)的高層次的學生, 按照模塊化設計且擁有很好的注釋和文檔的SQLite源代碼, 將為他們打下良好的基礎. 這并不是說SQLite就是如何實現其他數據庫引擎的精確模型, 但是很適合學生們了解SQLite是如何快速工作的, 從而掌握其他數據庫系統的設計實現原則.
· 試驗SQL語言的擴展
SQLite簡單且模塊化的設計使得它可以成為一個用來測試數據庫語言特性或新想法的優秀的原型平臺.