簡(jiǎn)介
Block Diagram Of SQLite |

|
這篇文檔主要描述了SQLite類庫(kù)的結(jié)構(gòu)。這篇文檔的內(nèi)容對(duì)于那些想了解和修改SQLite內(nèi)部結(jié)構(gòu)的人將會(huì)非常有用。
右側(cè)是一個(gè)結(jié)構(gòu)圖,它顯示了SQLite的主要成分及各成分之間是如何相互關(guān)聯(lián)的。接下來(lái)的文本將簡(jiǎn)要的介紹每個(gè)單一的成分。
這篇文檔描述SQLite第三版,它和 2.8版以及早期的版本基本相似,但在一些細(xì)節(jié)上是有區(qū)別的。
接口程序
SQLite類庫(kù)大部分的公共接口程序是由main.c, legacy.c, 和 vdbeapi.c源文件中的功能執(zhí)行的。但有些程序是分散在其他文件夾的,因?yàn)樵谄渌募A里他們可以訪問(wèn)有文件作用域的數(shù)據(jù)結(jié)構(gòu)。 sqlite3_get_table() 這個(gè)程序是在table.c中執(zhí)行的。 sqlite3_mprintf()在printf.c中執(zhí)行。 sqlite3_complete()在tokenize.c中執(zhí)行。 Tcl 接口程序用tclsqlite.c來(lái)執(zhí)行。
為了避免和其它軟件在名字上有沖突,SQLite類庫(kù)中所有的外部符號(hào)都是以sqlite3為前綴來(lái)命名的。這些被用來(lái)做外部使用的符號(hào)(換句話說(shuō),這些符號(hào)用來(lái)形成SQLite的API)是以sqlite3_.
來(lái)命名的。
Tokenizer
當(dāng)執(zhí)行一個(gè)包含SQL語(yǔ)句的字符串時(shí),接口程序要把這個(gè)字符串傳遞給tokenizer。Tokenizer的任務(wù)是把原有字符串分成一個(gè)個(gè)標(biāo)示符,并把這些標(biāo)示符傳遞給剖析器。Tokenizer是在C文件夾tokenize.c中用手編譯的。
在這個(gè)設(shè)計(jì)中需要注意的一點(diǎn)是,tokenizer調(diào)用parser。熟悉YACC和BISON的人們也許會(huì)習(xí)慣于用parser調(diào)用tokenizer。 The author of SQLite的作者已經(jīng)嘗試了這兩種方法,并發(fā)現(xiàn)用tokenizer調(diào)用parser會(huì)使程序運(yùn)行的更順利。YACC使程序更滯后一些。
Parser
The parser是一個(gè)部分,它基于文件場(chǎng)景賦予tokens意思。SQLite的parser是由 Lemon LALR(1) parser generator產(chǎn)生的。Lemon和YACC/BISON一樣做同樣的工作,但是它使用不同的輸入語(yǔ)句,這個(gè)輸入語(yǔ)句是不易出錯(cuò)的。 Lemon也產(chǎn)生一個(gè)parser,這個(gè)parser是可重入的并且是線程安全的。 Lemon 定義了無(wú)終端解除程序的概念,所以當(dāng)遇到語(yǔ)法錯(cuò)誤的時(shí)候,它不會(huì)泄露內(nèi)存。驅(qū)動(dòng)Lemon的原文件在parse.y.
因?yàn)?span lang="EN-US">lemon是一個(gè)在發(fā)展機(jī)械上不常見(jiàn)的程序,所以lemon的源代碼(只是一個(gè)C文件)是在SQLite分布區(qū)的"tool"子目錄下的。 lemon的文檔是在分布區(qū)的 "doc"子目錄下的。
代碼發(fā)生器
在剖析器收集完符號(hào)并把之轉(zhuǎn)換成完全的SQL語(yǔ)句時(shí),它調(diào)用代碼產(chǎn)生器來(lái)產(chǎn)生虛擬的機(jī)器代碼,這些機(jī)器代碼將按照SQL語(yǔ)句的要求來(lái)工作。在代碼產(chǎn)生器中有許多文件; attach.c, auth.c, build.c, delete.c, expr.c, insert.c, pragma.c, select.c, trigger.c, update.c, vacuum.c and where.c. 正是在這些文件中,最具有重要意義的事情發(fā)生了。 expr.c 處理表達(dá)式代碼的生成。 where.c 處理SELECT, UPDATE and DELETE語(yǔ)句中WHERE子句的代碼的生成。文件 attach.c, delete.c, insert.c, select.c, trigger.c update.c,和vacuum.c處理SQL語(yǔ)句中具有同樣名字的語(yǔ)句的代碼的生成。(每個(gè)文件調(diào)用expr.c and where.c中的程序) All other 所有SQL的其它語(yǔ)句的代碼是由build.c生成的。文件auth.c 執(zhí)行sqlite3_set_authorizer()的功能.
虛擬機(jī)器
由代碼生成器產(chǎn)生的程序由虛擬機(jī)器來(lái)運(yùn)行。總而言之,虛擬機(jī)器主要用來(lái)執(zhí)行一個(gè)為操作數(shù)據(jù)庫(kù)而設(shè)計(jì)的抽象的計(jì)算引擎。機(jī)器有一個(gè)用來(lái)存儲(chǔ)中間數(shù)據(jù)的存儲(chǔ)棧。每個(gè)指令包含一個(gè)操作代碼和三個(gè)額外的操作數(shù)。
虛擬機(jī)器本身是被包含在一個(gè)單獨(dú)的文件vdbe.c中的。虛擬機(jī)器也有它自己的標(biāo)題文件:vdbe.h它在虛擬機(jī)器和剩下的SQLite類庫(kù)之間定義了一個(gè)接口程序,vdbeInt.h 它定義了虛擬機(jī)器的結(jié)構(gòu)。文件vdbeaux.c包含了虛擬機(jī)器所使用的實(shí)用程序和一些被其它類庫(kù)用來(lái)建立VM程序的接口程序模塊。文件vdbeapi.c 包含虛擬機(jī)器的外部接口,比如 sqlite3_bind_... 類的函數(shù)。單獨(dú)的值(字符串,整數(shù),浮動(dòng)點(diǎn)數(shù)值,BLOBS)被存儲(chǔ)在一個(gè)叫 "Mem"的內(nèi)部目標(biāo)程序里,"Mem"是由vdbemem.c執(zhí)行的。
SQLite使用C語(yǔ)言程序來(lái)來(lái)執(zhí)行SQL函數(shù)。即使內(nèi)置的SQL函數(shù)也是用這種方法來(lái)執(zhí)行的。大部分的SQL內(nèi)置函數(shù)(ex: coalesce(), count(),substr(), and so forth)可以在func.c里發(fā)現(xiàn)。日期和時(shí)間轉(zhuǎn)換函數(shù)在date.c.
B-樹(shù)
SQLite數(shù)據(jù)庫(kù)在磁盤(pán)里維護(hù),使用源文件btree.c中的B-樹(shù)執(zhí)行。數(shù)據(jù)庫(kù)中的每個(gè)表格和目錄使用一個(gè)單獨(dú)的B-tree。所有的 B-trees 被存儲(chǔ)在同樣的磁盤(pán)文件里。文件格式的細(xì)節(jié)被記錄在btree.c.
開(kāi)頭的備注里。
B-tree子系統(tǒng)的接口程序被標(biāo)題文件btree.h所定義。.
頁(yè)面高速緩存
B-tree模塊要求信息來(lái)源于磁盤(pán)上固定規(guī)模的程序塊。默認(rèn)程序塊的大小是1024個(gè)字節(jié),但是可以在512和65536個(gè)字節(jié)間變化。 頁(yè)面高速緩存負(fù)責(zé)讀,寫(xiě)和高速緩存這些程序塊。頁(yè)面高速緩存還提供重新運(yùn)算和提交抽象命令,它還管理關(guān)閉數(shù)據(jù)庫(kù)文件夾。 B-tree驅(qū)動(dòng)器要求頁(yè)面高速緩存器中的特別的頁(yè),當(dāng)它想修改頁(yè)或重新運(yùn)行改變的時(shí)候,它會(huì)通報(bào)頁(yè)面高速緩存。為了保證所有的需求被快速,安全和有效的處理,頁(yè)面高速緩存處理所有的微小的細(xì)節(jié)。
運(yùn)行頁(yè)面高速緩存的代碼在專門(mén)的C源文件pager.c中。頁(yè)面高速緩存的子系統(tǒng)的接口程序被目標(biāo)文件pager.h所定義。
OS 接口程序
為了在POSIX和Win32 之間提供一些可移植性,SQLite操作系統(tǒng)的接口程序使用一個(gè)提取層。 OS提取層的接口程序被定義在os.h. 每個(gè)支持的操作系統(tǒng)有它自己的執(zhí)行文件: Unix使用os_unix.c,windows使用os_win.c。每個(gè)具體的操作器具有它自己的標(biāo)題文件: os_unix.h, os_win.h, etc.
Utilities
內(nèi)存分配和字符串比較程序位于util.c。剖析器使用的表格符號(hào)被hash.c中的無(wú)用信息表格維護(hù)。源文件utf.c包含UNICODE轉(zhuǎn)換子程序。SQLite有它自己的執(zhí)行文件printf() (有一些擴(kuò)展)在printf.c中,還有它自己隨機(jī)數(shù)量產(chǎn)生器在random.c.
測(cè)試代碼
如果你計(jì)算回歸測(cè)試腳本,多于一半的SQLite代碼數(shù)據(jù)庫(kù)的代碼將被測(cè)試。 在主要代碼文件中有許多assert()語(yǔ)句。另外,源文件test1.c通過(guò)test5.c和md5.c 執(zhí)行只為測(cè)試用的擴(kuò)展名。os_test.c向后的接口程序用來(lái)模擬斷電,來(lái)驗(yàn)證頁(yè)面調(diào)度程序中的系統(tǒng)性事故恢復(fù)機(jī)制。