模塊編程屬于內核編程,因此,除了對內核相關知識有所了解外,還需要了解與模塊相關的知識。
1.應用程序與內核模塊的比較
為了加深對內核模塊的了解,表一給出應用程序與內核模塊程序的比較。
表一 應用程序與內核模塊程序的比較
|
C語言應用程序 |
內核模塊程序 |
使用函數 |
Libc庫 |
內核函數 |
運行空間 |
用戶空間 |
內核空間 |
運行權限 |
普通用戶 |
超級用戶 |
入口函數 |
main() |
module_init() |
出口函數 |
exit() |
module_exit() |
編譯 |
Gcc –c |
Makefile |
連接 |
Gcc |
insmod |
運行 |
直接運行 |
insmod |
調試 |
Gdb |
kdbug, kdb,kgdb等 |
從表一我們可以看出,內核模塊程序不能調用libc庫中的函數,它運行在內核空間,且只有超級用戶可以對其運行。另外,模塊程序必須通過module_init()和module-exit()函數來告訴內核“我來了”和“我走了”。
2.內核符號表(如果對以下第2~4點理解上有困難,可以越過)
如 前所述,Linux內核是一個整體結構,像一個圓球,而模塊是插入到內核中的插件。盡管內核不是一個可安裝模塊,但為了方便起見,Linux把內核也看作 一個“母”模塊。那么模塊與模塊之間如何進行交互呢,一種常用的方法就是共享變量和函數。但并不是模塊中的每個變量和函數都能被共享,內核只把各個模塊中 主要的變量和函數放在一個特定的區段,這些變量和函數就統稱為符號。到低哪些符號可以被共享? Linux內核有自己的規定。對于內核這個特殊的母模塊,在kernel/ksyms.c中定義了從中可以“移出”的符號,例如進程管理子系統可以“移出”的符號定義如下:
/* 進程管理 */
EXPORT_SYMBOL(do_mmap_pgoff);
EXPORT_SYMBOL(do_munmap);
EXPORT_SYMBOL(do_brk);
EXPORT_SYMBOL(exit_mm);
…
EXPORT_SYMBOL(schedule);
EXPORT_SYMBOL(jiffies);
EXPORT_SYMBOL(xtime);
…
你可能對這些變量和函數已經很熟悉。其中宏定義EXPORT_SYMBOL()本身的含義是“移出符號”。為什么說是“移出”呢?因為這些符號本來是內核內部的符號,通過這個宏放在一個公開的地方,使得裝入到內核中的其他模塊可以引用它們。
實際上,僅僅知道這些符號的名字是不夠的,還得知道它們在內核地址空間中的地址才有意義。因此,內核中定義了如下結構來描述模塊的符號:
struct module_symbol
{
unsigned long value; /*符號在內核地址空間中的地址*/
const char *name; /*符號名*/
};
我們可以從/proc/ksyms文件中讀取所有內核模塊“移出”的符號,這所有符號就形成內核符號表,其格式如下:
內存地址 符號名 [所屬模塊]
在模塊編程中,可以根據符號名從這個文件中檢索出其對應的地址,然后直接訪問該地址從而獲得內核數據。第三列“所屬模塊”指符號所在的模塊名,對于從內核這一母模塊移出的符號,這一列為空。
模塊加載后,2.4內核下可通過 /proc/ksyms、 2.6 內核下可通過/proc/kallsyms查看模塊輸出的內核符號
3.模塊依賴
如前所述,內核符號表記錄了所有模塊可以訪問的符號及相應的地址。當一個新的模塊被裝入內核后,它所申明的某些符號就會被登記到這個表中,而這些符號可能被其他模塊所引用,這就引出了模塊依賴這個問題。
一個模塊A引用另一個模塊B所移出的符號,我們就說模塊B被模塊A引用,或者說模塊A依賴模塊B。如果要鏈接模塊A,必須先鏈接模塊B。這種模塊間相互依賴的關系就叫模塊依賴。
4.模塊引用計數器
為 了確保模塊安全地卸載,每個模塊都有一個引用計數器。當執行模塊所涉及的操作時就遞增計數器,在操作結束時就遞減這個計數器;另外,當模塊B被模塊A引用 時,模塊B的引用計數就遞增,引用結束,計數器遞減。什么時候可以卸載這個模塊?當然只有這個計數器值為0的時候,例如,當一個文件系統還被安裝在系統上 時就不能將其卸載,當這個文件系統不再被使用時,引用計數器就為0,于是可以卸載。
四.模塊編譯
Linux 中最重要的軟件開發工具是 GCC。GCC 是 GNU 的 C 和 C++ 編譯器。但是,在大型的開發項目中,通常有幾十到上百個的源文件,如果每次均手工鍵入 gcc 命令進行編譯的話,則會非常不方便。因此,人們通常利用 make 工具來自動完成編譯工作。利用這種自動編譯可大大簡化開發工作,避免不必要的重新編譯。這些工作包括:如果僅修改了某幾個源文件,則只重新編譯這幾個源文件;如果某個頭文件被修改了,則重新編譯所有包含該頭文件的源文件。
1.編譯工具make
實際上,make 工具通過一個稱為 Makefile 的文件來完成并自動維護編譯工作。Makefile 需要按照某種語法進行編寫,其中說明了如何編譯各個源文件并連接生成可執行文件,并定義了源文件之間的依賴關系。下面給出2.6 內核模塊的Makefile模板(請參看Makefile的寫法)
# Makefile2.6 obj-m += hellomod.o # 產生hellomod 模塊的目標文件 CURRENT_PATH := $(shell pwd) #模塊所在的當前路徑 LINUX_KERNEL := $(shell uname -r) #Linux內核源代碼的當前版本 LINUX_KERNEL_PATH := /usr/src/linux-headers-$(LINUX_KERNEL) #Linux內核源代碼的絕對路徑 all: make -C $(LINUX_KERNEL_PATH) M=$(CURRENT_PATH) modules #編譯模塊了 clean: make -C $(LINUX_KERNEL_PATH) M=$(CURRENT_PATH) clean #清理 |
注意: 在每個命令前(例如make命令前)要鍵入一個制表符(按TAB鍵產生)
有了Makefile,執行make命令,會自動形成相關的后綴為.o和.ko文件。
到此,模塊編譯好了,該把它插入到內核了:
如:$insmod hellomod.ko
當然,要以系統員的身份才能把模塊插入。
成功插入后,可以通過dmesg命令查看,屏幕最后幾行的輸出就是你程序中輸出的內容:Hello,World! from the kernel space…
當模塊不再需要時,可以通過rmmod命令移去,例如
$rmmod hellomod