Bootloader
我們知道計算機啟動是從BIOS開始,再由BIOS決定從哪個設備啟動以及啟動順序,比如先從DVD啟動再從硬盤啟動等。計算機啟動后,BIOS根據配置找到啟動設備,并讀取這個設備的第0個扇區,把這個扇區的內容加載到0x7c00,之后讓CPU從0x7c00開始執行,這時BIOS已經交出了計算機的控制權,由被加載的扇區程序接管計算機。
這第一個扇區的程序就叫Boot,它一般做一些準備工作,把操作系統內核加載進內存,并把控制權交給內核。由于Boot只能有一個扇區大小,即512字節,它所能做的工作很有限,因此它有可能不直接加載內核,而是加載一個叫Loader的程序,再由Loader加載內核。因為Loader不是BIOS直接加載的,所以它可以突破512字節的程序大小限制(在實模式下理論上可以達到1M)。如果Boot沒有加載Loader而直接加載內核,我們可以把它叫做Bootloader。
Bootloader加載內核就要讀取文件,在實模式下可以用BIOS的INT 13h中斷。內核文件放在哪里,怎么查找讀取,這里牽涉到文件系統,Bootloader要從硬盤(軟盤)的文件系統中查找內核文件,因此Bootloader需要解析文件系統的能力。GRUB是一個專業的Bootloader,它對這些提供了很好的支持。
對于一個Toy操作系統來說,可以簡單處理,把內核文件放到Bootloader之后,即從軟盤的第1個扇區開始,這樣我們可以不需要支持文件系統,直接讀取扇區數據加載到內存即可。
實模式到保護模式
我們知道Intel x86系列CPU有實模式和保護模式,實模式從8086開始就有,保護模式從80386開始引入。為了兼容,Intel x86系列CPU都支持實模式。現代操作系統都是運行在保護模式下(Intel x86系列CPU)。計算機啟動時,默認的工作模式是實模式,為了讓內核能運行在保護模式下,Bootloader需要從實模式切換到保護模式,切換步驟如下:
- 準備好GDT(Global Descriptor Table)
- 關中斷
- 加載GDT到GDTR寄存器
- 開啟A20,讓CPU尋址大于1M
- 開啟CPU的保護模式,即把cr0寄存器第一個bit置1
- 跳轉到保護模式代碼
GDT是Intel CPU保護模式運行的核心數據結構,所有保護模式操作的數據都從GDT表開始查找,
這里有GDT的詳細介紹。
GDT中的每一個表項由8字節表示,如下圖:
其中Access Byte和Flags如下圖:
GDTR是一個6字節的寄存器,有4字節表示GDT表的基地址,2字節表示GDT表的大小,即最大65536(實際值是65535,16位最大值是65535),每個表項8字節,那么GDT表最多可以有8192項。
實模式的尋址總線是20bits,為了讓尋址超過1M,需要開啟A20,可以通過以下指令開啟:
in al, 0x92
or al, 2
out 0x92, al
把上述步驟完成之后,我們就進入保護模式了。在保護模式下我們要使用GDT通過GDT Selector完成,它是GDT表項相對于起始地址的偏移,因此它的值一般是0x0 0x8 0x10 0x18等。
ELF文件
Bootloader程序是原始可執行文件,如果程序由匯編寫成,匯編編譯器編譯生成的文件就是原始可執行文件,也可以使用C語言編寫,編譯成可執行文件之后通過objcopy轉換成原始可執行文件,
這篇文章介紹了用C語言寫Bootloader。
那么內核文件是什么格式的呢?跟Bootloader一樣的當然可以。內核一般使用C語言編寫,每次編譯鏈接完成之后調用objcopy是可以的。我們也可以支持通用的可執行文件格式,ELF(Executable and Linkable Format)即是一種通用的格式,它的
維基百科。
ELF文件有兩種視圖(View),鏈接視圖和執行視圖,如下圖:

鏈接視圖通過Section Header Table描述,執行視圖通過Program Header Table描述。Section Header Table描述了所有Section的信息,包括所在的文件偏移和大小等;Program Header Table描述了所有Segment的信息,即Text Segment, Data Segment和BSS Segment,每個Segment中包含了一個或多個Section。
對于加載可執行文件,我們只需關注執行視圖,即解析ELF文件,遍歷Program Header Table中的每一項,把每個Program Header描述的Segment加載到對應的虛擬地址即可,然后從ELF header中取出Entry的地址,跳轉過去就開始執行了。對于ELF格式的內核文件來說,這個工作就需要由Bootloader完成。Bootloader支持ELF內核文件加載之后,用C語言編寫的內核編譯完成之后就不需要objcopy了。
為什么寫操作系統
首先是興趣,在現在這個時代,寫操作系統幾乎沒有實用價值,只能是一個Toy,在寫一個Toy OS時,可以學習掌握很多知識,并把這些知識貫穿實用起來。操作系統是一個復雜的系統,牽涉到的東西很多,我相信寫操作系統可以幫助理解現代操作系統及其它底層知識。我目前才剛開始寫,代碼放在
Github上。
posted on 2014-10-30 19:13
airtrack 閱讀(3354)
評論(1) 編輯 收藏 引用