• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            Prayer

            在一般中尋求卓越
            posts - 1256, comments - 190, trackbacks - 0, articles - 0
              C++博客 :: 首頁 :: 新隨筆 :: 聯系 :: 聚合  :: 管理

            Linux 文件系統剖析

            Posted on 2009-07-28 13:45 Prayer 閱讀(208) 評論(0)  編輯 收藏 引用 所屬分類: LINUX/UNIX/AIX
            在文件系統方面,Linux® 可以算得上操作系統中的 “瑞士軍刀”。Linux 支持許多種文件系統,從日志型文件系統到集群文件系統和加密文件系統。對于使用標準的和比較奇特的文件系統以及開發文件系統來說,Linux 是極好的平臺。本文討論 Linux 內核中的虛擬文件系統(VFS,有時候稱為虛擬文件系統交換器),然后介紹將文件系統連接在一起的主要結構。

            基本的文件系統體系結構

            Linux 文件系統體系結構是一個對復雜系統進行抽象化的有趣例子。通過使用一組通用的 API 函數,Linux 可以在許多種存儲設備上支持許多種文件系統。例如,read 函數調用可以從指定的文件描述符讀取一定數量的字節。read 函數不了解文件系統的類型,比如 ext3 或 NFS。它也不了解文件系統所在的存儲媒體,比如 AT Attachment Packet Interface(ATAPI)磁盤、Serial-Attached SCSI(SAS)磁盤或 Serial Advanced Technology Attachment(SATA)磁盤。但是,當通過調用 read 函數讀取一個文件時,數據會正常返回。本文講解這個機制的實現方法并介紹 Linux 文件系統層的主要結構。





            回頁首


            什么是文件系統?

            首先回答最常見的問題,“什么是文件系統”。文件系統是對一個存儲設備上的數據和元數據進行組織的機制。由于定義如此寬泛,支持它的代碼會很有意思。正如前面提到的,有許多種文件系統和媒體。由于存在這么多類型,可以預料到 Linux 文件系統接口實現為分層的體系結構,從而將用戶接口層、文件系統實現和操作存儲設備的驅動程序分隔開。

            文件系統作為協議
            另一種看待文件系統的方式是把它看作一個協議。網絡協議(比如 IP)規定了互聯網上傳輸的數據流的意義,同樣,文件系統會給出特定存儲媒體上數據的意義。

            掛裝

            在 Linux 中將一個文件系統與一個存儲設備關聯起來的過程稱為掛裝(mount)。使用 mount 命令將一個文件系統附著到當前文件系統層次結構中(根)。在執行掛裝時,要提供文件系統類型、文件系統和一個掛裝點。

            為了說明 Linux 文件系統層的功能(以及掛裝的方法),我們在當前文件系統的一個文件中創建一個文件系統。實現的方法是,首先用 dd 命令創建一個指定大小的文件(使用 /dev/zero 作為源進行文件復制)—— 換句話說,一個用零進行初始化的文件,見清單 1。


            清單 1. 創建一個經過初始化的文件
                        $ dd if=/dev/zero of=file.img bs=1k count=10000
                        10000+0 records in
                        10000+0 records out
                        $
                        

            現在有了一個 10MB 的 file.img 文件。使用 losetup 命令將一個循環設備與這個文件關聯起來,讓它看起來像一個塊設備,而不是文件系統中的常規文件:

            $ losetup /dev/loop0 file.img
                        $
                        

            這個文件現在作為一個塊設備出現(由 /dev/loop0 表示)。然后用 mke2fs 在這個設備上創建一個文件系統。這個命令創建一個指定大小的新的 ext2 文件系統,見清單 2。


            清單 2. 用循環設備創建 ext2 文件系統
                        $ mke2fs -c /dev/loop0 10000
                        mke2fs 1.35 (28-Feb-2004)
                        max_blocks 1024000, rsv_groups = 1250, rsv_gdb = 39
                        Filesystem label=
                        OS type: Linux
                        Block size=1024 (log=0)
                        Fragment size=1024 (log=0)
                        2512 inodes, 10000 blocks
                        500 blocks (5.00%) reserved for the super user
                        ...
                        $
                        

            使用 mount 命令將循環設備(/dev/loop0)所表示的 file.img 文件掛裝到掛裝點 /mnt/point1。注意,文件系統類型指定為 ext2。掛裝之后,就可以將這個掛裝點當作一個新的文件系統,比如使用 ls 命令,見清單 3。


            清單 3. 創建掛裝點并通過循環設備掛裝文件系統
                        $ mkdir /mnt/point1
                        $ mount -t ext2 /dev/loop0 /mnt/point1
                        $ ls /mnt/point1
                        lost+found
                        $
                        

            如清單 4 所示,還可以繼續這個過程:在剛才掛裝的文件系統中創建一個新文件,將它與一個循環設備關聯起來,再在上面創建另一個文件系統。


            清單 4. 在循環文件系統中創建一個新的循環文件系統
                        $ dd if=/dev/zero of=/mnt/point1/file.img bs=1k count=1000
                        1000+0 records in
                        1000+0 records out
                        $ losetup /dev/loop1 /mnt/point1/file.img
                        $ mke2fs -c /dev/loop1 1000
                        mke2fs 1.35 (28-Feb-2004)
                        max_blocks 1024000, rsv_groups = 125, rsv_gdb = 3
                        Filesystem label=
                        ...
                        $ mkdir /mnt/point2
                        $ mount -t ext2 /dev/loop1 /mnt/point2
                        $ ls /mnt/point2
                        lost+found
                        $ ls /mnt/point1
                        file.img lost+found
                        $
                        

            通過這個簡單的演示很容易體會到 Linux 文件系統(和循環設備)是多么強大。可以按照相同的方法在文件上用循環設備創建加密的文件系統。可以在需要時使用循環設備臨時掛裝文件,這有助于保護數據。





            回頁首


            文件系統體系結構

            既然已經看到了文件系統的構造方法,現在就看看 Linux 文件系統層的體系結構。本文從兩個角度考察 Linux 文件系統。首先采用高層體系結構的角度。然后進行深層次討論,介紹實現文件系統層的主要結構。





            回頁首


            高層體系結構

            盡管大多數文件系統代碼在內核中(后面討論的用戶空間文件系統除外),但是圖 1 所示的體系結構顯示了用戶空間和內核中與文件系統相關的主要組件之間的關系。


            圖 1. Linux 文件系統組件的體系結構
            圖 1. Linux 文件系統組件的體系結構

            用戶空間包含一些應用程序(例如,文件系統的使用者)和 GNU C 庫(glibc),它們為文件系統調用(打開、讀取、寫和關閉)提供用戶接口。系統調用接口的作用就像是交換器,它將系統調用從用戶空間發送到內核空間中的適當端點。

            VFS 是底層文件系統的主要接口。這個組件導出一組接口,然后將它們抽象到各個文件系統,各個文件系統的行為可能差異很大。有兩個針對文件系統對象的緩存(inode 和 dentry)。它們緩存最近使用過的文件系統對象。

            每個文件系統實現(比如 ext2、JFS 等等)導出一組通用接口,供 VFS 使用。緩沖區緩存會緩存文件系統和相關塊設備之間的請求。例如,對底層設備驅動程序的讀寫請求會通過緩沖區緩存來傳遞。這就允許在其中緩存請求,減少訪問物理設備的次數,加快訪問速度。以最近使用(LRU)列表的形式管理緩沖區緩存。注意,可以使用 sync 命令將緩沖區緩存中的請求發送到存儲媒體(迫使所有未寫的數據發送到設備驅動程序,進而發送到存儲設備)。

            什么是塊設備?
            塊設備就是以塊(比如磁盤扇區)為單位收發數據的設備,它們支持緩沖和隨機訪問(不必順序讀取塊,而是可以在任何時候訪問任何塊)等特性。塊設備包括硬盤、CD-ROM 和 RAM 盤。與塊設備相對的是字符設備,字符設備沒有可以進行物理尋址的媒體。字符設備包括串行端口和磁帶設備,只能逐字符地讀取這些設備中的數據。

            這就是 VFS 和文件系統組件的高層情況?,F在,討論實現這個子系統的主要結構。

            主要結構

            Linux 以一組通用對象的角度看待所有文件系統。這些對象是超級塊(superblock)、inode、dentry 和文件。超級塊在每個文件系統的根上,超級塊描述和維護文件系統的狀態。文件系統中管理的每個對象(文件或目錄)在 Linux 中表示為一個 inode。inode 包含管理文件系統中的對象所需的所有元數據(包括可以在對象上執行的操作)。另一組結構稱為 dentry,它們用來實現名稱和 inode 之間的映射,有一個目錄緩存用來保存最近使用的 dentry。dentry 還維護目錄和文件之間的關系,從而支持在文件系統中移動。最后,VFS 文件表示一個打開的文件(保存打開的文件的狀態,比如寫偏移量等等)。

            虛擬文件系統層

            VFS 作為文件系統接口的根層。VFS 記錄當前支持的文件系統以及當前掛裝的文件系統。

            可以使用一組注冊函數在 Linux 中動態地添加或刪除文件系統。內核保存當前支持的文件系統的列表,可以通過 /proc 文件系統在用戶空間中查看這個列表。這個虛擬文件還顯示當前與這些文件系統相關聯的設備。在 Linux 中添加新文件系統的方法是調用 register_filesystem。這個函數的參數定義一個文件系統結構(file_system_type)的引用,這個結構定義文件系統的名稱、一組屬性和兩個超級塊函數。也可以注銷文件系統。

            在注冊新的文件系統時,會把這個文件系統和它的相關信息添加到 file_systems 列表中(見圖 2 和 linux/include/linux/mount.h)。這個列表定義可以支持的文件系統。在命令行上輸入 cat /proc/filesystems,就可以查看這個列表。


            圖 2. 向內核注冊的文件系統
             圖 2. 向內核注冊的文件系統

            VFS 中維護的另一個結構是掛裝的文件系統(見圖 3)。這個結構提供當前掛裝的文件系統(見 linux/include/linux/fs.h)。它鏈接下面討論的超級塊結構。


            圖 3. 掛裝的文件系統列表
             圖 3. 掛裝的文件系統列表

            超級塊

            超級塊結構表示一個文件系統。它包含管理文件系統所需的信息,包括文件系統名稱(比如 ext2)、文件系統的大小和狀態、塊設備的引用和元數據信息(比如空閑列表等等)。超級塊通常存儲在存儲媒體上,但是如果超級塊不存在,也可以實時創建它??梢栽?./linux/include/linux/fs.h 中找到超級塊結構(見圖 4)。


            圖 4. 超級塊結構和 inode 操作
             圖 4. 超級塊結構和 inode 操作

            超級塊中的一個重要元素是超級塊操作的定義。這個結構定義一組用來管理這個文件系統中的 inode 的函數。例如,可以用 alloc_inode 分配 inode,用 destroy_inode 刪除 inode??梢杂?read_inodewrite_inode 讀寫 inode,用 sync_fs 執行文件系統同步。可以在 ./linux/include/linux/fs.h 中找到 super_operations 結構。每個文件系統提供自己的 inode 方法,這些方法實現操作并向 VFS 層提供通用的抽象。

            inode 和 dentry

            inode 表示文件系統中的一個對象,它具有惟一標識符。各個文件系統提供將文件名映射為惟一 inode 標識符和 inode 引用的方法。圖 5 顯示 inode 結構的一部分以及兩個相關結構。請特別注意 inode_operationsfile_operations。這些結構表示可以在這個 inode 上執行的操作。inode_operations 定義直接在 inode 上執行的操作,而 file_operations 定義與文件和目錄相關的方法(標準系統調用)。


            圖 5. inode 結構和相關聯的操作
             圖 5. inode 結構和相關聯的操作

            inode 和目錄緩存分別保存最近使用的 inode 和 dentry。注意,對于 inode 緩存中的每個 inode,在目錄緩存中都有一個對應的 dentry。可以在 ./linux/include/linux/fs.h 中找到 inodedentry 結構。

            緩沖區緩存

            除了各個文件系統實現(可以在 ./linux/fs 中找到)之外,文件系統層的底部是緩沖區緩存。這個組件跟蹤來自文件系統實現和物理設備(通過設備驅動程序)的讀寫請求。為了提高效率,Linux 對請求進行緩存,避免將所有請求發送到物理設備。緩存中緩存最近使用的緩沖區(頁面),這些緩沖區可以快速提供給各個文件系統。





            回頁首


            有趣的文件系統

            本文沒有討論 Linux 中可用的具體文件系統,但是值得在這里稍微提一下。Linux 支持許多種文件系統,包括 MINIX、MS-DOS 和 ext2 等老式文件系統。Linux 還支持 ext3、JFS 和 ReiserFS 等新的日志型文件系統。另外,Linux 支持加密文件系統(比如 CFS)和虛擬文件系統(比如 /proc)。

            最后一種值得注意的文件系統是 Filesystem in Userspace(FUSE)。這種文件系統可以將文件系統請求通過 VFS 發送回用戶空間。所以,如果您有興趣創建自己的文件系統,那么通過使用 FUSE 進行開發是一種不錯的方法。





            回頁首


            結束語

            分享這篇文章……

            digg 將本文提交到 Digg
            del.icio.us 發布到 del.icio.us
            Slashdot 提交到 Slashdot!

            盡管文件系統的實現并不復雜,但它是可伸縮和可擴展的體系結構的好例子。文件系統體系結構已經發展了許多年,并成功地支持了許多不同類型的文件系統和許多目標存儲設備類型。由于使用了基于插件的體系結構和多層的函數間接性,Linux 文件系統在近期的發展很值得關注

            久久99久久99精品免视看动漫| 久久久无码精品午夜| 久久99精品久久久久久水蜜桃| 久久精品成人免费国产片小草| 一本综合久久国产二区| 国产亚洲综合久久系列| 久久人人爽人人精品视频| 精品国产日韩久久亚洲| 久久久久婷婷| 久久99九九国产免费看小说| 亚洲精品乱码久久久久久按摩 | 国产亚洲精久久久久久无码| 久久er热视频在这里精品| 日产精品久久久久久久| 99久久无色码中文字幕| 亚洲伊人久久大香线蕉综合图片| 精品熟女少妇aⅴ免费久久| 中文无码久久精品| 人妻无码精品久久亚瑟影视| 99久久久久| 国产视频久久| 久久国产精品免费| 国产精品99久久免费观看| 亚洲色欲久久久综合网东京热| 久久99精品久久久久久水蜜桃 | 人人狠狠综合88综合久久| 国产韩国精品一区二区三区久久| 伊人热热久久原色播放www| 国产精品内射久久久久欢欢| 狠狠色丁香婷综合久久| 天堂久久天堂AV色综合| 狠狠色婷婷久久综合频道日韩| 日韩va亚洲va欧美va久久| 四虎亚洲国产成人久久精品| 久久久精品无码专区不卡| 久久www免费人成精品香蕉| 欧美精品一本久久男人的天堂| 99久久国产亚洲高清观看2024 | 久久综合视频网站| 人妻无码久久精品| 一本色道久久99一综合|