Windows?2000內存篇?分頁機制介紹
(2009-03-10 10:34:42)
?基本概念
???? Windows 2000 使用基于分頁機制的虛擬內存。每個進程有4GB的虛擬地址空間。基于分頁機制,這4GB地址空間的一些部分被映射了物理內存,一些部分映射硬盤上的交換文件,一些部分什么也沒有映射。程序中使用的都是4GB地址空間中的虛擬地址。而訪問物理內存,需要使用物理地址。
??? 下面我們看看什么是物理地址,什么是虛擬地址。
????物理地址?(physical address): 放在尋址總線上的地址。放在尋址總線上,如果是讀,電路根據這個地址每位的值就將相應地址的物理內存中的數據放到數據總線中傳輸。如果是寫,電路根據這個地址每位的值就將相應地址的物理內存中放入數據總線上的內容。物理內存是以字節(8位)為單位編址的。
????虛擬地址?(virtual address): 4G虛擬地址空間中的地址,程序中使用的都是虛擬地址。
??? 如果CPU寄存器中的分頁標志位被設置,那么執行內存操作的機器指令時,CPU會自動根據頁目錄和頁表中的信息,把虛擬地址轉換成物理地址,完成該指令。比如 mov eax,004227b8h ,這是把地址004227b8h處的值賦給寄存器的匯編代碼,004227b8這個地址就是虛擬址。CPU在執行這行代碼時,發現寄存器中的分頁標志位已經被設定,就自動完成虛擬地址到物理地址的轉換,使用物理地址取出值,完成指令。對于Intel CPU 來說,分頁標志位是寄存器CR0的第31位,為1表示使用分頁,為0表示不使用分頁。對于初始化之后的 Win2k 我們觀察CR0 ,發現第31位為1。表明Win2k是使用分頁的。
??? 使用了分頁機制之后,4G的地址空間被分成了固定大小的頁,每一頁或者被映射到物理內存,或者被映射到硬盤上的交換文件中,或者沒有映射任何東西。對于一般程序來說,4G的地址空間,只有一小部分映射了物理內存,大片大片的部分是沒有映射任何東西。物理內存也被分頁,來映射地址空間。對于32bit的Win2k,頁的大小是4K字節。CPU用來把虛擬地址轉換成物理地址的信息存放在叫做頁目錄和頁表的結構里。
??? 物理內存分頁,一個物理頁的大小為4K字節,第0個物理頁從物理地址 0x00000000 處開始。由于頁的大小為4KB,就是0x1000字節,所以第1頁從物理地址 0x00001000處開始。第2頁從物理地址0x00002000處開始。可以看到由于頁的大小是4KB,所以只需要32bit的地址中高20bit來尋址物理頁。
????頁表,一個頁表的大小為4K字節,放在一個物理頁中。由1024個4字節的頁表項組成。頁表項的大小為4個字節(32bit),所以一個頁表中有1024個頁表項。頁表中的每一項的內容(每項4個字節,32bit)高20bit用來放一個物理頁的物理地址,低12bit放著一些標志。
????頁目錄,一個頁目錄大小為4K字節,放在一個物理頁中。由1024個4字節的頁目錄項組成。頁目錄項的大小為4個字節(32bit),所以一個頁目錄中有1024個頁目錄項。頁目錄中的每一項的內容(每項4個字節)高20bit用來放一個頁表(頁表放在一個物理頁中)的物理地址,低12bit放著一些標志。?對于x86系統,頁目錄的物理地址放在CPU的CR3寄存器中。
???? CPU把虛擬地址轉換成物理地址:
???? 一個虛擬地址,大小4個字節(32bit),包含著找到物理地址的信息,分為3個部分:第22位到第31位這10位(最高10位)是頁目錄中的索引,第12位到第21位這10位是頁表中的索引,第0位到第11位這12位(低12位)是頁內偏移。對于一個要轉換成物理地址的虛擬地址,CPU首先根據CR3中的值,找到頁目錄所在的物理頁。然后根據虛擬地址的第22位到第31位這10位(最高的10bit)的值作為索引,找到相應的頁目錄項(PDE,page directory entry),頁目錄項中有這個虛擬地址所對應頁表的物理地址。有了頁表的物理地址,根據虛擬地址的第12位到第21位這10位的值作為索引,找到該頁表中相應的頁表項(PTE,page table entry),頁表項中就有這個虛擬地址所對應物理頁的物理地址。最后用虛擬地址的最低12位,也就是頁內偏移,加上這個物理頁的物理地址,就得到了該虛擬地址所對應的物理地址。
???? 一個頁目錄有1024項,虛擬地址最高的10bit剛好可以索引1024項(2的10次方等于1024)。一個頁表也有1024項,虛擬地址中間部分的10bit,剛好索引1024項。虛擬地址最低的12bit(2的12次方等于4096),作為頁內偏移,剛好可以索引4KB,也就是一個物理頁中的每個字節。
???? 一個虛擬地址轉換成物理地址的計算過程就是,處理器通過CR3找到當前頁目錄所在物理頁,取虛擬地址的高10bit,然后把這10bit右移2bit(因為每個頁目錄項4個字節長,右移2bit相當于乘4)得到在該頁中的地址,取出該地址處PDE(4個字節),就找到了該虛擬地址對應頁表所在物理頁,取虛擬地址第12位到第21位這10位,然后把這10bit右移2bit(因為每個頁表項4個字節長,右移2bit相當于乘4)得到在該頁中的地址,取出該地址處的PTE(4個字節),就找到了該虛擬地址對應物理頁的地址,最后加上12bit的頁內偏移得到了物理地址。
???? 32bit的一個指針,可以尋址范圍0x00000000-0xFFFFFFFF,4GB大小。也就是說一個32bit的指針可以尋址整個4GB地址空間的每一個字節。一個頁表項負責4K的地址空間和物理內存的映射,一個頁表1024項,也就是負責1024*4k=4M的地址空間的映射。一個頁目錄項,對應一個頁表。一個頁目錄有1024項,也就對應著1024個頁表,每個頁表負責4M地址空間的映射。1024個頁表負責1024*4M=4G的地址空間映射。一個進程有一個頁目錄。所以以頁為單位,頁目錄和頁表可以保證4G的地址空間中的每頁和物理內存的映射。
???? 每個進程都有自己的4G地址空間,從0x00000000-0xFFFFFFFF。通過每個進程自己的一套頁目錄和頁表來實現。由于每個進程有自己的頁目錄和頁表,所以每個進程的地址空間映射的物理內存是不一樣的。兩個進程的同一個虛擬地址處(如果都有物理內存映射)的值一般是不同的,因為他們往往對應不同的物理頁。
???? 4G地址空間中低2G,0x00000000-0x7FFFFFFF是用戶地址空間,4G地址空間中高2G,
0x80000000-0xFFFFFFFF 是系統地址空間。訪問系統地址空間需要程序有ring0的權限。