基本概念
Windows 2000
使用基于分頁機制的虛擬內(nèi)存。每個進程有4GB的虛擬地址空間。基于分頁機制,這4GB地址空間的一些部分被映射了物理內(nèi)存,一些部分映射硬盤上的交換文
件,一些部分什么也沒有映射。程序中使用的都是4GB地址空間中的虛擬地址。而訪問物理內(nèi)存,需要使用物理地址。
下面我們看看什么是物理地址,什么是虛擬地址。
物理地址 (physical
address):
放在尋址總線上的地址。放在尋址總線上,如果是讀,電路根據(jù)這個地址每位的值就將相應(yīng)地址的物理內(nèi)存中的數(shù)據(jù)放到數(shù)據(jù)總線中傳輸。如果是寫,電路根據(jù)這個
地址每位的值就將相應(yīng)地址的物理內(nèi)存中放入數(shù)據(jù)總線上的內(nèi)容。物理內(nèi)存是以字節(jié)(8位)為單位編址的。
虛擬地址 (virtual
address): 4G虛擬地址空間中的地址,程序中使用的都是虛擬地址。
如果CPU寄存器中的分頁標志位被設(shè)置,那么執(zhí)行內(nèi)存操作的機器指令時,CPU會自動根據(jù)頁目錄和頁表中的信息,把虛擬地址轉(zhuǎn)換成物理地址,完成該指令。
比如 mov eax,004227b8h
,這是把地址004227b8h處的值賦給寄存器的匯編代碼,004227b8這個地址就是虛擬址。CPU在執(zhí)行這行代碼時,發(fā)現(xiàn)寄存器中的分頁標志位已
經(jīng)被設(shè)定,就自動完成虛擬地址到物理地址的轉(zhuǎn)換,使用物理地址取出值,完成指令。對于Intel CPU
來說,分頁標志位是寄存器CR0的第31位,為1表示使用分頁,為0表示不使用分頁。對于初始化之后的 Win2k 我們觀察CR0
,發(fā)現(xiàn)第31位為1。表明Win2k是使用分頁的。
使用了分頁機制之后,4G的地址空間被分成了固定大小的頁,每一頁或者被映射到物理內(nèi)存,或者被映射到硬盤上的交換文件中,或者沒有映射任何東西。對于一
般程序來說,4G的地址空間,只有一小部分映射了物理內(nèi)存,大片大片的部分是沒有映射任何東西。物理內(nèi)存也被分頁,來映射地址空間。對于32bit的
Win2k,頁的大小是4K字節(jié)。CPU用來把虛擬地址轉(zhuǎn)換成物理地址的信息存放在叫做頁目錄和頁表的結(jié)構(gòu)里。
物理內(nèi)存分頁,一個物理頁的大小為4K字節(jié),第0個物理頁從物理地址 0x00000000
處開始。由于頁的大小為4KB,就是0x1000字節(jié),所以第1頁從物理地址
0x00001000處開始。第2頁從物理地址0x00002000處開始。可以看到由于頁的大小是4KB,所以只需要32bit的地址中高20bit來
尋址物理頁。
頁表 ,一個頁表的大小為4K字節(jié),放在一個物理頁
中。由1024個4字節(jié)的頁表項組成。頁表項的大小為4個字節(jié)(32bit),所以一個頁表中有1024個頁表項。頁表中的每一項的內(nèi)容(每項4個字
節(jié),32bit)高20bit用來放一個物理頁的物理地址,低12bit放著一些標志。
頁目錄 ,一個頁目錄大小為4K字節(jié),放在一個物理頁
中。由1024個4字節(jié)的頁目錄項組成。頁目錄項的大小為4個字節(jié)(32bit),所以一個頁目錄中有1024個頁目錄項。頁目錄中的每一項的內(nèi)容(每項
4個字節(jié))高20bit用來放一個頁表(頁表放在一個物理頁中)的物理地址,低12bit放著一些標志。 對于x86系統(tǒng),頁目錄的物理地址放
在CPU的CR3寄存器中。
CPU把虛擬地址轉(zhuǎn)換成物理地址:
一個虛擬地址,大小4個字節(jié)(32bit),包含著找到物理地址的信息,分為3個部分:第22位到第31位這10位(最高10位)是頁目錄中的索引,第
12位到第21位這10位是頁表中的索引,第0位到第11位這12位(低12位)是頁內(nèi)偏移。對于一個要轉(zhuǎn)換成物理地址的虛擬地址,CPU首先根據(jù)CR3
中的值,找到頁目錄所在的物理頁。然后根據(jù)虛擬地址的第22位到第31位這10位(最高的10bit)的值作為索引,找到相應(yīng)的頁目錄項
(PDE,page directory
entry),頁目錄項中有這個虛擬地址所對應(yīng)頁表的物理地址。有了頁表的物理地址,根據(jù)虛擬地址的第12位到第21位這10位的值作為索引,找到該頁表
中相應(yīng)的頁表項(PTE,page table
entry),頁表項中就有這個虛擬地址所對應(yīng)物理頁的物理地址。最后用虛擬地址的最低12位,也就是頁內(nèi)偏移,加上這個物理頁的物理地址,就得到了該虛
擬地址所對應(yīng)的物理地址。
一個頁目錄有1024項,虛擬地址最高的10bit剛好可以索引1024項(2的10次方等于1024)。一個頁表也有1024項,虛擬地址中間部分的
10bit,剛好索引1024項。虛擬地址最低的12bit(2的12次方等于4096),作為頁內(nèi)偏移,剛好可以索引4KB,也就是一個物理頁中的每個
字節(jié)。
一個虛擬地址轉(zhuǎn)換成物理地址的計算過程就是,處理器通過CR3找到當前頁目錄所在物理頁,取虛擬地址的高10bit,然后把這10bit右移2bit(因
為每個頁目錄項4個字節(jié)長,右移2bit相當于乘4)得到在該頁中的地址,取出該地址處PDE(4個字節(jié)),就找到了該虛擬地址對應(yīng)頁表所在物理頁,取虛
擬地址第12位到第21位這10位,然后把這10bit右移2bit(因為每個頁表項4個字節(jié)長,右移2bit相當于乘4)得到在該頁中的地址,取出該地
址處的PTE(4個字節(jié)),就找到了該虛擬地址對應(yīng)物理頁的地址,最后加上12bit的頁內(nèi)偏移得到了物理地址。
32bit的一個指針,可以尋址范圍0x00000000-0xFFFFFFFF,4GB大小。也就是說一個32bit的指針可以尋址整個4GB地址空間
的每一個字節(jié)。一個頁表項負責4K的地址空間和物理內(nèi)存的映射,一個頁表1024項,也就是負責1024*4k=4M的地址空間的映射。一個頁目錄項,對
應(yīng)一個頁表。一個頁目錄有1024項,也就對應(yīng)著1024個頁表,每個頁表負責4M地址空間的映射。1024個頁表負責1024*4M=4G的地址空間映
射。一個進程有一個頁目錄。所以以頁為單位,頁目錄和頁表可以保證4G的地址空間中的每頁和物理內(nèi)存的映射。
每個進程都有自己的4G地址空間,從0x00000000-0xFFFFFFFF。通過每個進程自己的一套頁目錄和頁表來實現(xiàn)。由于每個進程有自己的頁目
錄和頁表,所以每個進程的地址空間映射的物理內(nèi)存是不一樣的。兩個進程的同一個虛擬地址處(如果都有物理內(nèi)存映射)的值一般是不同的,因為他們往往對應(yīng)不
同的物理頁。
4G地址空間中低2G,0x00000000-0x7FFFFFFF是用戶地址空間,4G地址空間中高2G,
0x80000000-0xFFFFFFFF
是系統(tǒng)地址空間。訪問系統(tǒng)地址空間需要程序有ring0的權(quán)限。