亚洲免费av片,欧美区视频在线观看,亚洲国产精品www

linux共享內(nèi)存（一）

Posted on 2008-08-26 12:14 Prayer 閱讀(785) 評論(0) 編輯收藏引用所屬分類: LINUX/UNIX/AIX

共享內(nèi)存（上）

共享內(nèi)存可以說是最有用的進(jìn)程間通信方式，也是最快的IPC形式。兩個不同進(jìn)程A、B共享內(nèi)存的意思是，同一塊物理內(nèi)存被映射到進(jìn)程A、B各自的進(jìn)程地址空間。進(jìn)程A可以即時看到進(jìn)程B對共享內(nèi)存中數(shù)據(jù)的更新，反之亦然。由于多個進(jìn)程共享同一塊內(nèi)存區(qū)域，必然需要某種同步機(jī)制，互斥鎖和信號量都可以。

采用共享內(nèi)存通信的一個顯而易見的好處是效率高，因為進(jìn)程可以直接讀寫內(nèi)存，而不需要任何數(shù)據(jù)的拷貝。對于像管道和消息隊列等通信方式，則需要在內(nèi)核和用戶空間進(jìn)行四次的數(shù)據(jù)拷貝，而共享內(nèi)存則只拷貝兩次數(shù)據(jù)[1]：一次從輸入文件到共享內(nèi)存區(qū)，另一次從共享內(nèi)存區(qū)到輸出文件。實際上，進(jìn)程之間在共享內(nèi)存時，并不總是讀寫少量數(shù)據(jù)后就解除映射，有新的通信時，再重新建立共享內(nèi)存區(qū)域。而是保持共享區(qū)域，直到通信完畢為止，這樣，數(shù)據(jù)內(nèi)容一直保存在共享內(nèi)存中，并沒有寫回文件。共享內(nèi)存中的內(nèi)容往往是在解除映射時才寫回文件的。因此，采用共享內(nèi)存的通信方式效率是非常高的。

Linux的2.2.x內(nèi)核支持多種共享內(nèi)存方式，如mmap()系統(tǒng)調(diào)用，Posix共享內(nèi)存，以及系統(tǒng)V共享內(nèi)存。linux發(fā)行版本如Redhat 8.0支持mmap()系統(tǒng)調(diào)用及系統(tǒng)V共享內(nèi)存，但還沒實現(xiàn)Posix共享內(nèi)存，本文將主要介紹mmap()系統(tǒng)調(diào)用及系統(tǒng)V共享內(nèi)存API的原理及應(yīng)用。

一、內(nèi)核怎樣保證各個進(jìn)程尋址到同一個共享內(nèi)存區(qū)域的內(nèi)存頁面

1、page cache及swap cache中頁面的區(qū)分：一個被訪問文件的物理頁面都駐留在page cache或swap cache中，一個頁面的所有信息由struct page來描述。struct page中有一個域為指針mapping ，它指向一個struct address_space類型結(jié)構(gòu)。page cache或swap cache中的所有頁面就是根據(jù)address_space結(jié)構(gòu)以及一個偏移量來區(qū)分的。

2、文件與address_space結(jié)構(gòu)的對應(yīng)：一個具體的文件在打開后，內(nèi)核會在內(nèi)存中為之建立一個struct inode結(jié)構(gòu)，其中的i_mapping域指向一個address_space結(jié)構(gòu)。這樣，一個文件就對應(yīng)一個address_space結(jié)構(gòu)，一個address_space與一個偏移量能夠確定一個page cache 或swap cache中的一個頁面。因此，當(dāng)要尋址某個數(shù)據(jù)時，很容易根據(jù)給定的文件及數(shù)據(jù)在文件內(nèi)的偏移量而找到相應(yīng)的頁面。

3、進(jìn)程調(diào)用mmap()時，只是在進(jìn)程空間內(nèi)新增了一塊相應(yīng)大小的緩沖區(qū)，并設(shè)置了相應(yīng)的訪問標(biāo)識，但并沒有建立進(jìn)程空間到物理頁面的映射。因此，第一次訪問該空間時，會引發(fā)一個缺頁異常。

4、對于共享內(nèi)存映射情況，缺頁異常處理程序首先在swap cache中尋找目標(biāo)頁（符合address_space以及偏移量的物理頁），如果找到，則直接返回地址；如果沒有找到，則判斷該頁是否在交換區(qū)(swap area)，如果在，則執(zhí)行一個換入操作；如果上述兩種情況都不滿足，處理程序?qū)⒎峙湫碌奈锢眄撁妫阉迦氲?/span>page cache中。進(jìn)程最終將更新進(jìn)程頁表。
注：對于映射普通文件情況（非共享映射），缺頁異常處理程序首先會在page cache中根據(jù)address_space以及數(shù)據(jù)偏移量尋找相應(yīng)的頁面。如果沒有找到，則說明文件數(shù)據(jù)還沒有讀入內(nèi)存，處理程序會從磁盤讀入相應(yīng)的頁面，并返回相應(yīng)地址，同時，進(jìn)程頁表也會更新。

5、所有進(jìn)程在映射同一個共享內(nèi)存區(qū)域時，情況都一樣，在建立線性地址與物理地址之間的映射之后，不論進(jìn)程各自的返回地址如何，實際訪問的必然是同一個共享內(nèi)存區(qū)域?qū)?yīng)的物理頁面。
注：一個共享內(nèi)存區(qū)域可以看作是特殊文件系統(tǒng)shm中的一個文件，shm的安裝點在交換區(qū)上。

上面涉及到了一些數(shù)據(jù)結(jié)構(gòu)，圍繞數(shù)據(jù)結(jié)構(gòu)理解問題會容易一些。

二、mmap()及其相關(guān)系統(tǒng)調(diào)用

mmap()系統(tǒng)調(diào)用使得進(jìn)程之間通過映射同一個普通文件實現(xiàn)共享內(nèi)存。普通文件被映射到進(jìn)程地址空間后，進(jìn)程可以向訪問普通內(nèi)存一樣對文件進(jìn)行訪問，不必再調(diào)用read()，write（）等操作。

注：實際上，mmap()系統(tǒng)調(diào)用并不是完全為了用于共享內(nèi)存而設(shè)計的。它本身提供了不同于一般對普通文件的訪問方式，進(jìn)程可以像讀寫內(nèi)存一樣對普通文件的操作。而Posix或系統(tǒng)V的共享內(nèi)存IPC則純粹用于共享目的，當(dāng)然mmap()實現(xiàn)共享內(nèi)存也是其主要應(yīng)用之一。

1、mmap()系統(tǒng)調(diào)用形式如下：

void* mmap ( void * addr , size_t len , int prot , int flags , int fd , off_t offset )
參數(shù)fd為即將映射到進(jìn)程空間的文件描述字，一般由open()返回，同時，fd可以指定為-1，此時須指定flags參數(shù)中的MAP_ANON，表明進(jìn)行的是匿名映射（不涉及具體的文件名，避免了文件的創(chuàng)建及打開，很顯然只能用于具有親緣關(guān)系的進(jìn)程間通信）。len是映射到調(diào)用進(jìn)程地址空間的字節(jié)數(shù)，它從被映射文件開頭offset個字節(jié)開始算起。prot 參數(shù)指定共享內(nèi)存的訪問權(quán)限。可取如下幾個值的或：PROT_READ（可讀） , PROT_WRITE （可寫）, PROT_EXEC （可執(zhí)行）, PROT_NONE（不可訪問）。flags由以下幾個常值指定：MAP_SHARED , MAP_PRIVATE , MAP_FIXED，其中，MAP_SHARED , MAP_PRIVATE必選其一，而MAP_FIXED則不推薦使用。offset參數(shù)一般設(shè)為0，表示從文件頭開始映射。參數(shù)addr指定文件應(yīng)被映射到進(jìn)程空間的起始地址，一般被指定一個空指針，此時選擇起始地址的任務(wù)留給內(nèi)核來完成。函數(shù)的返回值為最后文件映射到進(jìn)程空間的地址，進(jìn)程可直接操作起始地址為該值的有效地址。這里不再詳細(xì)介紹mmap()的參數(shù)，讀者可參考mmap()手冊頁獲得進(jìn)一步的信息。

2、系統(tǒng)調(diào)用mmap()用于共享內(nèi)存的兩種方式：

（1）使用普通文件提供的內(nèi)存映射：適用于任何進(jìn)程之間；此時，需要打開或創(chuàng)建一個文件，然后再調(diào)用mmap()；典型調(diào)用代碼如下：

fd=open(name, flag, mode);

if(fd<0)

...

ptr=mmap(NULL, len , PROT_READ|PROT_WRITE, MAP_SHARED , fd , 0); 通過mmap()實現(xiàn)共享內(nèi)存的通信方式有許多特點和要注意的地方，我們將在范例中進(jìn)行具體說明。

（2）使用特殊文件提供匿名內(nèi)存映射：適用于具有親緣關(guān)系的進(jìn)程之間；由于父子進(jìn)程特殊的親緣關(guān)系，在父進(jìn)程中先調(diào)用mmap()，然后調(diào)用fork()。那么在調(diào)用fork()之后，子進(jìn)程繼承父進(jìn)程匿名映射后的地址空間，同樣也繼承mmap()返回的地址，這樣，父子進(jìn)程就可以通過映射區(qū)域進(jìn)行通信了。注意，這里不是一般的繼承關(guān)系。一般來說，子進(jìn)程單獨維護(hù)從父進(jìn)程繼承下來的一些變量。而mmap()返回的地址，卻由父子進(jìn)程共同維護(hù)。
對于具有親緣關(guān)系的進(jìn)程實現(xiàn)共享內(nèi)存最好的方式應(yīng)該是采用匿名內(nèi)存映射的方式。此時，不必指定具體的文件，只要設(shè)置相應(yīng)的標(biāo)志即可，參見范例2。

3、系統(tǒng)調(diào)用munmap()

int munmap( void * addr, size_t len )
該調(diào)用在進(jìn)程地址空間中解除一個映射關(guān)系，addr是調(diào)用mmap()時返回的地址，len是映射區(qū)的大小。當(dāng)映射關(guān)系解除后，對原來映射地址的訪問將導(dǎo)致段錯誤發(fā)生。

4、系統(tǒng)調(diào)用msync()

int msync ( void * addr , size_t len, int flags)
一般說來，進(jìn)程在映射空間的對共享內(nèi)容的改變并不直接寫回到磁盤文件中，往往在調(diào)用munmap（）后才執(zhí)行該操作。可以通過調(diào)用msync()實現(xiàn)磁盤上文件內(nèi)容與共享內(nèi)存區(qū)的內(nèi)容一致。

三、mmap()范例

下面將給出使用mmap()的兩個范例：范例1給出兩個進(jìn)程通過映射普通文件實現(xiàn)共享內(nèi)存通信；范例2給出父子進(jìn)程通過匿名映射實現(xiàn)共享內(nèi)存。系統(tǒng)調(diào)用mmap()有許多有趣的地方，下面是通過mmap（）映射普通文件實現(xiàn)進(jìn)程間的通信的范例，我們通過該范例來說明mmap()實現(xiàn)共享內(nèi)存的特點及注意事項。

范例1：兩個進(jìn)程通過映射普通文件實現(xiàn)共享內(nèi)存通信

范例1包含兩個子程序：map_normalfile1.c及map_normalfile2.c。編譯兩個程序，可執(zhí)行文件分別為map_normalfile1及map_normalfile2。兩個程序通過命令行參數(shù)指定同一個文件來實現(xiàn)共享內(nèi)存方式的進(jìn)程間通信。map_normalfile2試圖打開命令行參數(shù)指定的一個普通文件，把該文件映射到進(jìn)程的地址空間，并對映射后的地址空間進(jìn)行寫操作。map_normalfile1把命令行參數(shù)指定的文件映射到進(jìn)程地址空間，然后對映射后的地址空間執(zhí)行讀操作。這樣，兩個進(jìn)程通過命令行參數(shù)指定同一個文件來實現(xiàn)共享內(nèi)存方式的進(jìn)程間通信。

下面是兩個程序代碼：

/*-------------map_normalfile1.c-----------*/

#include <sys/mman.h>

#include <sys/types.h>

#include <fcntl.h>

#include <unistd.h>

typedef struct{

char name[4];

int age;

}people;

main(int argc, char** argv) // map a normal file as shared mem:

{

int fd,i;

people *p_map;

char temp;

fd=open(argv[1],O_CREAT|O_RDWR|O_TRUNC,00777);

lseek(fd,sizeof(people)*5-1,SEEK_SET);

write(fd,"",1);

p_map = (people*) mmap( NULL,sizeof(people)*10,PROT_READ|PROT_WRITE,MAP_SHARED,fd,0 );

close( fd );

temp = 'a';

for(i=0; i<10; i++)

{

temp += 1;

memcpy( ( *(p_map+i) ).name, &temp,2 );

( *(p_map+i) ).age = 20+i;

}

printf(" initialize over \n ")；

sleep(10);

munmap( p_map, sizeof(people)*10 );

printf( "umap ok \n" );

}

/*-------------map_normalfile2.c-----------*/

#include <sys/mman.h>

#include <sys/types.h>

#include <fcntl.h>

#include <unistd.h>

typedef struct{

char name[4];

int age;

}people;

main(int argc, char** argv) // map a normal file as shared mem:

{

int fd,i;

people *p_map;

fd=open( argv[1],O_CREAT|O_RDWR,00777 );

p_map = (people*)mmap(NULL,sizeof(people)*10,PROT_READ|PROT_WRITE,MAP_SHARED,fd,0);

for(i = 0;i<10;i++)

{

printf( "name: %s age %d;\n",(*(p_map+i)).name, (*(p_map+i)).age );

}

munmap( p_map,sizeof(people)*10 );

}

map_normalfile1.c首先定義了一個people數(shù)據(jù)結(jié)構(gòu)，（在這里采用數(shù)據(jù)結(jié)構(gòu)的方式是因為，共享內(nèi)存區(qū)的數(shù)據(jù)往往是有固定格式的，這由通信的各個進(jìn)程決定，采用結(jié)構(gòu)的方式有普遍代表性）。map_normfile1首先打開或創(chuàng)建一個文件，并把文件的長度設(shè)置為5個people結(jié)構(gòu)大小。然后從mmap()的返回地址開始，設(shè)置了10個people結(jié)構(gòu)。然后，進(jìn)程睡眠10秒鐘，等待其他進(jìn)程映射同一個文件，最后解除映射。

map_normfile2.c只是簡單的映射一個文件，并以people數(shù)據(jù)結(jié)構(gòu)的格式從mmap()返回的地址處讀取10個people結(jié)構(gòu)，并輸出讀取的值，然后解除映射。

分別把兩個程序編譯成可執(zhí)行文件map_normalfile1和map_normalfile2后，在一個終端上先運行./map_normalfile2 /tmp/test_shm，程序輸出結(jié)果如下：

initialize over

umap ok

在map_normalfile1輸出initialize over 之后，輸出umap ok之前，在另一個終端上運行map_normalfile2 /tmp/test_shm，將會產(chǎn)生如下輸出(為了節(jié)省空間，輸出結(jié)果為稍作整理后的結(jié)果)：

在map_normalfile1 輸出umap ok后，運行map_normalfile2則輸出如下結(jié)果：

只有注冊用戶登錄后才能發(fā)表評論。


相關(guān)文章: nm命令中符號類型詳解 linux 比較兩個文件夾不同 (diff命令, md5列表) linux下提示/usr/lib64/libstdc++.so.6: version `GLIBCXX_3.4.14' not found 解決辦法 lib lib32 lib64等lib文件夾的說明 Linux程序分析工具介紹—ldd,nm 動態(tài)庫(.so)鏈接靜態(tài)庫(.a)的情況總結(jié) 理清gcc、libc、libstdc++的關(guān)系 linux so 動態(tài)庫中全局變量被覆蓋問題 GCC的符號可見性——解決多個庫同名符號沖突問題鏈接與自定義函數(shù)名同名的庫函數(shù)

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

Prayer

linux共享內(nèi)存（一）

日歷

常用鏈接

留言簿(28)

隨筆分類

隨筆檔案

文章分類

UNIX

信用卡

搜索

最新評論

閱讀排行榜

評論排行榜