• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            woaidongmao

            文章均收錄自他人博客,但不喜標題前加-[轉貼],因其丑陋,見諒!~
            隨筆 - 1469, 文章 - 0, 評論 - 661, 引用 - 0
            數(shù)據(jù)加載中……

            使用內存映射文件處理大文件

            摘要: 本文給出了一種方便實用的解決大文件的讀取、存儲等處理的方法,并結合相關程序代碼對具體的實現(xiàn)過程進行了介紹。

            引言

            文件操作是應用程序最為基本的功能之一,Win32 APIMFC均提供有支持文件處理的函數(shù)和類,常用的有Win32 APICreateFile()WriteFile()ReadFile()MFC提供的CFile類等。一般來說,以上這些函數(shù)可以滿足大多數(shù)場合的要求,但是對于某些特殊應用領域所需要的動輒幾十GB、幾百GB、乃至幾TB的海量存儲,再以通常的文件處理方法進行處理顯然是行不通的。目前,對于上述這種大文件的操作一般是以內存映射文件的方式來加以處理的,本文下面將針對這種Windows核心編程技術展開討論。

            內存映射文件

            內存映射文件與虛擬內存有些類似,通過內存映射文件可以保留一個地址空間的區(qū)域,同時將物理存儲器提交給此區(qū)域,只是內存文件映射的物理存儲器來自一個已經存在于磁盤上的文件,而非系統(tǒng)的頁文件,而且在對該文件進行操作之前必須首先對文件進行映射,就如同將整個文件從磁盤加載到內存。由此可以看出,使用內存映射文件處理存儲于磁盤上的文件時,將不必再對文件執(zhí)行I/O操作,這意味著在對文件進行處理時將不必再為文件申請并分配緩存,所有的文件緩存操作均由系統(tǒng)直接管理,由于取消了將文件數(shù)據(jù)加載到內存、數(shù)據(jù)從內存到文件的回寫以及釋放內存塊等步驟,使得內存映射文件在處理大數(shù)據(jù)量的文件時能起到相當重要的作用。另外,實際工程中的系統(tǒng)往往需要在多個進程之間共享數(shù)據(jù),如果數(shù)據(jù)量小,處理方法是靈活多變的,如果共享數(shù)據(jù)容量巨大,那么就需要借助于內存映射文件來進行。實際上,內存映射文件正是解決本地多個進程間數(shù)據(jù)共享的最有效方法。

            內存映射文件并不是簡單的文件I/O操作,實際用到了Windows的核心編程技術--內存管理。所以,如果想對內存映射文件有更深刻的認識,必須對Windows操作系統(tǒng)的內存管理機制有清楚的認識,內存管理的相關知識非常復雜,超出了本文的討論范疇,在此就不再贅述,感興趣的讀者可以參閱其他相關書籍。下面給出使用內存映射文件的一般方法:

            首先要通過CreateFile()函數(shù)來創(chuàng)建或打開一個文件內核對象,這個對象標識了磁盤上將要用作內存映射文件的文件。在用CreateFile()將文件映像在物理存儲器的位置通告給操作系統(tǒng)后,只指定了映像文件的路徑,映像的長度還沒有指定。為了指定文件映射對象需要多大的物理存儲空間還需要通過CreateFileMapping()函數(shù)來創(chuàng)建一個文件映射內核對象以告訴系統(tǒng)文件的尺寸以及訪問文件的方式。在創(chuàng)建了文件映射對象后,還必須為文件數(shù)據(jù)保留一個地址空間區(qū)域,并把文件數(shù)據(jù)作為映射到該區(qū)域的物理存儲器進行提交。由MapViewOfFile()函數(shù)負責通過系統(tǒng)的管理而將文件映射對象的全部或部分映射到進程地址空間。此時,對內存映射文件的使用和處理同通常加載到內存中的文件數(shù)據(jù)的處理方式基本一樣,在完成了對內存映射文件的使用時,還要通過一系列的操作完成對其的清除和使用過資源的釋放。這部分相對比較簡單,可以通過UnmapViewOfFile()完成從進程的地址空間撤消文件數(shù)據(jù)的映像、通過CloseHandle()關閉前面創(chuàng)建的文件映射對象和文件對象。

            內存映射文件相關函數(shù)

            在使用內存映射文件時,所使用的API函數(shù)主要就是前面提到過的那幾個函數(shù),下面分別對其進行介紹:

            HANDLE CreateFile(LPCTSTR lpFileName,

            DWORD dwDesiredAccess,

            DWORD dwShareMode,

            LPSECURITY_ATTRIBUTES lpSecurityAttributes,

            DWORD dwCreationDisposition,

            DWORD dwFlagsAndAttributes,

            HANDLE hTemplateFile);

            函數(shù)CreateFile()即使是在普通的文件操作時也經常用來創(chuàng)建、打開文件,在處理內存映射文件時,該函數(shù)來創(chuàng)建/打開一個文件內核對象,并將其句柄返回,在調用該函數(shù)時需要根據(jù)是否需要數(shù)據(jù)讀寫和文件的共享方式來設置參數(shù)dwDesiredAccessdwShareMode,錯誤的參數(shù)設置將會導致相應操作時的失敗。

            HANDLE CreateFileMapping(HANDLE hFile,

            LPSECURITY_ATTRIBUTES lpFileMappingAttributes,

            DWORD flProtect,

            DWORD dwMaximumSizeHigh,

            DWORD dwMaximumSizeLow,

            LPCTSTR lpName);

            CreateFileMapping()函數(shù)創(chuàng)建一個文件映射內核對象,通過參數(shù)hFile指定待映射到進程地址空間的文件句柄(該句柄由CreateFile()函數(shù)的返回值獲取)。由于內存映射文件的物理存儲器實際是存儲于磁盤上的一個文件,而不是從系統(tǒng)的頁文件中分配的內存,所以系統(tǒng)不會主動為其保留地址空間區(qū)域,也不會自動將文件的存儲空間映射到該區(qū)域,為了讓系統(tǒng)能夠確定對頁面采取何種保護屬性,需要通過參數(shù)flProtect來設定,保護屬性PAGE_READONLYPAGE_READWRITEPAGE_WRITECOPY分別表示文件映射對象被映射后,可以讀取、讀寫文件數(shù)據(jù)。在使用PAGE_READONLY時,必須確保CreateFile()采用的是GENERIC_READ參數(shù);PAGE_READWRITE則要求CreateFile()采用的是GENERIC_READ|GENERIC_WRITE參數(shù);至于屬性PAGE_WRITECOPY則只需要確保CreateFile()采用了GENERIC_READGENERIC_WRITE其中之一即可。DWORD型的參數(shù)dwMaximumSizeHighdwMaximumSizeLow也是相當重要的,指定了文件的最大字節(jié)數(shù),由于這兩個參數(shù)共64位,因此所支持的最大文件長度為16EB,幾乎可以滿足任何大數(shù)據(jù)量文件處理場合的要求。

            LPVOID MapViewOfFile(HANDLE hFileMappingObject,

            DWORD dwDesiredAccess,

            DWORD dwFileOffsetHigh,

            DWORD dwFileOffsetLow,

            DWORD dwNumberOfBytesToMap);

            MapViewOfFile()函數(shù)負責把文件數(shù)據(jù)映射到進程的地址空間,參數(shù)hFileMappingObjectCreateFileMapping()返回的文件映像對象句柄。參數(shù)dwDesiredAccess則再次指定了對文件數(shù)據(jù)的訪問方式,而且同樣要與CreateFileMapping()函數(shù)所設置的保護屬性相匹配。雖然這里一再對保護屬性進行重復設置看似多余,但卻可以使應用程序能更多的對數(shù)據(jù)的保護屬性實行有效控制。MapViewOfFile()函數(shù)允許全部或部分映射文件,在映射時,需要指定數(shù)據(jù)文件的偏移地址以及待映射的長度。其中,文件的偏移地址由DWORD型的參數(shù)dwFileOffsetHighdwFileOffsetLow組成的64位值來指定,而且必須是操作系統(tǒng)的分配粒度的整數(shù)倍,對于Windows操作系統(tǒng),分配粒度固定為64KB。當然,也可以通過如下代碼來動態(tài)獲取當前操作系統(tǒng)的分配粒度:

            SYSTEM_INFO sinf;

            GetSystemInfo(&sinf);

            DWORD dwAllocationGranularity = sinf.dwAllocationGranularity;

            參數(shù)dwNumberOfBytesToMap指定了數(shù)據(jù)文件的映射長度,這里需要特別指出的是,對于Windows 9x操作系統(tǒng),如果MapViewOfFile()無法找到足夠大的區(qū)域來存放整個文件映射對象,將返回空值(NULL);但是在Windows 2000下,MapViewOfFile()只需要為必要的視圖找到足夠大的一個區(qū)域即可,而無須考慮整個文件映射對象的大小。

            在完成對映射到進程地址空間區(qū)域的文件處理后,需要通過函數(shù)UnmapViewOfFile()完成對文件數(shù)據(jù)映像的釋放,該函數(shù)原型聲明如下:

            BOOL UnmapViewOfFile(LPCVOID lpBaseAddress);

            唯一的參數(shù)lpBaseAddress指定了返回區(qū)域的基地址,必須將其設定為MapViewOfFile()的返回值。在使用了函數(shù)MapViewOfFile()之后,必須要有對應的UnmapViewOfFile()調用,否則在進程終止之前,保留的區(qū)域將無法釋放。除此之外,前面還曾由CreateFile()CreateFileMapping()函數(shù)創(chuàng)建過文件內核對象和文件映射內核對象,在進程終止之前有必要通過CloseHandle()將其釋放,否則將會出現(xiàn)資源泄漏的問題。

            除了前面這些必須的API函數(shù)之外,在使用內存映射文件時還要根據(jù)情況來選用其他一些輔助函數(shù)。例如,在使用內存映射文件時,為了提高速度,系統(tǒng)將文件的數(shù)據(jù)頁面進行高速緩存,而且在處理文件映射視圖時不立即更新文件的磁盤映像。為解決這個問題可以考慮使用FlushViewOfFile()函數(shù),該函數(shù)強制系統(tǒng)將修改過的數(shù)據(jù)部分或全部重新寫入磁盤映像,從而可以確保所有的數(shù)據(jù)更新能及時保存到磁盤。

            用內存映射文件處理大文件應用示例

            下面結合一個具體的實例來進一步講述內存映射文件的使用方法。該實例從端口接收數(shù)據(jù),并實時將其存放于磁盤,由于數(shù)據(jù)量大(幾十GB),在此選用內存映射文件進行處理。下面給出的是位于工作線程MainProc中的部分主要代碼,該線程自程序運行時啟動,當端口有數(shù)據(jù)到達時將會發(fā)出事件hEvent[0]WaitForMultipleObjects()函數(shù)等待到該事件發(fā)生后將接收到的數(shù)據(jù)保存到磁盤,如果終止接收將發(fā)出事件hEvent[1],事件處理過程將負責完成資源的釋放和文件的關閉等工作。下面給出此線程處理函數(shù)的具體實現(xiàn)過程:

            ……

            // 創(chuàng)建文件內核對象,其句柄保存于hFile

            HANDLE hFile = CreateFile("Recv1.zip",

            GENERIC_WRITE | GENERIC_READ,

            FILE_SHARE_READ,

            NULL,

            CREATE_ALWAYS,

            FILE_FLAG_SEQUENTIAL_SCAN,

            NULL);

             

            // 創(chuàng)建文件映射內核對象,句柄保存于hFileMapping

            HANDLE hFileMapping = CreateFileMapping(hFile,NULL,PAGE_READWRITE,

            0, 0x4000000, NULL);

            // 釋放文件內核對象

            CloseHandle(hFile);

             

            // 設定大小、偏移量等參數(shù)

            __int64 qwFileSize = 0x4000000;

            __int64 qwFileOffset = 0;

            __int64 T = 600 * sinf.dwAllocationGranularity;

            DWORD dwBytesInBlock = 1000 * sinf.dwAllocationGranularity;

             

            // 將文件數(shù)據(jù)映射到進程的地址空間

            PBYTE pbFile = (PBYTE)MapViewOfFile(hFileMapping,

            FILE_MAP_ALL_ACCESS,

            (DWORD)(qwFileOffset>>32), (DWORD)(qwFileOffset&0xFFFFFFFF), dwBytesInBlock);

            while(bLoop)

            {

            // 捕獲事件hEvent[0]和事件hEvent[1]

            DWORD ret = WaitForMultipleObjects(2, hEvent, FALSE, INFINITE);

            ret -= WAIT_OBJECT_0;

            switch (ret)

            {

            // 接收數(shù)據(jù)事件觸發(fā)

            case 0:

            // 從端口接收數(shù)據(jù)并保存到內存映射文件

            nReadLen=syio_Read(port[1], pbFile + qwFileOffset, QueueLen);

            qwFileOffset += nReadLen;

             

            // 當數(shù)據(jù)寫滿60%時,為防數(shù)據(jù)溢出,需要在其后開辟一新的映射視圖

            if (qwFileOffset > T)

            {

            T = qwFileOffset + 600 * sinf.dwAllocationGranularity;

            UnmapViewOfFile(pbFile);

            pbFile = (PBYTE)MapViewOfFile(hFileMapping,

            FILE_MAP_ALL_ACCESS,

            (DWORD)(qwFileOffset>>32), (DWORD)(qwFileOffset&0xFFFFFFFF), dwBytesInBlock);

            }

            break;

             

            // 終止事件觸發(fā)

            case 1:

            bLoop = FALSE;

             

            // 從進程的地址空間撤消文件數(shù)據(jù)映像

            UnmapViewOfFile(pbFile);

             

            // 關閉文件映射對象

            CloseHandle(hFileMapping);

            break;

            }

            }

            在終止事件觸發(fā)處理過程中如果只簡單的執(zhí)行UnmapViewOfFile()CloseHandle()函數(shù)將無法正確標識文件的實際大小,即如果開辟的內存映射文件為30GB,而接收的數(shù)據(jù)只有14GB,那么上述程序執(zhí)行完后,保存的文件長度仍是30GB。也就是說,在處理完成后還要再次通過內存映射文件的形式將文件恢復到實際大小,下面是實現(xiàn)此要求的主要代碼:

            // 創(chuàng)建另外一個文件內核對象

            hFile2 = CreateFile("Recv.zip",

            GENERIC_WRITE | GENERIC_READ,

            FILE_SHARE_READ,

            NULL,

            CREATE_ALWAYS,

            FILE_FLAG_SEQUENTIAL_SCAN,

            NULL);

             

            // 以實際數(shù)據(jù)長度創(chuàng)建另外一個文件映射內核對象

            hFileMapping2 = CreateFileMapping(hFile2,

            NULL,

            PAGE_READWRITE,

            0,

            (DWORD)(qwFileOffset&0xFFFFFFFF),

            NULL);

             

            // 關閉文件內核對象

            CloseHandle(hFile2);

             

            // 將文件數(shù)據(jù)映射到進程的地址空間

            pbFile2 = (PBYTE)MapViewOfFile(hFileMapping2,

            FILE_MAP_ALL_ACCESS,

            0, 0, qwFileOffset);

             

            // 將數(shù)據(jù)從原來的內存映射文件復制到此內存映射文件

            memcpy(pbFile2, pbFile, qwFileOffset);

             

            file://從進程的地址空間撤消文件數(shù)據(jù)映像

            UnmapViewOfFile(pbFile);

            UnmapViewOfFile(pbFile2);

             

            // 關閉文件映射對象

            CloseHandle(hFileMapping);

            CloseHandle(hFileMapping2);

             

            // 刪除臨時文件

            DeleteFile("Recv1.zip");

            結論

            經實際測試,內存映射文件在處理大數(shù)據(jù)量文件時表現(xiàn)出了良好的性能,比通常使用CFile類和ReadFile()WriteFile()等函數(shù)的文件處理方式具有明顯的優(yōu)勢。本文所述代碼在Windows 98下由Microsoft Visual C++ 6.0編譯通過。

            posted on 2009-03-12 12:10 肥仔 閱讀(932) 評論(0)  編輯 收藏 引用 所屬分類: Windows開發(fā)

            久久精品亚洲男人的天堂| 久久综合狠狠综合久久| 久久久久香蕉视频| 亚洲中文字幕无码久久2020| 色偷偷888欧美精品久久久| 青青热久久国产久精品 | 亚洲精品美女久久久久99小说| 久久久久久午夜成人影院| 国产精品成人久久久久三级午夜电影| 久久久久久久91精品免费观看| 777米奇久久最新地址| 久久国产劲爆AV内射—百度| 国产视频久久| 狠狠色丁香婷婷综合久久来 | 久久精品蜜芽亚洲国产AV| 人人狠狠综合久久亚洲| 7国产欧美日韩综合天堂中文久久久久 | 久久国产免费| 青青草原1769久久免费播放| 久久久久女人精品毛片| 欧美亚洲国产精品久久高清| 久久午夜无码鲁丝片午夜精品| 色综合久久久久网| 国产精品久久久久jk制服| 久久人人爽人人爽人人片AV东京热| 久久久久一级精品亚洲国产成人综合AV区| 久久精品无码一区二区无码| 久久综合香蕉国产蜜臀AV| 久久91精品国产91久| 中文字幕精品无码久久久久久3D日动漫| 亚洲国产精品一区二区久久| 亚洲国产精品人久久| 国产精品久久久久一区二区三区 | 久久久噜噜噜久久熟女AA片| 日韩精品久久久久久免费| 亚洲精品乱码久久久久久久久久久久 | 日韩人妻无码一区二区三区久久99| 久久精品国产亚洲精品| 国内精品久久久久影院老司| 精品久久久久久国产| 亚洲AV无码成人网站久久精品大|