File文件操作(二):內(nèi)存映射

基本概述

文件操作是應用程序最為基本的功能之一,Win32 API和MFC均提供有支持文件處理的函數(shù)和類乖杠,常用的有Win32 API的CreateFile()碾局、WriteFile()、ReadFile()和MFC提供的CFile類等芽唇。一般來說塘匣,以上這些函數(shù)可以滿足大多數(shù)場合的要求脓豪,但是對于某些特殊應用領(lǐng)域所需要的動輒幾十GB、幾百GB馆铁、乃至幾TB的海量存儲跑揉,再以通常的文件處理方法進行處理顯然是行不通的。目前埠巨,對于上述這種大文件的操作一般是以內(nèi)存映射文件的方式來加以處理的。

內(nèi)存映射文件是由一個文件到進程地址空間的映射现拒。Win32中辣垒,每個進程有自己的地址空間,一個進程不能輕易地訪問另一個進程地址空間中的數(shù)據(jù)印蔬,所以不能像16位Windows那樣做勋桶。Win32系統(tǒng)允許多個進程(運行在同一計算機上)使用內(nèi)存映射文件來共享數(shù)據(jù)。實際上侥猬,其他共享和傳送數(shù)據(jù)的技術(shù)例驹,諸如使用SendMessage或者PostMessage,都在內(nèi)部使用了內(nèi)存映射文件退唠。 [1]

編輯本段數(shù)據(jù)共享

文件數(shù)據(jù)共享

這種數(shù)據(jù)共享是讓兩個或多個進程映射同一文件映射對象的視圖鹃锈,即它們在共享同一物理存儲頁。這樣瞧预,當一個進程向內(nèi)存映射文件的一個視圖寫入數(shù)據(jù)時屎债,其他的進程立即在自己的視圖中看到變化。 注意垢油,對文件映射對象要使用同一名字盆驹。

訪問方法

這樣,文件內(nèi)的數(shù)據(jù)就可以用內(nèi)存讀/寫指令來訪問滩愁,而不是用ReadFile和WriteFile這樣的I/O系統(tǒng)函數(shù)躯喇,從而提高了文件存取速度。

編輯本段范圍應用

適用范圍

這種函數(shù)最適用于需要讀取文件并且對文件內(nèi)包含的信息做 語法分析的應用程序硝枉,如:對輸入文件進行語法分析的彩色語法編輯器廉丽,編譯器等倦微。

把文件映射后進行讀和分析,能讓應用程序使用內(nèi)存操作來操縱文件雅倒,而不必在文件里來回地讀璃诀、寫、移動文件指針蔑匣。

應用

有些操作劣欢,如放棄“讀”一個字符,在以前是相當復雜的裁良,用戶需要處理緩沖區(qū)的刷新問題凿将。在引入了映射文件之后,就簡單的多了价脾。應用程序要做的只是使指針減少一個值牧抵。

映射文件的另一個重要應用就是用來支持永久命名的共享內(nèi)存。要在兩個應用程序之間共享內(nèi)存侨把,可以在一個應用程序中創(chuàng)建一個文件并映射之犀变,然后另一個應用程序可以通過打開和映射此文件把它作為共享的內(nèi)存來使用。VC++使用內(nèi)存映射文件處理大文件

編輯本段內(nèi)存文件

內(nèi)存映射文件與虛擬內(nèi)存有些類似秋柄,通過內(nèi)存映射文件可以保留一個地址空間的區(qū)域获枝,同時將物理存儲器提交給此區(qū)域,只是內(nèi)存文件映射的物理存儲器來自一個已經(jīng)存在于磁盤上的文件骇笔,而非系統(tǒng)的頁文件省店,而且在對該文件進行操作之前必須首先對文件進行映射,就如同將整個文件從磁盤加載到內(nèi)存笨触。由此可以看出懦傍,使用內(nèi)存映射文件處理存儲于磁盤上的文件時,將不必再對文件執(zhí)行I/O操作芦劣,這意味著在對文件進行處理時將不必再為文件申請并分配緩存粗俱,所有的文件緩存操作均由系統(tǒng)直接管理,由于取消了將文件數(shù)據(jù)加載到內(nèi)存持寄、數(shù)據(jù)從內(nèi)存到文件的回寫以及釋放內(nèi)存塊等步驟源梭,使得內(nèi)存映射文件在處理大數(shù)據(jù)量的文件時能起到相當重要的作用。另外稍味,實際工程中的系統(tǒng)往往需要在多個進程之間共享數(shù)據(jù)废麻,如果數(shù)據(jù)量小,處理方法是靈活多變的模庐,如果共享數(shù)據(jù)容量巨大烛愧,那么就需要借助于內(nèi)存映射文件來進行。實際上,內(nèi)存映射文件正是解決本地多個進程間數(shù)據(jù)共享的最有效方法怜姿。

內(nèi)存映射文件并不是簡單的文件I/O操作慎冤,實際用到了Windows的核心編程技術(shù)-- 內(nèi)存管理。所以沧卢,如果想對內(nèi)存映射文件有更深刻的認識蚁堤,必須對Windows操作系統(tǒng)的內(nèi)存管理機制有清楚的認識,下面給出使用內(nèi)存映射文件的一般方法:

首先要通過CreateFile()函數(shù)來創(chuàng)建或打開一個文件 內(nèi)核對象但狭,這個對象標識了磁盤上將要用作內(nèi)存映射文件的文件披诗。在用CreateFile()將文件映像在物理存儲器的位置通告給操作系統(tǒng)后,只指定了映像文件的路徑立磁,映像的長度還沒有指定呈队。為了指定文件映射對象需要多大的物理存儲空間還需要通過CreateFileMapping()函數(shù)來創(chuàng)建一個文件映射內(nèi)核對象以告訴系統(tǒng)文件的尺寸以及訪問文件的方式。在創(chuàng)建了文件映射對象后唱歧,還必須為文件數(shù)據(jù)保留一個地址空間區(qū)域宪摧,并把文件數(shù)據(jù)作為映射到該區(qū)域的物理存儲器進行提交。由MapViewOfFile()函數(shù)負責通過系統(tǒng)的管理而將文件映射對象的全部或部分映射到進程地址空間颅崩。此時几于,對內(nèi)存映射文件的使用和處理同通常加載到內(nèi)存中的文件數(shù)據(jù)的處理方式基本一樣,在完成了對內(nèi)存映射文件的使用時沿后,還要通過一系列的操作完成對其的清除和使用過資源的釋放孩革。這部分相對比較簡單,可以通過UnmapViewOfFile()完成從進程的地址空間撤消文件數(shù)據(jù)的映像得运、通過CloseHandle()關(guān)閉前面創(chuàng)建的文件映射對象和文件對象。

編輯本段相關(guān)函數(shù)

在使用內(nèi)存映射文件時锅移,所使用的API函數(shù)主要就是前面提到過的那幾個函數(shù)熔掺,下面分別對其進行介紹:

HANDLE CreateFile(LPCTSTR lpFileName,DWORD dwDesiredAccess,DWORD dwShareMode,LPSECURITY_ATTRIBUTES lpSecurityAttributes,DWORD dwCreationDisposition,DWORD dwFlagsAndAttributes,HANDLE hTemplateFile);

函數(shù)CreateFile()即使是在普通的文件操作時也經(jīng)常用來創(chuàng)建、打開文件非剃,在處理內(nèi)存映射文件時置逻,該函數(shù)來創(chuàng)建/打開一個文件內(nèi)核對象,并將其句柄返回备绽,在調(diào)用該函數(shù)時需要根據(jù)是否需要數(shù)據(jù)讀寫和文件的共享方式來設(shè)置參數(shù)dwDesiredAccess和dwShareMode券坞,錯誤的參數(shù)設(shè)置將會導致相應操作時的失敗。

HANDLE CreateFileMapping(HANDLE hFile,LPSECURITY_ATTRIBUTES lpFileMappingAttributes,DWORD flProtect,DWORD dwMaximumSizeHigh,DWORD dwMaximumSizeLow,LPCTSTR lpName);

CreateFileMapping()函數(shù)創(chuàng)建一個文件映射內(nèi)核對象肺素,通過參數(shù)hFile指定待映射到進程地址空間的文件句柄(該句柄由CreateFile()函數(shù)的返回值獲群廾)。由于內(nèi)存映射文件的物理存儲器實際是存儲于磁盤上的一個文件倍靡,而不是從系統(tǒng)的頁文件中分配的內(nèi)存猴伶,所以系統(tǒng)不會主動為其保留地址空間區(qū)域,也不會自動將文件的存儲空間映射到該區(qū)域,為了讓系統(tǒng)能夠確定對頁面采取何種保護屬性他挎,需要通過參數(shù)flProtect來設(shè)定筝尾,保護屬性PAGE_READONLY、PAGE_READWRITE和PAGE_WRITECOPY分別表示文件映射對象被映射后办桨,可以讀取筹淫、讀寫文件數(shù)據(jù)。在使用PAGE_READONLY時呢撞,必須確保CreateFile()采用的是GENERIC_READ參數(shù)损姜;PAGE_READWRITE則要求CreateFile()采用的是GENERIC_READ|GENERIC_WRITE參數(shù);至于屬性PAGE_WRITECOPY則只需要確保CreateFile()采用了GENERIC_READ和GENERIC_WRITE其中之一即可狸相。DWORD型的參數(shù)dwMaximumSizeHigh和dwMaximumSizeLow也是相當重要的薛匪,指定了文件的最大字節(jié)數(shù),由于這兩個參數(shù)共64位脓鹃,因此所支持的最大文件長度為16EB逸尖,幾乎可以滿足任何大數(shù)據(jù)量文件處理場合的要求。

LPVOID MapViewOfFile(HANDLE hFileMappingObject,DWORD dwDesiredAccess,DWORD dwFileOffsetHigh,DWORD dwFileOffsetLow,DWORD dwNumberOfBytesToMap);

MapViewOfFile()函數(shù)負責把文件數(shù)據(jù)映射到進程的地址空間瘸右,參數(shù)hFileMappingObject為CreateFileMapping()返回的文件映像對象句柄娇跟。參數(shù)dwDesiredAccess則再次指定了對文件數(shù)據(jù)的訪問方式,而且同樣要與CreateFileMapping()函數(shù)所設(shè)置的保護屬性相匹配太颤。雖然這里一再對保護屬性進行重復設(shè)置看似多余苞俘,但卻可以使應用程序能更多的對數(shù)據(jù)的保護屬性實行有效控制。MapViewOfFile()函數(shù)允許全部或部分映射文件龄章,在映射時吃谣,需要指定數(shù)據(jù)文件的 偏移地址以及待映射的長度。其中做裙,文件的偏移地址由DWORD型的參數(shù)dwFileOffsetHigh和dwFileOffsetLow組成的64位值來指定岗憋,而且必須是操作系統(tǒng)的分配粒度的整數(shù)倍,對于Windows操作系統(tǒng)锚贱,分配粒度固定為64KB仔戈。當然,也可以通過如下代碼來動態(tài)獲取當前操作系統(tǒng)的分配粒度:

SYSTEM_INFO sinf;GetSystemInfo(&sinf);DWORD dwAllocationGranularity = sinf.dwAllocationGranularity;

參數(shù)dwNumberOfBytesToMap指定了數(shù)據(jù)文件的映射長度拧廊,這里需要特別指出的是监徘,對于Windows 9x操作系統(tǒng),如果MapViewOfFile()無法找到足夠大的區(qū)域來存放整個文件映射對象吧碾,將返回空值(NULL)凰盔;但是在Windows 2000下,MapViewOfFile()只需要為必要的視圖找到足夠大的一個區(qū)域即可滤港,而無須考慮整個文件映射對象的大小廊蜒。

在完成對映射到進程地址空間區(qū)域的文件處理后趴拧,需要通過函數(shù)UnmapViewOfFile()完成對文件數(shù)據(jù)映像的釋放,該函數(shù)原型聲明如下:

BOOL UnmapViewOfFile(LPCVOID lpBaseAddress);

唯一的參數(shù)lpBaseAddress指定了返回區(qū)域的基地址山叮,必須將其設(shè)定為MapViewOfFile()的返回值著榴。在使用了函數(shù)MapViewOfFile()之后,必須要有對應的UnmapViewOfFile()調(diào)用屁倔,否則在進程終止之前脑又,保留的區(qū)域?qū)o法釋放。除此之外锐借,前面還曾由CreateFile()和CreateFileMapping()函數(shù)創(chuàng)建過文件內(nèi)核對象和文件映射內(nèi)核對象问麸,在進程終止之前有必要通過CloseHandle()將其釋放,否則將會出現(xiàn)資源泄漏的問題钞翔。

除了前面這些必須的API函數(shù)之外严卖,在使用內(nèi)存映射文件時還要根據(jù)情況來選用其他一些輔助函數(shù)。例如布轿,在使用內(nèi)存映射文件時哮笆,為了提高速度,系統(tǒng)將文件的數(shù)據(jù)頁面進行高速緩存汰扭,而且在處理文件映射視圖時不立即更新文件的磁盤映像稠肘。為解決這個問題可以考慮使用FlushViewOfFile()函數(shù),該函數(shù)強制系統(tǒng)將修改過的數(shù)據(jù)部分或全部重新寫入磁盤映像萝毛,從而可以確保所有的數(shù)據(jù)更新能及時保存到磁盤项阴。

編輯本段應用示例

下面結(jié)合一個具體的實例來進一步講述內(nèi)存映射文件的使用方法。該實例從端口接收數(shù)據(jù)笆包,并實時將其存放于磁盤环揽,由于數(shù)據(jù)量大(幾十GB),在此選用內(nèi)存映射文件進行處理庵佣。下面給出的是位于工作線程MainProc中的部分主要代碼薯演,該線程自程序運行時啟動,當端口有數(shù)據(jù)到達時將會發(fā)出事件hEvent[0]秧了,WaitForMultipleObjects()函數(shù)等待到該事件發(fā)生后將接收到的數(shù)據(jù)保存到磁盤,如果終止接收將發(fā)出事件hEvent[1]序无,事件處理過程將負責完成資源的釋放和文件的關(guān)閉等工作验毡。下面給出此線程處理函數(shù)的具體實現(xiàn)過程:

// 創(chuàng)建文件內(nèi)核對象,其句柄保存于hFile

HANDLE hFile = CreateFile("Recv1.zip",GENERIC_WRITE | GENERIC_READ,FILE_SHARE_READ,NULL,CREATE_ALWAYS,FILE_FLAG_SEQUENTIAL_SCAN,NULL);

// 創(chuàng)建文件映射內(nèi)核對象帝嗡,句柄保存于hFileMapping

HANDLE hFileMapping = CreateFileMapping(hFile,NULL,PAGE_READWRITE,0,0x4000000,NULL);

// 釋放文件內(nèi)核對象

CloseHandle(hFile);

// 設(shè)定大小晶通、偏移量等參數(shù)

__int64 qwFileSize = 0x4000000;

__int64 qwFileOffset = 0;

__int64 T = 600 * sinf.dwAllocationGranularity;

DWORD dwBytesInBlock = 1000 * sinf.dwAllocationGranularity;

// 將文件數(shù)據(jù)映射到進程的地址空間

PBYTE pbFile = (PBYTE)MapViewOfFile(hFileMapping,FILE_MAP_ALL_ACCESS,(DWORD)(qwFileOffset>>32),(DWORD)(qwFileOffset&0xFFFFFFFF),dwBytesInBlock);

while(bLoop)

{

// 捕獲事件hEvent[0]和事件hEvent[1]

DWORD ret = WaitForMultipleObjects(2,hEvent,FALSE,INFINITE);

ret -= WAIT_OBJECT_0;

switch (ret)

{

// 接收數(shù)據(jù)事件觸發(fā)

case 0:

// 從端口接收數(shù)據(jù)并保存到內(nèi)存映射文件

nReadLen=syio_Read(port[1],pbFile + qwFileOffset,QueueLen);

qwFileOffset += nReadLen;

// 當數(shù)據(jù)寫滿60%時,為防數(shù)據(jù)溢出哟玷,需要在其后開辟一新的映射視圖

if (qwFileOffset > T)

{

T = qwFileOffset + 600 * sinf.dwAllocationGranularity;UnmapViewOfFile(pbFile);

pbFile = (PBYTE)MapViewOfFile(hFileMapping,FILE_MAP_ALL_ACCESS,(DWORD)(qwFileOffset>>32),(DWORD)(qwFileOffset&0xFFFFFFFF),dwBytesInBlock);

}

break;

// 終止事件觸發(fā)

case 1:

bLoop = FALSE;

// 從進程的地址空間撤消文件數(shù)據(jù)映像

UnmapViewOfFile(pbFile);

// 關(guān)閉文件映射對象

CloseHandle(hFileMapping);

break;

}

}…

在終止事件觸發(fā)處理過程中如果只簡單的執(zhí)行UnmapViewOfFile()和CloseHandle()函數(shù)將無法正確標識文件的實際大小狮辽,即如果開辟的內(nèi)存映射文件為30GB一也,而接收的數(shù)據(jù)只有14GB,那么上述程序執(zhí)行完后喉脖,保存的文件長度仍是30GB椰苟。也就是說,在處理完成后還要再次通過內(nèi)存映射文件的形式將文件恢復到實際大小树叽,下面是實現(xiàn)此要求的主要代碼:

// 創(chuàng)建另外一個文件內(nèi)核對象

hFile2 = CreateFile("Recv.zip",GENERIC_WRITE | GENERIC_READ,FILE_SHARE_READ,NULL,CREATE_ALWAYS,FILE_FLAG_SEQUENTIAL_SCAN,NULL);

// 以實際數(shù)據(jù)長度創(chuàng)建另外一個文件映射內(nèi)核對象

hFileMapping2 = CreateFileMapping(hFile2,NULL,PAGE_READWRITE,0,(DWORD)(qwFileOffset&0xFFFFFFFF),NULL);

// 關(guān)閉文件內(nèi)核對象

CloseHandle(hFile2);

// 將文件數(shù)據(jù)映射到進程的地址空間

pbFile2 = (PBYTE)MapViewOfFile(hFileMapping2,FILE_MAP_ALL_ACCESS,0,0,qwFileOffset);

// 將數(shù)據(jù)從原來的內(nèi)存映射文件復制到此內(nèi)存映射文件

memcpy(pbFile2,pbFile,qwFileOffset);

file:

//從進程的地址空間撤消文件數(shù)據(jù)映像

UnmapViewOfFile(pbFile);

UnmapViewOfFile(pbFile2);

// 關(guān)閉文件映射對象

CloseHandle(hFileMapping);

CloseHandle(hFileMapping2);

// 刪除臨時文件

DeleteFile("Recv1.zip");

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末舆蝴,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子题诵,更是在濱河造成了極大的恐慌洁仗,老刑警劉巖,帶你破解...
    沈念sama閱讀 211,948評論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件性锭,死亡現(xiàn)場離奇詭異赠潦,居然都是意外死亡,警方通過查閱死者的電腦和手機草冈,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,371評論 3 385
  • 文/潘曉璐 我一進店門她奥,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人疲陕,你說我怎么就攤上這事方淤。” “怎么了蹄殃?”我有些...
    開封第一講書人閱讀 157,490評論 0 348
  • 文/不壞的土叔 我叫張陵携茂,是天一觀的道長。 經(jīng)常有香客問我诅岩,道長讳苦,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,521評論 1 284
  • 正文 為了忘掉前任吩谦,我火速辦了婚禮鸳谜,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘式廷。我一直安慰自己肴茄,他們只是感情好润樱,可當我...
    茶點故事閱讀 65,627評論 6 386
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般入热。 火紅的嫁衣襯著肌膚如雪幸乒。 梳的紋絲不亂的頭發(fā)上垃它,一...
    開封第一講書人閱讀 49,842評論 1 290
  • 那天迁霎,我揣著相機與錄音,去河邊找鬼俺陋。 笑死豁延,一個胖子當著我的面吹牛昙篙,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播诱咏,決...
    沈念sama閱讀 38,997評論 3 408
  • 文/蒼蘭香墨 我猛地睜開眼苔可,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了胰苏?” 一聲冷哼從身側(cè)響起硕蛹,我...
    開封第一講書人閱讀 37,741評論 0 268
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎硕并,沒想到半個月后法焰,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,203評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡倔毙,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,534評論 2 327
  • 正文 我和宋清朗相戀三年埃仪,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片陕赃。...
    茶點故事閱讀 38,673評論 1 341
  • 序言:一個原本活蹦亂跳的男人離奇死亡卵蛉,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出么库,到底是詐尸還是另有隱情傻丝,我是刑警寧澤,帶...
    沈念sama閱讀 34,339評論 4 330
  • 正文 年R本政府宣布诉儒,位于F島的核電站葡缰,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏忱反。R本人自食惡果不足惜泛释,卻給世界環(huán)境...
    茶點故事閱讀 39,955評論 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望温算。 院中可真熱鬧怜校,春花似錦、人聲如沸注竿。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,770評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽巩割。三九已至胰丁,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間喂分,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 32,000評論 1 266
  • 我被黑心中介騙來泰國打工机蔗, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留蒲祈,地道東北人甘萧。 一個月前我還...
    沈念sama閱讀 46,394評論 2 360
  • 正文 我出身青樓,卻偏偏與公主長得像梆掸,于是被迫代替她去往敵國和親扬卷。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 43,562評論 2 349

推薦閱讀更多精彩內(nèi)容