一、異步IO
對(duì)于應(yīng)用程序而言,有兩種類型的IO調(diào)用:即同步IO與異步IO。其本質(zhì)的區(qū)別是:同步IO會(huì)block當(dāng)前的調(diào)用線程,而異步IO則允許發(fā)起IO請(qǐng)求的調(diào)用線程繼續(xù)執(zhí)行,等到IO請(qǐng)求被處理后,會(huì)通知調(diào)用線程。在windows平臺(tái)上,應(yīng)用程序可以調(diào)用CreateFile API, 并通過設(shè)置FILE_FLAG_OVERLAPPED標(biāo)志來決定是否發(fā)起異步IO請(qǐng)求。
對(duì)于異步的IO請(qǐng)求,其最大的好處是:慢速的IO請(qǐng)求相對(duì)于應(yīng)用程序而言是異步執(zhí)行,這樣可以極大提高應(yīng)用程序的處理吞吐量。發(fā)起IO請(qǐng)求的應(yīng)用程序需要關(guān)心的是IO執(zhí)行完成的結(jié)果,而不必忙等IO請(qǐng)求執(zhí)行的過程。
事實(shí)上,無論對(duì)于同步IO,還是異步IO,當(dāng)IO請(qǐng)求發(fā)送到device driver后,device driver的執(zhí)行總是異步的,當(dāng)它接到IO請(qǐng)求之后,總會(huì)馬上返回給IO System。而IO System是否立即返回給調(diào)用線程,則取決于FILE_FLAG_OVERLAPPED標(biāo)志的設(shè)置,如下圖:

二、異步IO的同步問題。
我們使用異步IO,是為了提高應(yīng)用程序的處理吞吐量。但是,當(dāng)異步IO不再異步時(shí)(無論你是否設(shè)置FILE_FLAG_OVERLAPPED標(biāo)志),應(yīng)用程序的性能會(huì)受到極大的影響。根據(jù)Microsoft Knowledge Base 156932, 在下列幾種情況下,異步IO會(huì)失去它的異步性,而表現(xiàn)出同步的性質(zhì):
1)如果文件使用了NTFS compression壓縮,則system driver不會(huì)異步地存取這樣的文件。
2)擴(kuò)展文件長(zhǎng)度的IO操作不會(huì)是異步操作。
3)Cache機(jī)制。如果IO操作使用了file system cache,則這樣的IO操作會(huì)被當(dāng)成同步IO,而非異步IO。
即使你使用了FILE_FLAG_OVERLAPPED標(biāo)志。在這種情況下,
a.如果需要讀取的數(shù)據(jù)已經(jīng)在Cache里,那么I/O drivers會(huì)認(rèn)為這樣的IO請(qǐng)求可以被立即處理,其結(jié)果是ReadFile 或者WriteFile調(diào)用返回TRUE,表示是:同步處理完成。
b.如果需要讀取的數(shù)據(jù)不在Cache里,windows NT的file system是使用page-faulting機(jī)制來實(shí)現(xiàn)cache管理,而page-faulting總是被同步處理, Windows NT沒有提供異步的page-faulting機(jī)制。的確, file system driver使用了線程池來緩解這一問題,但是,當(dāng)應(yīng)用程序發(fā)起的IO請(qǐng)求足夠多時(shí),線程池還是不能應(yīng)付的。
在我們開發(fā)基于異步IO應(yīng)用程序時(shí),應(yīng)該避免上述問題的出現(xiàn),因?yàn)樗鼈儠?huì)使程序的性能大打折扣。
那么,對(duì)于Cache,我們?nèi)绾伪苊饽兀看鸢甘牵赫?qǐng)使用FILE_FLAG_NO_BUFFERING標(biāo)志。這個(gè)標(biāo)志會(huì)使異步IO真實(shí)地異步執(zhí)行。
三、性能的測(cè)試數(shù)據(jù)(僅供參考)。
我在我的機(jī)器上,簡(jiǎn)單地對(duì)使用FILE_FLAG_NO_BUFFERING標(biāo)志的異步IO,與不使用FILE_FLAG_NO_BUFFERING標(biāo)志的異步IO進(jìn)行了對(duì)比。
操作:順序讀取1G的文件。
x軸表示:每次讀取的字節(jié)數(shù)(單位:K/每次)
Y軸表示:讀取完成所需要的時(shí)間。(單位:millisecond)
注意:每次測(cè)試讀取的內(nèi)容總數(shù)是相等的(1000M)。
例如:如果每次讀取128k,則需要讀取8000次(128k*8000 = 1000M)。
如果每次讀取256k,則需要讀取4000次(256k*4000 = 1000M)。
粉紅色的線沒有使用FILE_FLAG_NO_BUFFERING標(biāo)志,而黃色的線使用了FILE_FLAG_NO_BUFFERING標(biāo)志。

從以上的數(shù)據(jù),我們可以得出以下結(jié)論:
1) 當(dāng)使用FILE_FLAG_NO_BUFFERING標(biāo)志,應(yīng)用程序的性能會(huì)極大提高,大概有50%的提高。
2)在使用異步IO的時(shí)候,還有一個(gè)注意的問題是:當(dāng)你每次讀取的字節(jié)數(shù)增大的時(shí)候,性能也會(huì)提高。尤其在小于1024k時(shí),當(dāng)增大次讀取的字節(jié)數(shù),性能都有明顯的提高。在混合了網(wǎng)絡(luò)傳輸?shù)葟?fù)雜因素的應(yīng)用程序開發(fā)過程中,建議將該值設(shè)置為可配置的參數(shù),通過調(diào)整該參數(shù),使你的應(yīng)用達(dá)到最好的性能。
參考資料:
1) Microsoft Knowledge Base 156932
2) Microsoft Windows Internals, Fourth Edition.