阻塞、非阻塞、同步、異步 這四個概念很多人不能完全區別開,尤其是他們相互組合時同步阻塞,異步阻塞……
轉自:http://blog.chinaunix.net/uid-26606708-id-3175228.html
前4種模型的主要區別在于第一階段,因為它們的第二階段都是一樣的:在數據從內核緩沖區拷貝到進程緩沖區期間,進程阻塞與recvfrom這個系統調用中。
參考 Richard Stevens的“UNIX® Network Programming Volume 1, Third Edition: The Sockets Networking”。
Stevens一共提出了五種 IO Model:
- blocking IO
- nonblocking IO
- IO multiplexing (select and poll)
- signal driven IO (SIGIO)
- asynchronous IO (the POSIX aio_functions)
先說一下IO發生時所涉及的對象和步驟。
一個輸入操作通常包括下面兩個階段:
- 等待數據準備好 (Waiting for the data to be ready)。對于一個套接口上的輸入操作,通常涉及等待數據從網絡到達,到達后它被拷貝到內核的某個緩沖區。
- 將數據從內核緩存區拷貝到進程緩沖區中 (Copying the data from the kernel to the process)
記住這兩個階段很重要,因為以下要討論的五種IO Model的區別就是在兩個階段上各有不同的情況。
Blocking I/O Model(阻塞I/O)
默認情況下所有的套接口都是blocking。

進程調用recvfrom,其系統調用直到數據報到達(第一階段)且被拷貝到應用進程的緩沖區中(第二階段)或者發生錯誤(最常見的錯誤是系統調用被信號中斷)才返回。進程在從調用recvfrom開始到它返回的整個過程是被阻塞的。 recvfrom成功返回后,應用進程開始處理數據報。
Nonblocking I/O Model(非阻塞I/O)

前三次調用recvfrom時數據還沒準備好,這是內核立即返回一個EWOULDBLOCK錯誤。第四次調用recvfrom時數據已準備好,它被拷貝到應用進程緩沖區,recvfrom接著成功返回,然后應用進程開始處理數據報。
這里最關鍵的一個操作就是輪詢(polling)。應用進程持續輪詢內核,以查看數據是否就緒。這樣做往往會耗費大量的CPU時間,這種模型通常會在專門提供某種功能的系統才有。
I/O Multiplexing Model(I/O復用模型)

當用戶進程調用了select,那么整個進程會被block,而同時,kernel會“監視”所有select負責的socket,當任何一個 socket中的數據準備好了,select就會返回套接字可讀這個條件,我們調用recvfrom把所讀數據報拷貝到應用程序進程緩沖區。
和blocking IO的圖比較,I/O復用并沒有顯示出什么優勢。事實上,可能稍有劣勢。因為這里需要使用兩個system call (select 和 recvfrom),而blocking IO只調用了一個system call。但是,用select的優勢在于它可以同時處理多個connection。(peakflys注: 常用的服務器網絡模型即是 多路復用IO調度+非阻塞fd+線程池)
Signal-Driven I/O Model(信號驅動I/O模型)

我們首先開啟套接口的信號驅動I/O功能,并通過sigaction系統調用安裝一個信號處理函數。該系統調用將立即返回,我們的進程這是并沒有被阻塞,而是繼續執行。當數據報準備好讀取時,內核就為該進程產生一個SIGIO信號。我們隨后既可以在信號處理函數中調用recvfrom讀取數據報,并通知主循環數據已準備好待處理,也可以立即通知主循環,讓它來讀取數據報。無論如何處理SIGIO信號,這種模型的優勢在于等待數據報到達(第一階段)期間,進程可以繼續執行,不被阻塞。
Asynchronous I/O Model(異步I/O模型)

進程發起read操作之后,立刻就可以開始去做其它的事。而另一方面,從kernel的角度,當它受到一個asynchronous read之后,首先它會立刻返回,所以不會對用戶進程產生任何block。然后,kernel會等待數據準備完成,然后將數據拷貝到用戶內存,當這一切都完成之后,kernel會給用戶進程發送一個signal,告訴它read操作完成了。
這個模型工作機制是:告訴內核啟動某個操作,并讓內核在整個操作(包括第二階段,即將數據從內核拷貝到進程緩沖區中)完成后通知我們。
這種模型和前一種模型區別在于:信號驅動I/O是由內核通知我們何時可以啟動一個I/O操作,而異步I/O模型是由內核通知我們I/O操作何時完成。
五種I/O模型介紹完了,下面來說說blocking和non-blocking的區別在哪,synchronous IO和asynchronous IO的區別在哪。
blocking I/Ovs non-blocking I/O :調用blocking IO會一直block住對應的進程直到操作完成,而non-blocking IO在kernel還準備數據的情況下會立刻返回。
synchronous I/O vs asynchronous I/O:
先看看這兩個定義:
A synchronous I/O operation causes the requesting process to be blocked until that I/O operation completes;
An asynchronous I/O operation does not cause the requesting process to be blocked;
兩者的區別就在于synchronous IO做”IO operation”的時候會將process阻塞。按照這個定義,之前所述前四種模型blocking I/O,non-blocking I/O,IO multiplexing,signal driven IO都屬于synchronous IO。有人可能會說,non-blocking IO并沒有被block啊。這里有個非常“狡猾”的地方,定義中所指的”IO operation”是指真實的IO操作,就是例子中的recvfrom這個system call。non-blocking IO在執行recvfrom這個system call的時候,如果kernel的數據沒有準備好,這時候不會block進程。但是,當kernel中數據準備好的時候,recvfrom會將數據從 kernel拷貝到用戶內存中,這個時候(第二階段)進程是被block了,在這段時間內,進程是被block的。而asynchronous IO則不一樣,當進程發起IO 操作之后,就直接返回再也不理睬了,直到kernel發送一個信號,告訴進程說IO完成。在這整個過程中,進程完全沒有被block。
各個IO Model的比較如圖所示:

前4種模型的主要區別在于第一階段,因為它們的第二階段都是一樣的:在數據從內核緩沖區拷貝到進程緩沖區期間,進程阻塞與recvfrom這個系統調用中。
(peakflys注:異步調用需要指定回調函數或者信號處理函數,所以和其他幾個模型的函數調用有明顯不同,linux下的異步調用庫有兩套,一套是linux內核提供的,一套是glibc提供的,前者執行異步調用時是進入系統內核,統一有IO調度器調度,后者是在調用進程里生成一個新的線程執行異步操作,同fd的異步操作在同一個線程執行)