Linux I/O模型
- 阻塞式I/O模型
- 非阻塞式I/O模型
- I/O復用式模型
- 信號驅動式I/O模型
- 異步I/O模型
同步I/O與異步I/O的區(qū)別
對于I/O操作有兩個對象哗咆,一個是調用I/O操作的應用進程,一個是Linux系統(tǒng)內核益眉。當進程發(fā)起read操作晌柬,通常包含有兩個不同的階段。
- 等待數(shù)據就緒(可讀)
- 將數(shù)據從內核復制到進程(用戶空間)
I/O模型的區(qū)別就是在這兩個階段上有不同的情況呜叫。
同步I/O操作(synchronous I/O operation)會導致進程被阻塞,直到I/O操作完成空繁。參照《unix網絡編程》殿衰,里面提到的5中I/O模型里面其中4中都是同步I/O模型朱庆,分別是阻塞式/O模型、非阻塞式I/O模型闷祥、I/O復用模型娱颊、信號驅動式I/O模型,因為里面真正的I/O操作將阻塞進程凯砍。
異步I/O操作(asynchronous I/O operation)不導致進程阻塞箱硕。
同步I/O和異步I/O的真正的區(qū)別是真正的I/O操作是否會導致進程阻塞。具體表現(xiàn)為同步I/O需要進程真正的操作I/O,而異步I/O等待內核完成I/O操作后悟衩,再通知應用程序結果剧罩。
阻塞式I/O模型
如圖所示,recvfrom函數(shù)為系統(tǒng)調用座泳,因為我們要區(qū)分到底是應用進程還是系統(tǒng)內核惠昔。進程調用recvfrom函數(shù)幕与,系統(tǒng)調用直到數(shù)據報準備好且被復制到應用進程的緩沖區(qū)(用戶空間)或者發(fā)送錯誤才返回。應用進程在調用recvfrom函數(shù)到返回這段期間都是被阻塞的镇防。recvfrom函數(shù)返回成功后啦鸣,應用進程才開始處理數(shù)據報。
非阻塞式I/O模型
進程把一個套接字設置成非阻塞是在通知內核:當所請求的I/O操作非得把本進程投入睡眠才能完成時来氧,不要把本進程投入睡眠诫给,而是返回一個錯誤。
前三次調用recvfrom時沒數(shù)據返回啦扬,因而內核返回ewouldblock錯誤中狂。第四次調用recvfrom時已有一個數(shù)據報準備好,它被復制進應用進程緩沖區(qū)扑毡,于是recvfrom成功返回后吃型,應用進程處理數(shù)據報。
當一個應用程序對非阻塞描述符循環(huán)調用recvfrom時僚楞,我們稱之為輪詢(polling)勤晚。應用程序持續(xù)輪詢內核,查看某個操作是否就緒泉褐,往往耗費了大量的CPU時間赐写。
I/O復用模型
關于I/O復用模型,一個通俗的解釋是是“事件驅動”膜赃。操作系統(tǒng)為你提供了一個功能挺邀,當你的某個socket可讀或者可寫時,它可以給你一個通知跳座。這樣配合非阻塞的socket使用時端铛,只有當系統(tǒng)通知應用程序哪個描述符可讀時,應用程序才去執(zhí)行read操作疲眷,可以保證每次read都能讀到有效的數(shù)據而不用純返回-1或者是EAGAIN的無用功禾蚕。操作系統(tǒng)是是通過select/poll/epoll/kqueue之類的系統(tǒng)調用函數(shù)來實現(xiàn)的。這些函數(shù)都可以同時監(jiān)視多個描述符的就緒狀況狂丝。
多路復用是指使用一個線程來檢查多個文件描述符(Socket)的就緒狀態(tài)换淆,比如調用select和poll函數(shù),傳入多個文件描述符(FileDescription几颜,簡稱FD)倍试,如果有一個文件描述符(FileDescription)就緒,則返回蛋哭,否則阻塞直到超時县习。得到就緒狀態(tài)后進行真正的操作可以在同一個線程里執(zhí)行,也可以啟動線程執(zhí)行(比如使用線程池)。
有了I/O復用(I/O multiplexing)躁愿,我們就可以調用select或poll哈蝇,阻塞在這兩個系統(tǒng)調用中的某一個之上,而不是阻塞在真正的I/O系統(tǒng)調用上攘已。下圖概括展示了I/O復用模型:
我們阻塞于select調用炮赦,等待數(shù)據報套接字變?yōu)榭勺x。當select返回套接字可讀這一條件時样勃,我們調用recvfrom把所讀數(shù)據報復制到應用進程緩沖區(qū)吠勘。
I/O復用并不顯得有什么優(yōu)勢,事實上由于使用select需要兩個而不是單個系統(tǒng)調用峡眶,I/O復用還稍有劣勢剧防。不過select的優(yōu)勢在于可以等待多個描述符就緒(與此相對應的方法是多線程+阻塞式I/O,即由每一個線程來調用阻塞式I/O系統(tǒng)調用)辫樱。
信號驅動式I/O模型
讓內核在描述符就緒時發(fā)送SIGIO信號給信號處理程序通知應用程序峭拘。這種模型為信號驅動式I/O模型。
首先開啟套接字的信號驅動式I/O功能狮暑,并通過sigaction系統(tǒng)調用安裝一個信號處理函數(shù)聪全。該系統(tǒng)調用立即返回绍撞,我們的進程繼續(xù)工作犀忱,也就是程序并沒有被阻塞坡垫。當數(shù)據報準備好讀取時,內核為該進程產生一個SIGIO信號缔逛。我們可以直接在信號處理函數(shù)中調用recvfrom讀取數(shù)據報备埃,并通知主循環(huán)數(shù)據已準備好待處理,也可以立即通知主循環(huán)褐奴,讓它讀取數(shù)據報按脚。
無論如何處理SIGIO信號,這種模型的優(yōu)勢是在于等待數(shù)據到達期間進程不會被阻塞敦冬。主線程可以繼續(xù)執(zhí)行辅搬,只要等待來自信號處理函數(shù)的通知:即可以是數(shù)據報已準備好被處理,也可以是數(shù)據報準備好被讀取匪补。
異步I/O模型
異步I/O模型(asynchronous I/O)由POSIX規(guī)范定義伞辛。異步I/O的工作機制是告知內核啟動某個操作烂翰,并讓內核在整個操作(包括把數(shù)據從內核復制到應用的緩沖區(qū))完成后通知我們夯缺。這種模型與前面介紹的信號驅動模型的主要的區(qū)別是:信號驅動I/O告知我們何時可以啟動一個I/O操作,而異步I/O模型告知我們I/O操作何時完成甘耿。
我們調用aio_read函數(shù)踊兜,給內核傳遞描述符、緩沖區(qū)指針佳恬、緩沖區(qū)大小和文件偏移捏境,并告訴內核當整個操作完成時如何通知我們于游。該系統(tǒng)調用立即返回,而且在等待I/O完成期間垫言,我們的進程并不會被阻塞贰剥。本例子中我們假設要求內核在操作完成后產生某個信號。該信號直到數(shù)據復制到應用進程緩沖區(qū)才產生筷频,這一點不同于驅動式I/O模型蚌成。