Linux IO模型
網(wǎng)絡(luò)IO的本質(zhì)就是socket的讀取像啼,socket在linux系統(tǒng)被抽象為流谱邪,IO可以理解為對(duì)流的操作邀杏。文章開(kāi)始的時(shí)候也提到了领追,對(duì)于一次IO訪問(wèn)(以read為例)他膳,數(shù)據(jù)會(huì)先被拷貝到操作系統(tǒng)內(nèi)核的緩沖區(qū),然后才會(huì)從操作系統(tǒng)內(nèi)核的緩沖區(qū)拷貝到應(yīng)用程序的地址空間中绒窑。所以說(shuō)棕孙,當(dāng)一個(gè)read操作發(fā)生時(shí),它會(huì)經(jīng)歷兩個(gè)階段:
第一個(gè)階段:等待數(shù)據(jù)準(zhǔn)備些膨。
第二個(gè)階段:將數(shù)據(jù)從內(nèi)核拷貝到進(jìn)程中
對(duì)于socket流而言:
第一步:通常涉及等待網(wǎng)絡(luò)上的數(shù)據(jù)分組到達(dá)蟀俊,然后復(fù)制到內(nèi)核的某個(gè)緩沖區(qū)。
第二步:把數(shù)據(jù)從內(nèi)核緩沖區(qū)復(fù)制到應(yīng)用進(jìn)程緩沖區(qū)订雾。
當(dāng)然肢预,如果內(nèi)核空間的緩沖區(qū)中已經(jīng)有數(shù)據(jù)了,那么就可以省略第一步洼哎。至于為什么不能直接讓磁盤(pán)控制器把數(shù)據(jù)送到應(yīng)用程序的地址空間中呢烫映?最簡(jiǎn)單的一個(gè)原因就是應(yīng)用程序不能直接操作底層硬件。
網(wǎng)絡(luò)應(yīng)用需要處理的無(wú)非就是兩大類(lèi)問(wèn)題谱净,網(wǎng)絡(luò)IO窑邦,數(shù)據(jù)計(jì)算。相對(duì)于后者壕探,網(wǎng)絡(luò)IO的延遲冈钦,給應(yīng)用帶來(lái)的性能瓶頸大于后者。網(wǎng)絡(luò)IO的模型大致分為如下五種:
1李请、阻塞IO ?(blocking I/O)
2瞧筛、非阻塞IO ?(nonblocking I/O)
3、多路復(fù)用IO ?(I/O multiplexing (select?and?poll and epoll))
4导盅、信號(hào)驅(qū)動(dòng)IO ?(signal driven I/O (SIGIO))
5较幌、異步IO ?(asynchronous I/O (the POSIX?aio_functions))
前四種都是同步,只有最后一種是異步IO白翻。下面的模型介紹先以生活中的例子來(lái)說(shuō)明概念:周末和女友去商場(chǎng)逛街乍炉,到了晚上飯點(diǎn)绢片,準(zhǔn)備吃完飯?jiān)偃ス浣郑侵苣┤硕嗟呵恚掳茁癸埖晷枰抨?duì)底循,于是有如下幾種方案可供選擇:
1、阻塞IO模型
場(chǎng)景描述:
在飯店領(lǐng)完號(hào)后槐瑞,前面還有n桌熙涤,不知道什么時(shí)候到我們,但是又不能離開(kāi)困檩,因?yàn)檫^(guò)號(hào)之后必須重新取號(hào)祠挫。只好在飯店里等,一直等到叫號(hào)到我們才吃完晚飯悼沿,然后去逛街等舔。中間等待的時(shí)間什么事情都不能做。
網(wǎng)絡(luò)模型:
在這個(gè)模型中显沈,應(yīng)用程序?yàn)榱藞?zhí)行這個(gè)read操作软瞎,會(huì)調(diào)用相應(yīng)的一個(gè)system call逢唤,將系統(tǒng)控制權(quán)交給內(nèi)核拉讯,然后就進(jìn)行等待(這個(gè)等待的過(guò)程就是被阻塞了),內(nèi)核開(kāi)始執(zhí)行這個(gè)system call鳖藕,執(zhí)行完畢后會(huì)向應(yīng)用程序返回響應(yīng)魔慷,應(yīng)用程序得到響應(yīng)后,就不再阻塞著恩,并進(jìn)行后面的工作院尔。
優(yōu)點(diǎn):
能夠及時(shí)返回?cái)?shù)據(jù),無(wú)延遲喉誊。
缺點(diǎn):
對(duì)用戶(hù)來(lái)說(shuō)處于等待就要付出性能代價(jià)邀摆。
2、非阻塞IO
場(chǎng)景描述:
等待過(guò)程是在太無(wú)聊伍茄,于是我們就去逛商場(chǎng)栋盹,每隔一段時(shí)間就回來(lái)詢(xún)問(wèn)服務(wù)員,叫號(hào)是否到我們了敷矫,整個(gè)過(guò)程來(lái)來(lái)回回好多次例获。這就是非阻塞,但是需要不斷的詢(xún)問(wèn)曹仗。
網(wǎng)絡(luò)模型:
當(dāng)用戶(hù)進(jìn)程發(fā)出read操作時(shí)榨汤,調(diào)用相應(yīng)的system call,這個(gè)system call會(huì)立即從內(nèi)核中返回怎茫。但是在返回的這個(gè)時(shí)間點(diǎn)收壕,內(nèi)核中的數(shù)據(jù)可能還沒(méi)有準(zhǔn)備好,也就是說(shuō)內(nèi)核只是很快就返回了system call,只有這樣才不會(huì)阻塞用戶(hù)進(jìn)程蜜宪,對(duì)于應(yīng)用程序旬渠,雖然這個(gè)IO操作很快就返回了,但是它并不知道這個(gè)IO操作是否真的成功了端壳,為了知道IO操作是否成功告丢,應(yīng)用程序需要主動(dòng)的循環(huán)去問(wèn)內(nèi)核。
優(yōu)點(diǎn):
能夠在等待的時(shí)間里去做其他的事情损谦。
缺點(diǎn):
任務(wù)完成的響應(yīng)延遲增大了岖免,因?yàn)槊窟^(guò)一段時(shí)間去輪詢(xún)一次read操作,而任務(wù)可能在兩次輪詢(xún)之間的任意時(shí)間完成照捡,這對(duì)導(dǎo)致整體數(shù)據(jù)吞吐量的降低颅湘。
3、IO多路復(fù)用
場(chǎng)景描述:
與第二個(gè)經(jīng)常類(lèi)似栗精,飯店安裝了電子屏幕闯参,顯示叫號(hào)的狀態(tài),所以在逛街的時(shí)候悲立,就不用去詢(xún)問(wèn)服務(wù)員鹿寨,而是看下大屏幕就可以了。(不僅僅是我們不用詢(xún)問(wèn)服務(wù)員薪夕,其他所有的人都可以不用詢(xún)問(wèn)服務(wù)員)
網(wǎng)絡(luò)模型:
和第二種一樣脚草,調(diào)用system call之后,并不等待內(nèi)核的返回結(jié)果而是立即返回原献。雖然返回結(jié)果的調(diào)用函數(shù)是一個(gè)異步的方式馏慨,但應(yīng)用程序會(huì)被像select、poll和epoll等具有多個(gè)文件描述符的函數(shù)阻塞住姑隅,一直等到這個(gè)system call有結(jié)果返回了写隶,再通知應(yīng)用程序。這種情況讲仰,從IO操作的實(shí)際效果來(lái)看慕趴,異步阻塞IO和第一種同步阻塞IO是一樣的,應(yīng)用程序都是一直等到IO操作成功之后(數(shù)據(jù)已經(jīng)被寫(xiě)入或者讀榷E獭)秩贰,才開(kāi)始進(jìn)行下面的工作。不同點(diǎn)在于異步阻塞IO用一個(gè)select函數(shù)可以為多個(gè)文件描述符提供通知柔吼,提供了并發(fā)性毒费。舉個(gè)例子:例如有一萬(wàn)個(gè)并發(fā)的read請(qǐng)求,但是網(wǎng)絡(luò)上仍然沒(méi)有數(shù)據(jù)愈魏,此時(shí)這一萬(wàn)個(gè)read會(huì)同時(shí)各自阻塞觅玻,現(xiàn)在用select想际、poll、epoll這樣的函數(shù)來(lái)專(zhuān)門(mén)負(fù)責(zé)阻塞同時(shí)監(jiān)聽(tīng)這一萬(wàn)個(gè)請(qǐng)求的狀態(tài)溪厘,一旦有數(shù)據(jù)到達(dá)了就負(fù)責(zé)通知胡本,這樣就將一萬(wàn)個(gè)等待和阻塞轉(zhuǎn)化為一個(gè)專(zhuān)門(mén)的函數(shù)來(lái)負(fù)責(zé)與管理。
多路復(fù)用技術(shù)應(yīng)用于JAVA NIO的核心類(lèi)庫(kù)多路復(fù)用器Selector中畸悬,目前支持I/O多路復(fù)用的系統(tǒng)調(diào)用有select侧甫、pselect、poll蹋宦、epoll披粟,在linux編程中有一段時(shí)間一直在使用select做輪詢(xún)和網(wǎng)絡(luò)事件通知的,但是select支持一個(gè)進(jìn)程打開(kāi)的socket描述符(FD)收到了限制冷冗,一般為1024守屉,由于這一限制,現(xiàn)在使用了epoll代替了select蒿辙,而epoll支持一個(gè)進(jìn)程打開(kāi)的FD不受限制拇泛。
異步IO與同步IO的區(qū)別在于:同步IO是需要應(yīng)用程序主動(dòng)地循環(huán)去詢(xún)問(wèn)是否有數(shù)據(jù),而異步IO是通過(guò)像select等IO多路復(fù)用函數(shù)來(lái)同時(shí)檢測(cè)多個(gè)事件句柄來(lái)告知應(yīng)用程序是否有數(shù)據(jù)思灌。
了解了前面三種IO模式俺叭,在用戶(hù)進(jìn)程進(jìn)行系統(tǒng)調(diào)用的時(shí)候,他們?cè)诘却龜?shù)據(jù)到來(lái)的時(shí)候习瑰,處理的方式是不一樣的绪颖,直接等待、輪詢(xún)甜奄、select或poll輪詢(xún),兩個(gè)階段過(guò)程:
第一個(gè)階段有的阻塞窃款,有的不阻塞课兄,有的可以阻塞又可以不阻塞。
第二個(gè)階段都是阻塞的晨继。
從整個(gè)IO過(guò)程來(lái)看烟阐,他們都是順序執(zhí)行的,因此可以歸為同步模型紊扬,都是進(jìn)程自動(dòng)等待且向內(nèi)核檢查狀態(tài)蜒茄。
高并發(fā)的程序一般使用同步非阻塞模式,而不是多線(xiàn)程+同步阻塞模式餐屎。要理解這點(diǎn)檀葛,先弄明白并發(fā)和并行的區(qū)別:比如去某部門(mén)辦事需要依次去幾個(gè)窗口,辦事大廳的人數(shù)就是并發(fā)數(shù)腹缩,而窗口的個(gè)數(shù)就是并行度屿聋。就是說(shuō)并發(fā)是同時(shí)進(jìn)行的任務(wù)數(shù)(如同時(shí)服務(wù)的http請(qǐng)求)空扎,而并行數(shù)就是可以同時(shí)工作的物理資源數(shù)量(如cpu核數(shù))。通過(guò)合理調(diào)度任務(wù)的不同階段润讥,并發(fā)數(shù)可以遠(yuǎn)遠(yuǎn)大于并行度转锈。這就是區(qū)區(qū)幾個(gè)CPU可以支撐上萬(wàn)個(gè)用戶(hù)并發(fā)請(qǐng)求的原因。在這種高并發(fā)的情況下楚殿,為每個(gè)用戶(hù)請(qǐng)求創(chuàng)建一個(gè)進(jìn)程或者線(xiàn)程的開(kāi)銷(xiāo)非常大撮慨。而同步非阻塞方式可以把多個(gè)IO請(qǐng)求丟到后臺(tái)去,這樣一個(gè)CPU就可以服務(wù)大量的并發(fā)IO請(qǐng)求脆粥。
IO多路復(fù)用究竟是同步阻塞還是異步阻塞模型甫煞,這里來(lái)展開(kāi)說(shuō)說(shuō):
同步是需要主動(dòng)等待消息通知,而異步則是被動(dòng)接受消息通知冠绢,通過(guò)回調(diào)抚吠、通知、狀態(tài)等方式來(lái)被動(dòng)獲取消息弟胀。IO多路復(fù)用在阻塞到select階段時(shí)楷力,用戶(hù)進(jìn)程是主動(dòng)等待并調(diào)用select函數(shù)來(lái)獲取就緒狀態(tài)消息,并且其進(jìn)程狀態(tài)為阻塞孵户。所以IO多路復(fù)用是同步阻塞模式萧朝。
4、信號(hào)驅(qū)動(dòng)式IO
應(yīng)用程序提交read請(qǐng)求夏哭,調(diào)用system call检柬,然后內(nèi)核開(kāi)始處理相應(yīng)的IO操作,而同時(shí)竖配,應(yīng)用程序并不等內(nèi)核返回響應(yīng)何址,就會(huì)開(kāi)始執(zhí)行其他的處理操作(應(yīng)用程序沒(méi)有被IO阻塞),當(dāng)內(nèi)核執(zhí)行完畢进胯,返回read響應(yīng)用爪,就會(huì)產(chǎn)生一個(gè)信號(hào)或執(zhí)行一個(gè)基于線(xiàn)程的回調(diào)函數(shù)來(lái)完成這次IO處理過(guò)程。在這里IO的讀寫(xiě)操作是在IO事件發(fā)生之后由應(yīng)用程序來(lái)完成胁镐。異步IO讀寫(xiě)操作總是立即返回偎血,而不論IO是否阻塞,因?yàn)檎嬲淖x寫(xiě)操作已經(jīng)有內(nèi)核掌管盯漂。也就是說(shuō)同步IO模型要求用戶(hù)代碼自行執(zhí)行IO操作(將數(shù)據(jù)從內(nèi)核緩沖區(qū)移動(dòng)用戶(hù)緩沖區(qū)或者相反)颇玷,而異步操作機(jī)制則是由內(nèi)核來(lái)執(zhí)行IO操作(將數(shù)據(jù)從內(nèi)核緩沖區(qū)移動(dòng)用戶(hù)緩沖區(qū)或者相反)【屠拢可以這樣認(rèn)為帖渠,同步IO向應(yīng)用程序通知的是IO就緒事件,而異步IO向應(yīng)用程序通知的是IO完成事件违崇。
5阿弃、異步IO
異步IO與上面的異步概念是一樣的诊霹, 當(dāng)一個(gè)異步過(guò)程調(diào)用發(fā)出后,調(diào)用者不能立刻得到結(jié)果渣淳,實(shí)際處理這個(gè)調(diào)用的函數(shù)在完成后脾还,通過(guò)狀態(tài)、通知和回調(diào)來(lái)通知調(diào)用者的輸入輸出操作入愧。異步IO的工作機(jī)制是:告知內(nèi)核啟動(dòng)某個(gè)操作鄙漏,并讓內(nèi)核在整個(gè)操作完成后通知我們,這種模型與信號(hào)驅(qū)動(dòng)的IO區(qū)別在于棺蛛,信號(hào)驅(qū)動(dòng)IO是由內(nèi)核通知我們何時(shí)可以啟動(dòng)一個(gè)IO操作怔蚌,這個(gè)IO操作由用戶(hù)自定義的信號(hào)函數(shù)來(lái)實(shí)現(xiàn),而異步IO模型是由內(nèi)核告知我們IO操作何時(shí)完成旁赊。