本文轉(zhuǎn)自:http://www.sohu.com/a/203838233_827544
本系列文章將整理到我在GitHub上的《Java面試指南》倉(cāng)庫(kù)掰邢,更多精彩內(nèi)容請(qǐng)到我的倉(cāng)庫(kù)里查看
喜歡的話麻煩點(diǎn)下Star哈
文章將同步到我的個(gè)人博客:
本文是微信公眾號(hào)【Java技術(shù)江湖】的《不可輕視的Java網(wǎng)絡(luò)編程》其中一篇界弧,本文部分內(nèi)容來(lái)源于網(wǎng)絡(luò),為了把本文主題講得清晰透徹办桨,也整合了很多我認(rèn)為不錯(cuò)的技術(shù)博客內(nèi)容筹淫,引用其中了一些比較好的博客文章,如有侵權(quán)呢撞,請(qǐng)聯(lián)系作者损姜。
該系列博文會(huì)告訴你如何從計(jì)算機(jī)網(wǎng)絡(luò)的基礎(chǔ)知識(shí)入手,一步步地學(xué)習(xí)Java網(wǎng)絡(luò)基礎(chǔ)殊霞,從socket到nio摧阅、bio、aio和netty等網(wǎng)絡(luò)編程知識(shí)绷蹲,并且進(jìn)行實(shí)戰(zhàn)棒卷,網(wǎng)絡(luò)編程是每一個(gè)Java后端工程師必須要學(xué)習(xí)和理解的知識(shí)點(diǎn)顾孽,進(jìn)一步來(lái)說(shuō),你還需要掌握Linux中的網(wǎng)絡(luò)編程原理比规,包括IO模型若厚、網(wǎng)絡(luò)編程框架netty的進(jìn)階原理,才能更完整地了解整個(gè)Java網(wǎng)絡(luò)編程的知識(shí)體系蜒什,形成自己的知識(shí)框架测秸。
為了更好地總結(jié)和檢驗(yàn)?zāi)愕膶W(xué)習(xí)成果,本系列文章也會(huì)提供部分知識(shí)點(diǎn)對(duì)應(yīng)的面試題以及參考答案灾常。
如果對(duì)本系列文章有什么建議霎冯,或者是有什么疑問(wèn)的話,也可以關(guān)注公眾號(hào)【Java技術(shù)江湖】聯(lián)系作者钞瀑,歡迎你參與本系列博文的創(chuàng)作和修訂肃晚。
摘要: I/O復(fù)用模型,是同步非阻塞仔戈,這里的非阻塞是指I/O讀寫关串,對(duì)應(yīng)的是recvfrom操作,因?yàn)閿?shù)據(jù)報(bào)文已經(jīng)準(zhǔn)備好监徘,無(wú)需阻塞晋修。
說(shuō)它是同步,是因?yàn)榛丝@個(gè)執(zhí)行是在一個(gè)線程里面執(zhí)行的墓卦。有時(shí)候,還會(huì)說(shuō)它又是阻塞的户敬,實(shí)際上是指阻塞在select上面落剪,必須等到讀就緒、寫就緒等網(wǎng)絡(luò)事件尿庐。
一忠怖、I/O復(fù)用模型解讀
Tomcat的NIO是基于I/O復(fù)用來(lái)實(shí)現(xiàn)的。對(duì)這點(diǎn)一定要清楚抄瑟,不然我們的討論就不在一個(gè)邏輯線上凡泣。下面這張圖學(xué)習(xí)過(guò)I/O模型知識(shí)的一般都見(jiàn)過(guò),出自《UNIX網(wǎng)絡(luò)編程》皮假,I/O模型一共有阻塞式I/O鞋拟,非阻塞式I/O,I/O復(fù)用(select/poll/epoll)惹资,信號(hào)驅(qū)動(dòng)式I/O和異步I/O贺纲。這篇文章講的是I/O復(fù)用。
IO復(fù)用.png
這里先來(lái)說(shuō)下用戶態(tài)和內(nèi)核態(tài)褪测,直白來(lái)講猴誊,如果線程執(zhí)行的是用戶代碼潦刃,當(dāng)前線程處在用戶態(tài),如果線程執(zhí)行的是內(nèi)核里面的代碼稠肘,當(dāng)前線程處在內(nèi)核態(tài)福铅。更深層來(lái)講萝毛,操作系統(tǒng)為代碼所處的特權(quán)級(jí)別分了4個(gè)級(jí)別项阴。
不過(guò)現(xiàn)代操作系統(tǒng)只用到了0和3兩個(gè)級(jí)別。0和3的切換就是用戶態(tài)和內(nèi)核態(tài)的切換笆包。更詳細(xì)的可參照《深入理解計(jì)算機(jī)操作系統(tǒng)》环揽。I/O復(fù)用模型,是同步非阻塞庵佣,這里的非阻塞是指I/O讀寫歉胶,對(duì)應(yīng)的是recvfrom操作,因?yàn)閿?shù)據(jù)報(bào)文已經(jīng)準(zhǔn)備好巴粪,無(wú)需阻塞通今。
說(shuō)它是同步,是因?yàn)楦馗@個(gè)執(zhí)行是在一個(gè)線程里面執(zhí)行的辫塌。有時(shí)候,還會(huì)說(shuō)它又是阻塞的派哲,實(shí)際上是指阻塞在select上面臼氨,必須等到讀就緒、寫就緒等網(wǎng)絡(luò)事件芭届。有時(shí)候我們又說(shuō)I/O復(fù)用是多路復(fù)用储矩,這里的多路是指N個(gè)連接,每一個(gè)連接對(duì)應(yīng)一個(gè)channel褂乍,或者說(shuō)多路就是多個(gè)channel持隧。
復(fù)用,是指多個(gè)連接復(fù)用了一個(gè)線程或者少量線程(在Tomcat中是Math.min(2,Runtime.getRuntime().availableProcessors()))逃片。
上面提到的網(wǎng)絡(luò)事件有連接就緒舆蝴,接收就緒,讀就緒题诵,寫就緒四個(gè)網(wǎng)絡(luò)事件洁仗。I/O復(fù)用主要是通過(guò)Selector復(fù)用器來(lái)實(shí)現(xiàn)的,可以結(jié)合下面這個(gè)圖理解上面的敘述性锭。
Selector圖解.png
二赠潦、TOMCAT對(duì)IO模型的支持
tomcat支持IO類型圖.png
tomcat從6以后開(kāi)始支持NIO模型,實(shí)現(xiàn)是基于JDK的java.nio包草冈。這里可以看到對(duì)read body 和response body是Blocking的她奥。關(guān)于這點(diǎn)在第6.3節(jié)源代碼閱讀有重點(diǎn)介紹瓮增。
三、TOMCAT中NIO的配置與使用
在Connector節(jié)點(diǎn)配置protocol="org.apache.coyote.http11.Http11NioProtocol"哩俭,Http11NioProtocol協(xié)議下默認(rèn)最大連接數(shù)是10000绷跑,也可以重新修改maxConnections的值,同時(shí)我們可以設(shè)置最大線程數(shù)maxThreads凡资,這里設(shè)置的最大線程數(shù)就是Excutor的線程池的大小砸捏。
在BIO模式下實(shí)際上是沒(méi)有maxConnections,即使配置也不會(huì)生效隙赁,BIO模式下的maxConnections是保持跟maxThreads大小一致垦藏,因?yàn)樗且徽?qǐng)求一線程模式。
四伞访、NioEndpoint組件關(guān)系圖解讀
tomcatnio組成.png
我們要理解tomcat的nio最主要就是對(duì)NioEndpoint的理解掂骏。它一共包含LimitLatch、Acceptor厚掷、Poller弟灼、SocketProcessor、Excutor5個(gè)部分冒黑。
LimitLatch是連接控制器田绑,它負(fù)責(zé)維護(hù)連接數(shù)的計(jì)算,nio模式下默認(rèn)是10000薛闪,達(dá)到這個(gè)閾值后辛馆,就會(huì)拒絕連接請(qǐng)求。Acceptor負(fù)責(zé)接收連接豁延,默認(rèn)是1個(gè)線程來(lái)執(zhí)行昙篙,將請(qǐng)求的事件注冊(cè)到事件列表。
有Poller來(lái)負(fù)責(zé)輪詢诱咏,Poller線程數(shù)量是cpu的核數(shù)Math.min(2,Runtime.getRuntime().availableProcessors())苔可。由Poller將就緒的事件生成SocketProcessor同時(shí)交給Excutor去執(zhí)行。Excutor線程池的大小就是我們?cè)贑onnector節(jié)點(diǎn)配置的maxThreads的值袋狞。
在Excutor的線程中焚辅,會(huì)完成從socket中讀取http request,解析成HttpServletRequest對(duì)象苟鸯,分派到相應(yīng)的servlet并完成邏輯同蜻,然后將response通過(guò)socket發(fā)回client。
在從socket中讀數(shù)據(jù)和往socket中寫數(shù)據(jù)的過(guò)程早处,并沒(méi)有像典型的非阻塞的NIO的那樣湾蔓,注冊(cè)O(shè)P_READ或OP_WRITE事件到主Selector,而是直接通過(guò)socket完成讀寫砌梆,這時(shí)是阻塞完成的默责,但是在timeout控制上贬循,使用了NIO的Selector機(jī)制,但是這個(gè)Selector并不是Poller線程維護(hù)的主Selector桃序,而是BlockPoller線程中維護(hù)的Selector杖虾,稱之為輔Selector。詳細(xì)源代碼可以參照 第6.3節(jié)媒熊。
五奇适、NioEndpoint執(zhí)行序列圖
tomcatnio序列圖.png
在下一小節(jié)NioEndpoint源碼解讀中我們將對(duì)步驟1-步驟11依次找到對(duì)應(yīng)的代碼來(lái)說(shuō)明。
六泛释、NioEndpoint源碼解讀
6.1滤愕、初始化
無(wú)論是BIO還是NIO温算,開(kāi)始都會(huì)初始化連接限制怜校,不可能無(wú)限增大,NIO模式下默認(rèn)是10000注竿。
6.2茄茁、步驟解讀
下面我們著重?cái)⑹龈鶱IO相關(guān)的流程,共分為11個(gè)步驟巩割,分別對(duì)應(yīng)上面序列圖中的步驟裙顽。
步驟1:綁定IP地址及端口,將ServerSocketChannel設(shè)置為阻塞宣谈。
這里為什么要設(shè)置成阻塞呢愈犹,我們一直都在說(shuō)非阻塞。Tomcat的設(shè)計(jì)初衷主要是為了操作方便闻丑。這樣這里就跟BIO模式下一樣了漩怎。只不過(guò)在BIO下這里返回的是
Socket,NIO下這里返回的是SocketChannel嗦嗡。
步驟2:?jiǎn)?dòng)接收線程
步驟3:ServerSocketChannel.accept()接收新連接
步驟4:將接收到的鏈接通道設(shè)置為非阻塞
步驟5:構(gòu)造NioChannel對(duì)象
步驟6:register注冊(cè)到輪詢線程
步驟7:構(gòu)造PollerEvent勋锤,并添加到事件隊(duì)列
步驟8:?jiǎn)?dòng)輪詢線程
步驟9:取出隊(duì)列中新增的PollerEvent并注冊(cè)到Selector
步驟10:Selector.select()
步驟11:根據(jù)選擇的SelectionKey構(gòu)造SocketProcessor提交到請(qǐng)求處理線程
6.3、NioBlockingSelector和BlockPoller介紹
上面的序列圖有個(gè)地方我沒(méi)有描述侥祭,就是NioSelectorPool這個(gè)內(nèi)部類叁执,是因?yàn)樵谡w理解tomcat的nio上面在序列圖里面不包括它更好理解。
在有了上面的基礎(chǔ)后,我們?cè)趤?lái)說(shuō)下NioSelectorPool這個(gè)類噪沙,對(duì)更深層了解Tomcat的NIO一定要知道它的作用户秤。NioEndpoint對(duì)象中維護(hù)了一個(gè)NioSelecPool對(duì)象,這個(gè)NioSelectorPool中又維護(hù)了一個(gè)BlockPoller線程吆录,這個(gè)線程就是基于輔Selector進(jìn)行NIO的邏輯。
以執(zhí)行servlet后硝拧,得到response径筏,往socket中寫數(shù)據(jù)為例葛假,最終寫的過(guò)程調(diào)用NioBlockingSelector的write方法。代碼如下:
也就是說(shuō)當(dāng)socket.write()返回0時(shí)滋恬,說(shuō)明網(wǎng)絡(luò)狀態(tài)不穩(wěn)定聊训,這時(shí)將socket注冊(cè)O(shè)P_WRITE事件到輔Selector,由BlockPoller線程不斷輪詢這個(gè)輔Selector恢氯,直到發(fā)現(xiàn)這個(gè)socket的寫狀態(tài)恢復(fù)了带斑,通過(guò)那個(gè)倒數(shù)計(jì)數(shù)器,通知Worker線程繼續(xù)寫socket動(dòng)作勋拟⊙模看一下BlockSelector線程的代碼邏輯:
使用這個(gè)輔Selector主要是減少線程間的切換,同時(shí)還可減輕主Selector的負(fù)擔(dān)敢靡。
七挂滓、關(guān)于性能
下面這份報(bào)告是我們壓測(cè)的一個(gè)結(jié)果,跟想象的是不是不太一樣啸胧?幾乎沒(méi)有差別赶站,實(shí)際上NIO優(yōu)化的是I/O的讀寫,如果瓶頸不在這里的話纺念,比如傳輸字節(jié)數(shù)很小的情況下贝椿,BIO和NIO實(shí)際上是沒(méi)有差別的。
NIO的優(yōu)勢(shì)更在于用少量的線程hold住大量的連接陷谱。還有一點(diǎn)烙博,我們?cè)趬簻y(cè)的過(guò)程中,遇到在NIO模式下剛開(kāi)始的一小段時(shí)間內(nèi)容烟逊,會(huì)有錯(cuò)誤渣窜,這是因?yàn)橐话愕膲簻y(cè)工具是基于一種長(zhǎng)連接,也就是說(shuō)比如模擬1000并發(fā)焙格,那么同時(shí)建立1000個(gè)連接图毕,下一時(shí)刻再發(fā)送請(qǐng)求就是基于先前的這1000個(gè)連接來(lái)發(fā)送,還有TOMCAT的NIO處理是有POLLER線程來(lái)接管的眷唉,它的線程數(shù)一般等于CPU的核數(shù)予颤,如果一瞬間有大量并發(fā)過(guò)來(lái),POLLER也會(huì)頓時(shí)處理不過(guò)來(lái)冬阳。
壓測(cè)1.jpeg
壓測(cè)2.jpeg
八蛤虐、總結(jié)
NIO只是優(yōu)化了網(wǎng)絡(luò)IO的讀寫,如果系統(tǒng)的瓶頸不在這里肝陪,比如每次讀取的字節(jié)說(shuō)都是500b驳庭,那么BIO和NIO在性能上沒(méi)有區(qū)別。NIO模式是最大化壓榨CPU,把時(shí)間片都更好利用起來(lái)饲常。
對(duì)于操作系統(tǒng)來(lái)說(shuō)蹲堂,線程之間上下文切換的開(kāi)銷很大,而且每個(gè)線程都要占用系統(tǒng)的一些資源如內(nèi)存贝淤,有關(guān)線程資源可參照這篇文章《一臺(tái)java服務(wù)器可以跑多少個(gè)線程》柒竞。
因此,使用的線程越少越好播聪。而I/O復(fù)用模型正是利用少量的線程來(lái)管理大量的連接朽基。在對(duì)于維護(hù)大量長(zhǎng)連接的應(yīng)用里面更適合用基于I/O復(fù)用模型NIO,比如web qq這樣的應(yīng)用离陶。所以我們要清楚系統(tǒng)的瓶頸是I/O還是CPU的計(jì)算