前言
在使用tomcat時(shí),經(jīng)常會(huì)遇到連接數(shù)、線程數(shù)之類的配置問(wèn)題,要真正理解這些概念魁袜,必須先了解Tomcat的連接器(Connector)。
在前面的文章 詳解Tomcat配置文件server.xml 中寫到過(guò):Connector的主要功能敦第,是接收連接請(qǐng)求峰弹,創(chuàng)建Request和Response對(duì)象用于和請(qǐng)求端交換數(shù)據(jù);然后分配線程讓Engine(也就是Servlet容器)來(lái)處理這個(gè)請(qǐng)求申尼,并把產(chǎn)生的Request和Response對(duì)象傳給Engine垮卓。當(dāng)Engine處理完請(qǐng)求后,也會(huì)通過(guò)Connector將響應(yīng)返回給客戶端师幕。
可以說(shuō)粟按,Servlet容器處理請(qǐng)求,是需要Connector進(jìn)行調(diào)度和控制的霹粥,Connector是Tomcat處理請(qǐng)求的主干灭将,因此Connector的配置和使用對(duì)Tomcat的性能有著重要的影響。這篇文章將從Connector入手后控,討論一些與Connector有關(guān)的重要問(wèn)題庙曙,包括NIO/BIO模式、線程池浩淘、連接數(shù)等捌朴。
根據(jù)協(xié)議的不同,Connector可以分為HTTP Connector张抄、AJP Connector等砂蔽,本文只討論HTTP?Connector。
一署惯、Nio左驾、Bio、APR
1极谊、Connector的protocol
Connector在處理HTTP請(qǐng)求時(shí)诡右,會(huì)使用不同的protocol。不同的Tomcat版本支持的protocol不同轻猖,其中最典型的protocol包括BIO帆吻、NIO和APR(Tomcat7中支持這3種,Tomcat8增加了對(duì)NIO2的支持咙边,而到了Tomcat8.5和Tomcat9.0桅锄,則去掉了對(duì)BIO的支持)琉雳。
BIO是Blocking IO,顧名思義是阻塞的IO友瘤;NIO是Non-blocking IO翠肘,則是非阻塞的IO。而APR是Apache Portable Runtime辫秧,是Apache可移植運(yùn)行庫(kù)束倍,利用本地庫(kù)可以實(shí)現(xiàn)高可擴(kuò)展性、高性能盟戏;Apr是在Tomcat上運(yùn)行高并發(fā)應(yīng)用的首選模式绪妹,但是需要安裝apr、apr-utils柿究、tomcat-native等包邮旷。
2、如何指定protocol
Connector使用哪種protocol蝇摸,可以通過(guò)<connector>元素中的protocol屬性進(jìn)行指定婶肩,也可以使用默認(rèn)值。
指定的protocol取值及對(duì)應(yīng)的協(xié)議如下:
HTTP/1.1:默認(rèn)值貌夕,使用的協(xié)議與Tomcat版本有關(guān)
org.apache.coyote.http11.Http11Protocol:BIO
org.apache.coyote.http11.Http11NioProtocol:NIO
org.apache.coyote.http11.Http11Nio2Protocol:NIO2
org.apache.coyote.http11.Http11AprProtocol:APR
如果沒(méi)有指定protocol律歼,則使用默認(rèn)值HTTP/1.1,其含義如下:在Tomcat7中啡专,自動(dòng)選取使用BIO或APR(如果找到APR需要的本地庫(kù)险毁,則使用APR,否則使用BIO)们童;在Tomcat8中畔况,自動(dòng)選取使用NIO或APR(如果找到APR需要的本地庫(kù),則使用APR慧库,否則使用NIO)问窃。
3、BIO/NIO有何不同
無(wú)論是BIO完沪,還是NIO,Connector處理請(qǐng)求的大致流程是一樣的:
在accept隊(duì)列中接收連接(當(dāng)客戶端向服務(wù)器發(fā)送請(qǐng)求時(shí)嵌戈,如果客戶端與OS完成三次握手建立了連接覆积,則OS將該連接放入accept隊(duì)列);在連接中獲取請(qǐng)求的數(shù)據(jù)熟呛,生成request宽档;調(diào)用servlet容器處理請(qǐng)求;返回response庵朝。為了便于后面的說(shuō)明吗冤,首先明確一下連接與請(qǐng)求的關(guān)系:連接是TCP層面的(傳輸層)又厉,對(duì)應(yīng)socket;請(qǐng)求是HTTP層面的(應(yīng)用層)椎瘟,必須依賴于TCP的連接實(shí)現(xiàn)覆致;一個(gè)TCP連接中可能傳輸多個(gè)HTTP請(qǐng)求。
在BIO實(shí)現(xiàn)的Connector中肺蔚,處理請(qǐng)求的主要實(shí)體是JIoEndpoint對(duì)象煌妈。JIoEndpoint維護(hù)了Acceptor和Worker:Acceptor接收socket,然后從Worker線程池中找出空閑的線程處理socket宣羊,如果worker線程池沒(méi)有空閑線程璧诵,則Acceptor將阻塞。其中Worker是Tomcat自帶的線程池仇冯,如果通過(guò)配置了其他線程池之宿,原理與Worker類似。
在NIO實(shí)現(xiàn)的Connector中苛坚,處理請(qǐng)求的主要實(shí)體是NIoEndpoint對(duì)象比被。NIoEndpoint中除了包含Acceptor和Worker外,還是用了Poller炕婶,處理流程如下圖所示(圖片來(lái)源:http://gearever.iteye.com/blog/1844203)姐赡。
Acceptor接收socket后,不是直接使用Worker中的線程處理請(qǐng)求柠掂,而是先將請(qǐng)求發(fā)送給了Poller项滑,而Poller是實(shí)現(xiàn)NIO的關(guān)鍵。Acceptor向Poller發(fā)送請(qǐng)求通過(guò)隊(duì)列實(shí)現(xiàn)涯贞,使用了典型的生產(chǎn)者-消費(fèi)者模式枪狂。在Poller中,維護(hù)了一個(gè)Selector對(duì)象宋渔;當(dāng)Poller從隊(duì)列中取出socket后州疾,注冊(cè)到該Selector中;然后通過(guò)遍歷Selector皇拣,找出其中可讀的socket严蓖,并使用Worker中的線程處理相應(yīng)請(qǐng)求。與BIO類似氧急,Worker也可以被自定義的線程池代替颗胡。
通過(guò)上述過(guò)程可以看出,在NIoEndpoint處理請(qǐng)求的過(guò)程中吩坝,無(wú)論是Acceptor接收socket毒姨,還是線程處理請(qǐng)求,使用的仍然是阻塞方式钉寝;但在“讀取socket并交給Worker中的線程”的這個(gè)過(guò)程中弧呐,使用非阻塞的NIO實(shí)現(xiàn)闸迷,這是NIO模式與BIO模式的最主要區(qū)別(其他區(qū)別對(duì)性能影響較小,暫時(shí)略去不提)俘枫。而這個(gè)區(qū)別腥沽,在并發(fā)量較大的情形下可以帶來(lái)Tomcat效率的顯著提升:
目前大多數(shù)HTTP請(qǐng)求使用的是長(zhǎng)連接(HTTP/1.1默認(rèn)keep-alive為true),而長(zhǎng)連接意味著崩哩,一個(gè)TCP的socket在當(dāng)前請(qǐng)求結(jié)束后巡球,如果沒(méi)有新的請(qǐng)求到來(lái),socket不會(huì)立馬釋放邓嘹,而是等timeout后再釋放酣栈。如果使用BIO,“讀取socket并交給Worker中的線程”這個(gè)過(guò)程是阻塞的汹押,也就意味著在socket等待下一個(gè)請(qǐng)求或等待釋放的過(guò)程中矿筝,處理這個(gè)socket的工作線程會(huì)一直被占用,無(wú)法釋放棚贾;因此Tomcat可以同時(shí)處理的socket數(shù)目不能超過(guò)最大線程數(shù)窖维,性能受到了極大限制。而使用NIO妙痹,“讀取socket并交給Worker中的線程”這個(gè)過(guò)程是非阻塞的铸史,當(dāng)socket在等待下一個(gè)請(qǐng)求或等待釋放時(shí),并不會(huì)占用工作線程怯伊,因此Tomcat可以同時(shí)處理的socket數(shù)目遠(yuǎn)大于最大線程數(shù)琳轿,并發(fā)性能大大提高。
二耿芹、3個(gè)參數(shù):acceptCount崭篡、maxConnections、maxThreads
再回顧一下Tomcat處理請(qǐng)求的過(guò)程:在accept隊(duì)列中接收連接(當(dāng)客戶端向服務(wù)器發(fā)送請(qǐng)求時(shí)吧秕,如果客戶端與OS完成三次握手建立了連接琉闪,則OS將該連接放入accept隊(duì)列);在連接中獲取請(qǐng)求的數(shù)據(jù)砸彬,生成request颠毙;調(diào)用servlet容器處理請(qǐng)求;返回response砂碉。
相對(duì)應(yīng)的蛀蜜,Connector中的幾個(gè)參數(shù)功能如下:
1、acceptCount
accept隊(duì)列的長(zhǎng)度绽淘;當(dāng)accept隊(duì)列中連接的個(gè)數(shù)達(dá)到acceptCount時(shí),隊(duì)列滿闹伪,進(jìn)來(lái)的請(qǐng)求一律被拒絕沪铭。默認(rèn)值是100壮池。
2、maxConnections
Tomcat在任意時(shí)刻接收和處理的最大連接數(shù)杀怠。當(dāng)Tomcat接收的連接數(shù)達(dá)到maxConnections時(shí)椰憋,Acceptor線程不會(huì)讀取accept隊(duì)列中的連接;這時(shí)accept隊(duì)列中的線程會(huì)一直阻塞著赔退,直到Tomcat接收的連接數(shù)小于maxConnections橙依。如果設(shè)置為-1,則連接數(shù)不受限制硕旗。
默認(rèn)值與連接器使用的協(xié)議有關(guān):NIO的默認(rèn)值是10000窗骑,APR/native的默認(rèn)值是8192,而B(niǎo)IO的默認(rèn)值為maxThreads(如果配置了Executor漆枚,則默認(rèn)值是Executor的maxThreads)创译。
在windows下,APR/native的maxConnections值會(huì)自動(dòng)調(diào)整為設(shè)置值以下最大的1024的整數(shù)倍墙基;如設(shè)置為2000软族,則最大值實(shí)際是1024。
3残制、maxThreads
請(qǐng)求處理線程的最大數(shù)量立砸。默認(rèn)值是200(Tomcat7和8都是的)。如果該Connector綁定了Executor初茶,這個(gè)值會(huì)被忽略颗祝,因?yàn)樵揅onnector將使用綁定的Executor,而不是內(nèi)置的線程池來(lái)執(zhí)行任務(wù)纺蛆。
maxThreads規(guī)定的是最大的線程數(shù)目吐葵,并不是實(shí)際running的CPU數(shù)量;實(shí)際上桥氏,maxThreads的大小比CPU核心數(shù)量要大得多温峭。這是因?yàn)椋幚碚?qǐng)求的線程真正用于計(jì)算的時(shí)間可能很少字支,大多數(shù)時(shí)間可能在阻塞凤藏,如等待數(shù)據(jù)庫(kù)返回?cái)?shù)據(jù)、等待硬盤讀寫數(shù)據(jù)等堕伪。因此揖庄,在某一時(shí)刻,只有少數(shù)的線程真正的在使用物理CPU欠雌,大多數(shù)線程都在等待蹄梢;因此線程數(shù)遠(yuǎn)大于物理核心數(shù)才是合理的。
換句話說(shuō)富俄,Tomcat通過(guò)使用比CPU核心數(shù)量多得多的線程數(shù)禁炒,可以使CPU忙碌起來(lái)而咆,大大提高CPU的利用率。
4幕袱、參數(shù)設(shè)置
(1)maxThreads的設(shè)置既與應(yīng)用的特點(diǎn)有關(guān)暴备,也與服務(wù)器的CPU核心數(shù)量有關(guān)。通過(guò)前面介紹可以知道们豌,maxThreads數(shù)量應(yīng)該遠(yuǎn)大于CPU核心數(shù)量涯捻;而且CPU核心數(shù)越大,maxThreads應(yīng)該越大望迎;應(yīng)用中CPU越不密集(IO越密集)障癌,maxThreads應(yīng)該越大,以便能夠充分利用CPU擂煞。當(dāng)然混弥,maxThreads的值并不是越大越好,如果maxThreads過(guò)大对省,那么CPU會(huì)花費(fèi)大量的時(shí)間用于線程的切換蝗拿,整體效率會(huì)降低。
(2)maxConnections的設(shè)置與Tomcat的運(yùn)行模式有關(guān)蒿涎。如果tomcat使用的是BIO哀托,那么maxConnections的值應(yīng)該與maxThreads一致;如果tomcat使用的是NIO劳秋,那么類似于Tomcat的默認(rèn)值仓手,maxConnections值應(yīng)該遠(yuǎn)大于maxThreads。
(3)通過(guò)前面的介紹可以知道玻淑,雖然tomcat同時(shí)可以處理的連接數(shù)目是maxConnections嗽冒,但服務(wù)器中可以同時(shí)接收的連接數(shù)為maxConnections+acceptCount 。acceptCount的設(shè)置补履,與應(yīng)用在連接過(guò)高情況下希望做出什么反應(yīng)有關(guān)系添坊。如果設(shè)置過(guò)大,后面進(jìn)入的請(qǐng)求等待時(shí)間會(huì)很長(zhǎng)箫锤;如果設(shè)置過(guò)小贬蛙,后面進(jìn)入的請(qǐng)求立馬返回connection refused。
三谚攒、線程池Executor
Executor元素代表Tomcat中的線程池阳准,可以由其他組件共享使用;要使用該線程池馏臭,組件需要通過(guò)executor屬性指定該線程池野蝇。
Executor是Service元素的內(nèi)嵌元素。一般來(lái)說(shuō),使用線程池的是Connector組件绕沈;為了使Connector能使用線程池乱灵,Executor元素應(yīng)該放在Connector前面。Executor與Connector的配置舉例如下:
<Executor name="tomcatThreadPool" namePrefix ="catalina-exec-" maxThreads="150" minSpareThreads="4" />
<Connector executor="tomcatThreadPool" port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" acceptCount="1000" />
Executor的主要屬性包括:
name:該線程池的標(biāo)記
maxThreads:線程池中最大活躍線程數(shù)七冲,默認(rèn)值200(Tomcat7和8都是)
minSpareThreads:線程池中保持的最小線程數(shù),最小值是25
maxIdleTime:線程空閑的最大時(shí)間规婆,當(dāng)空閑超過(guò)該值時(shí)關(guān)閉線程(除非線程數(shù)小于minSpareThreads)澜躺,單位是ms,默認(rèn)值60000(1分鐘)
daemon:是否后臺(tái)線程抒蚜,默認(rèn)值true
threadPriority:線程優(yōu)先級(jí)掘鄙,默認(rèn)值5
namePrefix:線程名字的前綴,線程池中線程名字為:namePrefix+線程編號(hào)
四嗡髓、查看當(dāng)前狀態(tài)
上面介紹了Tomcat連接數(shù)操漠、線程數(shù)的概念以及如何設(shè)置,下面說(shuō)明如何查看服務(wù)器中的連接數(shù)和線程數(shù)饿这。
查看服務(wù)器的狀態(tài)浊伙,大致分為兩種方案:(1)使用現(xiàn)成的工具,(2)直接使用Linux的命令查看长捧。
現(xiàn)成的工具嚣鄙,如JDK自帶的jconsole工具可以方便的查看線程信息(此外還可以查看CPU、內(nèi)存串结、類哑子、JVM基本信息等),Tomcat自帶的manager肌割,收費(fèi)工具New Relic等卧蜓。下圖是jconsole查看線程信息的界面:
下面說(shuō)一下如何通過(guò)Linux命令行,查看服務(wù)器中的連接數(shù)和線程數(shù)把敞。
1弥奸、連接數(shù)
假設(shè)Tomcat接收http請(qǐng)求的端口是8083,則可以使用如下語(yǔ)句查看連接情況:
netstat –nat | grep 8083
結(jié)果如下所示:
可以看出先巴,有一個(gè)連接處于listen狀態(tài)其爵,監(jiān)聽(tīng)請(qǐng)求;除此之外伸蚯,還有4個(gè)已經(jīng)建立的連接(ESTABLISHED)和2個(gè)等待關(guān)閉的連接(CLOSE_WAIT)摩渺。
2、線程
ps命令可以查看進(jìn)程狀態(tài)剂邮,如執(zhí)行如下命令:
ps –e | grep java
結(jié)果如下圖:
可以看到摇幻,只打印了一個(gè)進(jìn)程的信息;27989是線程id,java是指執(zhí)行的java命令绰姻。這是因?yàn)閱?dòng)一個(gè)tomcat枉侧,內(nèi)部所有的工作都在這一個(gè)進(jìn)程里完成,包括主線程狂芋、垃圾回收線程榨馁、Acceptor線程、請(qǐng)求處理線程等等帜矾。
通過(guò)如下命令翼虫,可以看到該進(jìn)程內(nèi)有多少個(gè)線程;其中屡萤,nlwp含義是number of light-weight process珍剑。
ps –o nlwp 27989
可以看到,該進(jìn)程內(nèi)部有73個(gè)線程死陆;但是73并沒(méi)有排除處于idle狀態(tài)的線程招拙。要想獲得真正在running的線程數(shù)量,可以通過(guò)以下語(yǔ)句完成:
ps -eLo pid ,stat | grep 27989 | grep running | wc -l
其中ps -eLo pid ,stat可以找出所有線程措译,并打印其所在的進(jìn)程號(hào)和線程當(dāng)前的狀態(tài)别凤;兩個(gè)grep命令分別篩選進(jìn)程號(hào)和線程狀態(tài);wc統(tǒng)計(jì)個(gè)數(shù)领虹。其中闻妓,ps -eLo pid ,stat | grep 27989輸出的結(jié)果如下:
圖中只截圖了部分結(jié)果;Sl表示大多數(shù)線程都處于空閑狀態(tài)掠械。
擴(kuò)展閱讀
讓面試官顫抖的Tomcat系統(tǒng)架構(gòu)系列由缆!
Git使用教程:最詳細(xì)、最傻瓜猾蒂、最淺顯均唉、真正手把手教!
來(lái)源:http://www.cnblogs.com/kismetv/p/7806063.html