問題:java應(yīng)用CPU占用持續(xù)高位
一般性結(jié)論:一般來說糖耸,CPU占用高不高的問題秘遏,不是給定一個(gè)數(shù)值,例如90%以上就算高嘉竟,以下就算正常邦危,正常來說,隨著程序的運(yùn)行周拐,CPU不斷變化铡俐,百分之幾,百分之幾十妥粟,百分之百审丘,都有可能,而CPU持續(xù)的高位勾给,例如一直300%或者更多800%(多核)滩报,才可以認(rèn)定為CPU占用過高問題。
對(duì)于java來說播急,頻繁的IO讀寫脓钾,創(chuàng)建過多的線程,CPU都會(huì)較高桩警,而線程死鎖或者死循環(huán)基本是導(dǎo)致cpu高的罪魁禍?zhǔn)住?/p>
具體問題切入:某聯(lián)通正式環(huán)境運(yùn)行10分鐘后CPU達(dá)到300%可训,運(yùn)行一天以后持續(xù)在800%
主機(jī)環(huán)境:Red?Hat?Enterprise?Linux?Server?release?5.6?(Tikanga)
JDK:jdk1.6.0_6
tomcat:apache-tomcat-6.0.20
問題定位過程:
1、找到JAVA進(jìn)程
ps -ef | grep java
2捶枢、查看系統(tǒng)運(yùn)行情況
top?? 找到對(duì)應(yīng)的java進(jìn)程握截,查看cpu情況,下圖是示意圖烂叔,問題已經(jīng)解決后的系統(tǒng)運(yùn)行情況
3谨胞、找到可疑的執(zhí)行線程
在top監(jiān)控頁面,按shift+h切換到線程監(jiān)控狀態(tài)蒜鸡,如下圖
有10幾個(gè)java線程胯努,占用CPU達(dá)到100%牢裳,運(yùn)行時(shí)間超過100分鐘,這樣的線程就是可疑線程
4叶沛、定位線程執(zhí)行的具體代碼
找到其中的線程蒲讯,12293,轉(zhuǎn)換成16進(jìn)制恬汁,字母小寫伶椿,16進(jìn)制為 3005,執(zhí)行
jstack java進(jìn)程 |grep -A 30 3005氓侧,如下:
到這里脊另,基本能看到這個(gè)線程具體執(zhí)行一些代碼信息,運(yùn)氣好的話约巷,能直接看到具體的功能代碼偎痛,但是,很不幸独郎,這個(gè)沒有看到具體的功能踩麦。
5、找到出問題的功能氓癌,審閱功能代碼
上面的圖片谓谦,我們能看到一些信息,應(yīng)該在corba一塊的功能贪婉,但是這個(gè)范圍太大反粥,怎么找功能?我看了很久疲迂,終于找到方法才顿,線程運(yùn)行的時(shí)間我們知道,當(dāng)前時(shí)間我們知道尤蒿,那減去運(yùn)行的時(shí)間郑气,就是線程剛開始執(zhí)行的時(shí)間,tomcat是基于http的腰池,我們只要找到請求的url尾组,就知道功能了,于是我看tomcat日志示弓,找到那個(gè)時(shí)間點(diǎn)運(yùn)行的功能演怎,定位到兩個(gè),性能和流量的實(shí)時(shí)查詢避乏。查看了兩個(gè)功能的代碼,發(fā)現(xiàn)這兩個(gè)功能應(yīng)該都沒有問題甘桑。程序中并沒有多線程的操作拍皮,也沒有死循環(huán)歹叮,怎么辦?
6铆帽、別放棄咆耿,找度娘
我在百度搜索sun.nio.ch.EPollArrayWrapper.epollWait ,出現(xiàn)了一些反映相同問題的網(wǎng)頁爹橱,比對(duì)了很多萨螺,最后定位到導(dǎo)致這個(gè)問題的是nio早期版本的一個(gè)BUG(http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6403933)但是我還有疑惑,java官網(wǎng)上愧驱,說在1.6.0_4就會(huì)解決這個(gè)問題慰技,但是很多網(wǎng)友反饋,并沒有解決组砚,我們用的是_6的版本吻商,也發(fā)現(xiàn)了這個(gè)問題。于是死馬當(dāng)活馬醫(yī)糟红,升級(jí)JDK到最新版本_45艾帐,升級(jí)完成后,觀察了幾個(gè)小時(shí)盆偿,CPU再?zèng)]有上來柒爸,沒有見到可疑的長時(shí)間運(yùn)行的線程。問題告一段落事扭∩又桑總結(jié):上面的問題,使用的環(huán)境句旱,我們在很多項(xiàng)目有用阳藻,在其他項(xiàng)目沒有發(fā)現(xiàn)這樣的問題,這個(gè)問題可能也只是在有限的軟硬件條件下才能觸發(fā)谈撒,希望大家在這個(gè)過程中腥泥,找到JAVA應(yīng)用CPU占用分析的一些思路。