記一次耗時毛刺排查

前段時間的某天,注意到一個服務的平均耗時出現(xiàn)了如下圖的毛刺現(xiàn)象观堂。


耗時毛刺

注意到毛刺出現(xiàn)極其規(guī)律让网,每30分鐘出現(xiàn)一個毛刺∈郏考慮到這種規(guī)律性溃睹,并結(jié)合服務的流量較小(20 QPS)推測胰坟,可能是某個定時請求的接口進行了耗時操作因篇,由于流量較小放大了平均耗時,繼而出現(xiàn)了毛刺。但排查主調(diào)調(diào)用的接口竞滓,并沒有發(fā)現(xiàn)定時的調(diào)用咐吼,從而否定了這種可能性。
排除服務外部的原因?qū)е碌拿躺逃樱敲粗皇O路諆?nèi)部的原因了锯茄。該服務為JAVA應用,考慮到服務GC會導致應用暫停莉御,使外部請求耗時異常增長撇吞;但是,并不能解釋如此規(guī)律的毛刺礁叔。抱著“死馬當活馬醫(yī)”的想法牍颈,使用如下命令

jstat -gc pid 3000

查看了服務的GC情況,結(jié)果有了意外發(fā)現(xiàn):產(chǎn)生毛刺時發(fā)生了多次GC琅关,GC情況如下圖:


毛刺時的GC情況

分析數(shù)據(jù)煮岁,得知產(chǎn)生一個毛刺時Young GC進行了237-231=6次,F(xiàn)ull GC進行了303-294=9次涣易,F(xiàn)ull GC的時間664-641=23秒画机,可知,正是由于GC停頓了20多秒新症,從而使得平均耗時顯著提高步氏。得益于良好的運維,服務啟動時加入了如下參數(shù):

    -XX:+UseConcMarkSweepGC -Xloggc:jvm.log -verbosegc -XX:+PrintGCDetails
    -XX:+PrintGCDateStamps -XX:+PrintGCApplicationStoppedTime -XX:+PrintGCTimeStamps

由此徒爹,可以繼續(xù)分析具體的GC日志:

GC日志部分截圖

注意到GC時發(fā)生了兩次失敿孕选:Promotion FailedConcurrent mode Failuer,分別是進程停頓6.8s和5s隆嗅。截圖中省去了部分日志界阁,實際之后還發(fā)生了兩次Concurrent mode Failuer從而使進程暫停20多秒。
那為什么連GC都如此有規(guī)律的每30分鐘進行呢胖喳?再次排查代碼泡躯,發(fā)現(xiàn)了如下類似的代碼:

    public static void refresh() {
        ConcurrentHashMap<String, Integer> newCache = DBUtil.getCache();
        cache = newCache;
        log.info("refresh cache, size:" + newCache.size());
    }

該服務是一個緩存服務,將數(shù)據(jù)庫中的數(shù)據(jù)讀取到內(nèi)存丽焊,然后提供接口查詢较剃。由于數(shù)據(jù)庫中的數(shù)據(jù)會更新,所以需要固定時間(每30分鐘)從數(shù)據(jù)庫重新讀取數(shù)據(jù)粹懒,刷新緩存重付。查詢數(shù)據(jù)庫中的數(shù)據(jù),發(fā)現(xiàn)已經(jīng)有接近500萬行的數(shù)據(jù)凫乖。當加載這部分數(shù)據(jù)到內(nèi)存時,內(nèi)存需求暴漲,JVM進行了多次耗時的GC帽芽,導致進程暫停删掀,從而使得請求耗時出現(xiàn)毛刺。
找到了問題出現(xiàn)的原因导街,開始著手進行優(yōu)化披泪。由于主要是GC問題,故嘗試不修改業(yè)務代碼搬瑰,直接修改JVM參數(shù)的方式進行優(yōu)化款票。在優(yōu)化之前,需要弄明白Promotion FailedConcurrent mode Failuer的原因泽论。
晉升失敗Promotion Failed的原因主要有:

  • Survivor區(qū)空間不足艾少,Survivor中的對象還不足以晉升到老年代,從年輕代晉升到Survivor的對象大于了Survivor剩余的空間翼悴。
  • 從年輕代直接晉升到老年代的對象大于老年代剩余的空間缚够。

由于本例中的對象是突然暴漲的,所以可確定原因為后者鹦赎,所以需要增大老年代的空間谍椅。
并發(fā)模式失敗Concurrent mode Failuer的原因是:CMS GC回收對象的速度趕不上用戶申請對象的速度。當發(fā)生并發(fā)模式失敗后古话,CMS GC會退回到Serial Old GC使用串行回收雏吭,從而使得CMS GC不能發(fā)揮作用。解決該問題的方法有:

  • 盡早進行CMS GC即調(diào)低-XX:CMSInitiatingOccupancyFraction參數(shù)陪踩,默認為68
  • 增大老年代空間

由此杖们,將JVM參數(shù)由之前的:

    -Xmx2048m -Xms2048m -XX:NewSize=768m -XX:MaxNewSize=768m

調(diào)整為:

    -Xmx3072m -Xms3072m -XX:NewSize=1536m -XX:MaxNewSize=1536m

增大新生代的初衷是為了直接容納下服務刷新時的臨時對象,不需要晉升到老年代膊毁。觀察原來的老年代大約需要700M所以沒有進行大的擴容胀莹。修改后的效果如下:

請求耗時

高峰耗時減少一半,但依然存在毛刺婚温。查看GC日志描焰,依然存在一次concurrent mode failure
繼續(xù)調(diào)整參數(shù)栅螟,增大老年代:

    -Xmx4096m -Xms4096m -XX:NewSize=1024m -XX:MaxNewSize=1024m

整個堆內(nèi)存從2G擴容到4G荆秦,老年代從1.25G擴容到3G,內(nèi)存已經(jīng)較為充足力图。調(diào)整后步绸,耗時大幅降低,也沒有出現(xiàn)concurrent mode failure吃媒,但依然沒有消除毛刺現(xiàn)象瓤介,效果圖如下:

請求耗時

再次查看GC日志吕喘,發(fā)現(xiàn)耗時主要集中在年輕代回收:
GC情況

嘗試使用UseParallelOldGC加快年輕代回收,但是年老代耗時過長刑桑。不能同時使用Parallel Scavenge回收年輕代氯质,CMS回收年老代真是大坑。最后更換為G1 GC大大減少了Full GC祠斧,毛刺抖動得到大大緩解闻察,效果如下:
請求耗時

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市琢锋,隨后出現(xiàn)的幾起案子辕漂,更是在濱河造成了極大的恐慌,老刑警劉巖吴超,帶你破解...
    沈念sama閱讀 216,496評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件钉嘹,死亡現(xiàn)場離奇詭異,居然都是意外死亡烛芬,警方通過查閱死者的電腦和手機隧期,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,407評論 3 392
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來赘娄,“玉大人仆潮,你說我怎么就攤上這事∏簿剩” “怎么了性置?”我有些...
    開封第一講書人閱讀 162,632評論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長揍堰。 經(jīng)常有香客問我鹏浅,道長,這世上最難降的妖魔是什么屏歹? 我笑而不...
    開封第一講書人閱讀 58,180評論 1 292
  • 正文 為了忘掉前任隐砸,我火速辦了婚禮,結(jié)果婚禮上蝙眶,老公的妹妹穿的比我還像新娘季希。我一直安慰自己,他們只是感情好幽纷,可當我...
    茶點故事閱讀 67,198評論 6 388
  • 文/花漫 我一把揭開白布式塌。 她就那樣靜靜地躺著,像睡著了一般友浸。 火紅的嫁衣襯著肌膚如雪峰尝。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,165評論 1 299
  • 那天收恢,我揣著相機與錄音武学,去河邊找鬼祭往。 笑死,一個胖子當著我的面吹牛劳淆,可吹牛的內(nèi)容都是我干的链沼。 我是一名探鬼主播默赂,決...
    沈念sama閱讀 40,052評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼沛鸵,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了缆八?” 一聲冷哼從身側(cè)響起曲掰,我...
    開封第一講書人閱讀 38,910評論 0 274
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎奈辰,沒想到半個月后栏妖,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,324評論 1 310
  • 正文 獨居荒郊野嶺守林人離奇死亡奖恰,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 37,542評論 2 332
  • 正文 我和宋清朗相戀三年吊趾,在試婚紗的時候發(fā)現(xiàn)自己被綠了抵乓。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片惹悄。...
    茶點故事閱讀 39,711評論 1 348
  • 序言:一個原本活蹦亂跳的男人離奇死亡焦读,死狀恐怖拨拓,靈堂內(nèi)的尸體忽然破棺而出偷厦,到底是詐尸還是另有隱情慷彤,我是刑警寧澤眯搭,帶...
    沈念sama閱讀 35,424評論 5 343
  • 正文 年R本政府宣布色徘,位于F島的核電站错负,受9級特大地震影響坟瓢,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜犹撒,卻給世界環(huán)境...
    茶點故事閱讀 41,017評論 3 326
  • 文/蒙蒙 一折联、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧识颊,春花似錦诚镰、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,668評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至镰踏,卻和暖如春函筋,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背奠伪。 一陣腳步聲響...
    開封第一講書人閱讀 32,823評論 1 269
  • 我被黑心中介騙來泰國打工跌帐, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留首懈,地道東北人。 一個月前我還...
    沈念sama閱讀 47,722評論 2 368
  • 正文 我出身青樓谨敛,卻偏偏與公主長得像究履,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子脸狸,可洞房花燭夜當晚...
    茶點故事閱讀 44,611評論 2 353