現(xiàn)網(wǎng)出故障了怎么辦较屿?

問(wèn):現(xiàn)網(wǎng)出故障了怎么辦?
答:木有不出故障的現(xiàn)網(wǎng)卓练,遇到報(bào)障隘蝎,首先需要的是冷靜,然后有一套解決思路(包含安撫客戶)襟企,盡最快的能力修復(fù)問(wèn)題嘱么,給客戶一個(gè)能接受的合理的理由。

問(wèn):處理現(xiàn)網(wǎng)故障需把握住哪些點(diǎn)整吆?
答:態(tài)度積極友好拱撵、回復(fù)一致合理

1: 態(tài)度
在沒(méi)有定位清楚原因前,不和客戶爭(zhēng)辯/推卸責(zé)任表蝙。
非我方原因時(shí)也需要積極配合其他方定位問(wèn)題拴测。
2: 給客戶一致且合理的回復(fù)
在和客戶解釋故障原因時(shí)最好有指定的回復(fù)人,其他成員保持沉默府蛇,切記多個(gè)人和客戶說(shuō)出多個(gè)原因集索。

問(wèn):怎么解決故障?
答:定位汇跨、分析务荆、方案、修復(fù)穷遂、升級(jí)函匕。

本文著重講解定位和分析,且非功能Bug的故障蚪黑。


  1. 定位故障的前提
    定位故障需要有兩個(gè)前提盅惜,一個(gè)是熟悉環(huán)境/業(yè)務(wù)中剩,另一個(gè)是有正常情況的峰值數(shù)據(jù)。

前提一:定位者熟悉網(wǎng)絡(luò)部署抒寂、邏輯部署结啼、業(yè)務(wù)/功能流程、應(yīng)用配置屈芜。
首先能立馬判斷出功能缺陷郊愧?還是性能問(wèn)題。
其次在定位前排查時(shí)不需要任何人的指導(dǎo)井佑,就能快速去驗(yàn)證他的猜測(cè)和所想属铁。
切記:不要找一個(gè)對(duì)以上四個(gè)方面都不熟悉的純技術(shù)牛人來(lái)主導(dǎo)定位,純技術(shù)牛人適合做協(xié)助毅糟,而不是把他放在一個(gè)陌生的環(huán)境讓他來(lái)主導(dǎo)整件事情红选。
因?yàn)樗裁匆膊皇煜だ焦斓亩ㄎ粏?wèn)題姆另,就會(huì)問(wèn)N個(gè)問(wèn)題,等他問(wèn)完一堆問(wèn)題坟乾,時(shí)間也就悄然流逝啦迹辐。

前提二:有正常情況的峰值數(shù)據(jù)。
有數(shù)據(jù)對(duì)比能立馬找到異常點(diǎn)甚侣,可省卻很多猜測(cè)后的驗(yàn)證工作明吩。

  1. 定位問(wèn)題第一步---確認(rèn)資源使用情況
    需要資源使用資源有Cpu、Memory殷费、IO印荔、Network。


    確定資源使用情況.jpg

    和正常情況時(shí)的峰值數(shù)據(jù)比較详羡,找出明顯升高的地方仍律。
    不同類型的服務(wù)器(數(shù)據(jù)庫(kù)服務(wù)器、應(yīng)用服務(wù)器实柠、圖片服務(wù)器)水泉,各檢查一臺(tái)。
    可以得到的結(jié)果:在某一類型服務(wù)器上某一資源使用率過(guò)高窒盐。

  2. 確定案發(fā)現(xiàn)場(chǎng)-定位異常起始點(diǎn)
    3.1 以JAVA應(yīng)用為例
    倘若通過(guò)資源使用情況判斷出是應(yīng)用服務(wù)器有問(wèn)題草则。
    Cpu消耗高
    jstack [-l ]<pid> | tee -a jstack.log

    Java應(yīng)用.jpg

    找自己公司程序代碼即可
    Memory消耗高
    顯示java進(jìn)程內(nèi)存使用的相關(guān)信息
    jmap pid #打印內(nèi)存使用的摘要信息
    jmap –heap pid #java heap信息
    jmap -histo:live pid #統(tǒng)計(jì)對(duì)象count ,live表示在使用
    jmap -histo pid >mem.txt #打印比較簡(jiǎn)單的各個(gè)有多少個(gè)對(duì)象占了多少內(nèi)存的信息蟹漓,一般重定向的文件
    jmap -dump:format=b,file=mem.dat pid #將內(nèi)存使用的詳細(xì)情況輸出到mem.dat 文件
    kill -3 #可以看到在catalina.out中看到新生代炕横、年輕代、老年代分配情況葡粒。
    ps: jmap -dump 和jmap -histo:live消耗大份殿,會(huì)使得jvm處在假死狀態(tài)的姿锭,造成服務(wù)中斷,因此建議在服務(wù)癱瘓時(shí)使用它伯铣。

3.2 數(shù)據(jù)庫(kù)服務(wù)器的問(wèn)題
倘若通過(guò)資源使用情況判斷出是數(shù)據(jù)庫(kù)服務(wù)器有問(wèn)題呻此。

數(shù)據(jù)庫(kù).jpg
awr的使用詳見(jiàn)-Oracle AWR的使用
3.3 中間件的問(wèn)題
以Tomcat為例,可用probe監(jiān)控
主監(jiān)控內(nèi)存使用情況腔寡、線程使用情況焚鲜、響應(yīng)時(shí)間、請(qǐng)求量放前。

  1. 分析異常點(diǎn)
    通過(guò)第3步的確定案發(fā)現(xiàn)場(chǎng)已找到了異常出沒(méi)的地方忿磅,接下來(lái)就是具體問(wèn)題具體分析啦。
    如是JAVA程序的問(wèn)題凭语,不管是代碼本身問(wèn)題葱她,還是架構(gòu)設(shè)計(jì)上的問(wèn)題,都需要CTO帶著研發(fā)出解決方案似扔。
    如是中間件的問(wèn)題吨些,Tomcat中間件可改的內(nèi)存+線程,還是解決不了問(wèn)題擴(kuò)展更多的Tomcat炒辉,升級(jí)Tomcat版本豪墅。
    如是數(shù)據(jù)庫(kù)的問(wèn)題,以MySQL慢為例


    數(shù)據(jù)庫(kù)慢.jpg
  2. 總結(jié)
    當(dāng)接收到現(xiàn)網(wǎng)報(bào)障時(shí)黔寇,首先不要慌偶器,耐心聽(tīng)客戶描述完問(wèn)題,安撫客戶情緒(如客戶有情緒時(shí))缝裤,誠(chéng)懇跟客戶說(shuō)馬上處理-不推卸問(wèn)題屏轰,然后是真的馬上安排人處理-不拖拉問(wèn)題。
    在定位問(wèn)題時(shí)憋飞,首先確認(rèn)服務(wù)器資源使用情況霎苗,定位是哪類型服務(wù)器出問(wèn)題-圈定問(wèn)題的范圍,然后去具體服務(wù)器上查異常點(diǎn)搀崭,拿到具體異常點(diǎn)后叨粘,就該找誰(shuí)找誰(shuí)啦。
    如果不能定位到具體的異常點(diǎn)瘤睹,你就需要找一群人來(lái)幫忙升敲,比如:DBA、開(kāi)發(fā)轰传、網(wǎng)絡(luò)管理員驴党。先不說(shuō)找一群人來(lái)所需的時(shí)間和能不能都找到的問(wèn)題,假設(shè)都一喊到位了获茬,你需要跟他們解釋現(xiàn)象港庄,然后排任務(wù)倔既,溝通成本蹭蹭蹭就上去,同時(shí)時(shí)間也過(guò)去了鹏氧,客戶的電話說(shuō)不定也就再次過(guò)來(lái)了...渤涌。
    最好的情況是你在問(wèn)題出苗頭的時(shí)候就問(wèn)題,將問(wèn)題扼殺在搖籃中把还,這個(gè)需要運(yùn)維監(jiān)控工具实蓬,現(xiàn)網(wǎng)是必須有一套的。
    如沒(méi)有監(jiān)控工具吊履,那你自己就需要有一定故障定位能力安皱,確認(rèn)問(wèn)題后,你才能更快找到人來(lái)解決問(wèn)題艇炎。
    總之:你自己要強(qiáng)大酌伊。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市缀踪,隨后出現(xiàn)的幾起案子居砖,更是在濱河造成了極大的恐慌,老刑警劉巖辜贵,帶你破解...
    沈念sama閱讀 212,816評(píng)論 6 492
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件悯蝉,死亡現(xiàn)場(chǎng)離奇詭異归形,居然都是意外死亡托慨,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,729評(píng)論 3 385
  • 文/潘曉璐 我一進(jìn)店門暇榴,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)厚棵,“玉大人,你說(shuō)我怎么就攤上這事蔼紧∑庞玻” “怎么了?”我有些...
    開(kāi)封第一講書人閱讀 158,300評(píng)論 0 348
  • 文/不壞的土叔 我叫張陵奸例,是天一觀的道長(zhǎng)彬犯。 經(jīng)常有香客問(wèn)我,道長(zhǎng)查吊,這世上最難降的妖魔是什么谐区? 我笑而不...
    開(kāi)封第一講書人閱讀 56,780評(píng)論 1 285
  • 正文 為了忘掉前任,我火速辦了婚禮逻卖,結(jié)果婚禮上宋列,老公的妹妹穿的比我還像新娘。我一直安慰自己评也,他們只是感情好炼杖,可當(dāng)我...
    茶點(diǎn)故事閱讀 65,890評(píng)論 6 385
  • 文/花漫 我一把揭開(kāi)白布灭返。 她就那樣靜靜地躺著,像睡著了一般坤邪。 火紅的嫁衣襯著肌膚如雪熙含。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書人閱讀 50,084評(píng)論 1 291
  • 那天艇纺,我揣著相機(jī)與錄音婆芦,去河邊找鬼。 笑死喂饥,一個(gè)胖子當(dāng)著我的面吹牛消约,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播员帮,決...
    沈念sama閱讀 39,151評(píng)論 3 410
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼或粮,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了捞高?” 一聲冷哼從身側(cè)響起氯材,我...
    開(kāi)封第一講書人閱讀 37,912評(píng)論 0 268
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎硝岗,沒(méi)想到半個(gè)月后氢哮,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 44,355評(píng)論 1 303
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡型檀,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 36,666評(píng)論 2 327
  • 正文 我和宋清朗相戀三年冗尤,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片胀溺。...
    茶點(diǎn)故事閱讀 38,809評(píng)論 1 341
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡裂七,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出仓坞,到底是詐尸還是另有隱情背零,我是刑警寧澤,帶...
    沈念sama閱讀 34,504評(píng)論 4 334
  • 正文 年R本政府宣布无埃,位于F島的核電站徙瓶,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏嫉称。R本人自食惡果不足惜侦镇,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 40,150評(píng)論 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望澎埠。 院中可真熱鬧虽缕,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 30,882評(píng)論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至剩胁,卻和暖如春诉植,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背昵观。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 32,121評(píng)論 1 267
  • 我被黑心中介騙來(lái)泰國(guó)打工晾腔, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人啊犬。 一個(gè)月前我還...
    沈念sama閱讀 46,628評(píng)論 2 362
  • 正文 我出身青樓灼擂,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親觉至。 傳聞我的和親對(duì)象是個(gè)殘疾皇子剔应,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 43,724評(píng)論 2 351

推薦閱讀更多精彩內(nèi)容