在面試時(shí),必不可少的一項(xiàng)就是考察候選人的問(wèn)題解決能力秃症,如何排查XX問(wèn)題跟继?如何優(yōu)化XX系統(tǒng)性能都许。會(huì)使用工具并不能體現(xiàn)不出大家的差別涮拗,出現(xiàn)問(wèn)題時(shí),誰(shuí)能最快的定位問(wèn)題與解決問(wèn)題才能體現(xiàn)出技術(shù)水平,而只會(huì)問(wèn)題排查還不夠,再勤勞的救火隊(duì)友也是沒(méi)有實(shí)際業(yè)務(wù)上的產(chǎn)出挖炬,如何通過(guò)系統(tǒng)化的手段優(yōu)化系統(tǒng),讓系統(tǒng)不再出現(xiàn)問(wèn)題状婶,那升職加薪指日可待意敛。
面試時(shí)馅巷,我一般會(huì)問(wèn):你在做項(xiàng)目的過(guò)程中有遇到過(guò)什么問(wèn)題嗎?一般是怎么解決的草姻?
如果回答是令杈,我遇到了差不多XX問(wèn)題,還有XX問(wèn)題碴倾,那這種問(wèn)題一般太偏向于一個(gè)點(diǎn),而不夠系統(tǒng)掉丽,相比對(duì)工作問(wèn)題也沒(méi)有很好的總結(jié)跌榔。
我認(rèn)為比較好的方式可以參考下面的文章回答,工作中大致遇到過(guò)那種類(lèi)型的問(wèn)題捶障,一般的解決套路是什么僧须,有哪些常見(jiàn)的問(wèn)題解決工具。如果進(jìn)一步談到避免問(wèn)題出現(xiàn)项炼,進(jìn)行系統(tǒng)上優(yōu)化担平,取得了什么成效... 那基本上這個(gè)候選人就通過(guò)了.
假如滿(mǎn)分100分的話(huà):
- 只回答遇到問(wèn)題的一個(gè)點(diǎn): 50分
- 回答大致有哪些類(lèi)型的問(wèn)題: 60分
- 回答常見(jiàn)類(lèi)型問(wèn)題與如何應(yīng)對(duì):80
- 回答常見(jiàn)類(lèi)型問(wèn)題,如何應(yīng)對(duì)锭部,以及排查工具:90
- 回答到了不同的問(wèn)題種類(lèi)暂论,應(yīng)對(duì)方式,常用工具拌禾,以及優(yōu)化手段:滿(mǎn)分...
問(wèn)題排查
日常工作中取胎,可以嘗試積累自己的一項(xiàng)問(wèn)題清單列表,出現(xiàn)問(wèn)題時(shí)依次檢查此刻的問(wèn)題能對(duì)應(yīng)到清單中的那個(gè)問(wèn)題上:
- 邏輯錯(cuò)誤: NPE湃窍,邊界問(wèn)題闻蛀,死循環(huán)
- 性能問(wèn)題: RT陡增,吞吐量上不去您市,CPU飆高觉痛,負(fù)載過(guò)高
- 內(nèi)存問(wèn)題:頻繁FullGC,OOM茵休,內(nèi)存泄漏
- 并發(fā)問(wèn)題:分布式鎖不生效薪棒,重復(fù)調(diào)用,超賣(mài)
- 數(shù)據(jù)問(wèn)題:臟數(shù)據(jù)泽篮,數(shù)據(jù)異常
- 人為問(wèn)題:配置錯(cuò)誤盗尸,刪庫(kù)跑路...
- ...
需要自己平時(shí)做一些積累,遇到的錯(cuò)誤進(jìn)行記錄與復(fù)盤(pán)帽撑,總結(jié)與梳理泼各,到形成自己的一套問(wèn)題列表,并且能進(jìn)行針對(duì)性的解決亏拉。
排查過(guò)程
- 快速止血:回滾扣蜻,開(kāi)關(guān)逆巍,降級(jí),重啟莽使,隔離
- 保留現(xiàn)場(chǎng):GCDump锐极,ThreadDump
- 定位原因:嘗試復(fù)現(xiàn)問(wèn)題,找到根本原因
- 解決問(wèn)題:
排查工具
日志:阿里云SLS芳肌,ELK灵再,內(nèi)部分布式日志系統(tǒng)
監(jiān)控:
- 系統(tǒng)監(jiān)控:CPU,內(nèi)存亿笤,網(wǎng)絡(luò)翎迁,硬盤(pán)。 一般在機(jī)器上安裝agent收集機(jī)器信息
- 調(diào)用鏈監(jiān)控:Cat净薛,EagleEye汪榔,Zipkin+Slueth。 分布式系統(tǒng)不同模塊之間的調(diào)用鏈路追蹤肃拜,定位問(wèn)題系統(tǒng)
- 業(yè)務(wù)監(jiān)控:Prometheus痴腌,實(shí)時(shí)業(yè)務(wù)數(shù)據(jù)報(bào)表 。 和業(yè)務(wù)相關(guān)數(shù)據(jù)燃领,一般系統(tǒng)服務(wù)的技術(shù)或業(yè)務(wù)人員關(guān)注
問(wèn)題定位:
- Java自帶工具:jps士聪,jstack,jmap柿菩,jvivualvm戚嗅,jconsole
- Linux命令:top,tcpdump枢舶,iostat ...
- Arthas
- 現(xiàn)場(chǎng)日志
系統(tǒng)優(yōu)化
快懦胞,穩(wěn),準(zhǔn):系統(tǒng)響應(yīng)要快凉泄,系統(tǒng)運(yùn)行要穩(wěn)定躏尉,業(yè)務(wù)數(shù)據(jù)要準(zhǔn)確
一些指標(biāo):
- 吞吐量:QPS/TPS 單位時(shí)間內(nèi)能處理的請(qǐng)求數(shù)
- 響應(yīng)時(shí)間:RT 處理單個(gè)請(qǐng)求花費(fèi)的時(shí)長(zhǎng),一般會(huì)由網(wǎng)絡(luò)傳輸延遲后众、排隊(duì)延遲和實(shí)際處理耗時(shí)幾個(gè)部分共同組成胀糜。
- 可伸縮性:增加機(jī)器來(lái)提升系統(tǒng)性能,理想情況下為線(xiàn)性伸縮
性能優(yōu)化與做功能需求一樣蒂誉,都是為業(yè)務(wù)服務(wù)的教藻。優(yōu)化之前想清楚,是否真的需要這次優(yōu)化右锨,性能優(yōu)化都不是免費(fèi)的午餐括堤,優(yōu)化做的越多,往往可維護(hù)性也會(huì)越差
性能優(yōu)化套路:從底層到每一行代碼。層次劃分明確悄窃,從不同的角度優(yōu)化
- 機(jī)器內(nèi)核讥电,JDK,依賴(lài)中間件 (參數(shù)調(diào)整轧抗,依賴(lài)升級(jí))
- 數(shù)據(jù)結(jié)構(gòu)與算法優(yōu)化恩敌,模型優(yōu)化,批量横媚,異步纠炮,并行等
- 日志異步化;
- 減少序列化和反序列化灯蝴, 如果想要性能用set和get抗碰;
- Java Stream 大對(duì)象、復(fù)雜操作盡量不要用绽乔;
- 頻繁的單次調(diào)用試著改為批量調(diào)用
- 代碼,流程精簡(jiǎn)碳褒,減少內(nèi)存開(kāi)銷(xiāo)...
穩(wěn)定性?xún)?yōu)化:
- 集群高可用折砸,健康檢查,分布式協(xié)議
- 限流沙峻,降級(jí)睦授,熔斷,重試
- 資源隔離摔寨,安全生產(chǎn)
可維護(hù)性?xún)?yōu)化:《碼出高效-阿里巴巴代碼規(guī)范》
- 編碼規(guī)范
- 代碼重構(gòu)
- 技術(shù)演進(jìn)
最后
如果能總結(jié)出一套自己的問(wèn)題解決方法論去枷,那就可以很快形成與別人拉開(kāi)差距的核心競(jìng)爭(zhēng)力,我也需要再對(duì)這方面多做一些思考與梳理是复。