做電商業(yè)務開發(fā)這幾年盐茎,我學到的系統(tǒng)穩(wěn)定性建設方法

一兴垦、背景

作為開發(fā)人員,系統(tǒng)穩(wěn)定性是一個繞不開的話題,特別是做電商業(yè)務系統(tǒng)這幾年探越,幾乎天天都要關注穩(wěn)定性狡赐,一旦出現故障對于公司來說都是一場災難,因此保障系統(tǒng)穩(wěn)定是最關鍵的要求钦幔,本文將根據最近幾年負責電商系統(tǒng)涉及到的穩(wěn)定性建設常用方法做一次總結枕屉。

二、什么是系統(tǒng)穩(wěn)定性鲤氢?

對于業(yè)務系統(tǒng)來說搀擂,不管有什么因素對我們的系統(tǒng)干擾,都要盡可能的提供高可用性卷玉,不影響系統(tǒng)功能用戶體驗哨颂。

影響穩(wěn)定性有哪些因素呢?

1相种、人為操作

比如不合理的系統(tǒng)變更威恼,外部的攻擊,訪問流量突增

2寝并、自然災害

比如網線光纖被挖

3箫措、硬件故障

比如自然硬盤損壞,內存網絡

從以往經驗來看食茎,其實影響系統(tǒng)穩(wěn)定性最多的原因是人為因素造成的蒂破。

二、這些年學到的穩(wěn)定性方法

1别渔、注重代碼健壯性附迷,注重codereview

代碼開發(fā)需要考慮可觀測,可降級哎媚,考慮異常容錯性喇伯,合理使用緩存,線程池等拨与,對于外部依賴需要超時機制

2稻据、安全變更,遵守sop

任何生產環(huán)境的變更都要按公司規(guī)范操作买喧,做到可灰度捻悯,可監(jiān)控可回滾

3淤毛、系統(tǒng)鏈路梳理今缚,強弱依賴梳理

把系統(tǒng)核心鏈路流程梳理,分析系統(tǒng)的出強弱依賴低淡,分析是否有損降級

4姓言、接口降級瞬项,限流,熔斷何荚,超時設置

需要對下游依賴設置可降級囱淋,可熔斷超時餐塘,避免外部系統(tǒng)性能或者故障拖垮服務

對本服務接口設置必要的限流妥衣,一般有網關層總限流單機限流,防止突發(fā)流程沖擊系統(tǒng)

5唠倦、定期業(yè)務系統(tǒng)降級演練

需要定期對系統(tǒng)的業(yè)務功能進行降級演練称鳞,只有真實演練過了涮较,線上有問題的時候才可以臨危不亂稠鼻。

6、系統(tǒng)預案準備充分

業(yè)務功能上線前都需要做好降級預案狂票,包括技術和業(yè)務層面的準備候齿,這樣出現問題可以快速恢復止血

7闺属、系統(tǒng)或全鏈路壓測

新功能上線需要做壓測摸高慌盯,日常也需要常態(tài)化壓測,通過壓測用于合理評估系統(tǒng)資源是否合理掂器,可以及時消除容量和性能瓶頸隱患

8亚皂、業(yè)務系統(tǒng)日常巡檢

  • 業(yè)務指標巡檢

對于業(yè)務系統(tǒng)這點是非常重要的,我們需要觀察業(yè)務指標趨勢国瓮,業(yè)務指標一般有一定的規(guī)律灭必,如果變化比較大可能業(yè)務有調整,可以評估是否正常的業(yè)務乃摹。

  • 業(yè)務流量qps巡檢

巡檢qps的環(huán)比變化禁漓,發(fā)現異常的流量,防止業(yè)務或者流量突增對系統(tǒng)沖擊

  • 接口響應時間rt巡檢

發(fā)現系統(tǒng)響應時間的變化孵睬,主動發(fā)現問題

  • 系統(tǒng)異常巡檢

自動發(fā)現系統(tǒng)的錯誤播歼,提早評估業(yè)務影響

9、中間件巡檢

  • Mysql巡檢

mysql慢查詢

mysql的cpu繁忙度

mysql磁盤空間大小與增長情況

mysql的主鍵或者分布式id是否將達到閾值

上面這些是需要重點關注的部分掰读,通過巡檢提前發(fā)現系統(tǒng)隱患秘狞,降低故障發(fā)生概率,提高可用性蹈集。

  • redis巡檢

redis的cpu繁忙度

redis熱點key的變化

redis大key的變化

redis的數據分布均衡情況

上面幾個點是關注多的烁试,如果使用的云上的產品,都有比較好的可視化監(jiān)控能力雾狈,我們通過監(jiān)控面板發(fā)現問題廓潜。

10、系統(tǒng)值班

針對重要節(jié)假日,預估會有流量高峰的時間辩蛋,安排相關人員值守呻畸,重點關注系統(tǒng)水位,比如流量qps,cpu悼院,有無異常等伤为,還關注客服響應群,保障有問題時可以及時響應

11据途、告警

配置核心告警群绞愚,把系統(tǒng)核心告警統(tǒng)一到群里,系統(tǒng)相關人需要在群里颖医,需要將重要的業(yè)務情況同步播報在群里位衩,系統(tǒng)異常情況告警出來,方便快速發(fā)現問題熔萧。

三糖驴、總結

本文結合作者工作中穩(wěn)定性建設相關的經驗做了總結,存在不足歡迎補充或者指正佛致,歡迎大家在評論區(qū)分享下自己是如何落地穩(wěn)定性建設的贮缕。

穩(wěn)定性建設是一個長期的任務,不可能一朝一夕就把穩(wěn)定性做好俺榆,而是需要持續(xù)不斷的迭代優(yōu)化感昼。

作為開發(fā)人員,我們應該始終對生產系統(tǒng)保持敬畏之心罐脊。

堅持相信有輸入一定要有輸出定嗓,希望我們的技術能力越來越強大。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末爹殊,一起剝皮案震驚了整個濱河市蜕乡,隨后出現的幾起案子,更是在濱河造成了極大的恐慌梗夸,老刑警劉巖层玲,帶你破解...
    沈念sama閱讀 222,378評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現場離奇詭異反症,居然都是意外死亡辛块,警方通過查閱死者的電腦和手機,發(fā)現死者居然都...
    沈念sama閱讀 94,970評論 3 399
  • 文/潘曉璐 我一進店門铅碍,熙熙樓的掌柜王于貴愁眉苦臉地迎上來润绵,“玉大人,你說我怎么就攤上這事胞谈〕九危” “怎么了憨愉?”我有些...
    開封第一講書人閱讀 168,983評論 0 362
  • 文/不壞的土叔 我叫張陵,是天一觀的道長卿捎。 經常有香客問我配紫,道長,這世上最難降的妖魔是什么午阵? 我笑而不...
    開封第一講書人閱讀 59,938評論 1 299
  • 正文 為了忘掉前任躺孝,我火速辦了婚禮,結果婚禮上底桂,老公的妹妹穿的比我還像新娘植袍。我一直安慰自己,他們只是感情好籽懦,可當我...
    茶點故事閱讀 68,955評論 6 398
  • 文/花漫 我一把揭開白布于个。 她就那樣靜靜地躺著,像睡著了一般猫十。 火紅的嫁衣襯著肌膚如雪览濒。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,549評論 1 312
  • 那天拖云,我揣著相機與錄音,去河邊找鬼应又。 笑死宙项,一個胖子當著我的面吹牛,可吹牛的內容都是我干的株扛。 我是一名探鬼主播尤筐,決...
    沈念sama閱讀 41,063評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼洞就!你這毒婦竟也來了盆繁?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 39,991評論 0 277
  • 序言:老撾萬榮一對情侶失蹤旬蟋,失蹤者是張志新(化名)和其女友劉穎油昂,沒想到半個月后,有當地人在樹林里發(fā)現了一具尸體倾贰,經...
    沈念sama閱讀 46,522評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡冕碟,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 38,604評論 3 342
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現自己被綠了匆浙。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片安寺。...
    茶點故事閱讀 40,742評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖首尼,靈堂內的尸體忽然破棺而出挑庶,到底是詐尸還是另有隱情言秸,我是刑警寧澤,帶...
    沈念sama閱讀 36,413評論 5 351
  • 正文 年R本政府宣布迎捺,位于F島的核電站井仰,受9級特大地震影響,放射性物質發(fā)生泄漏破加。R本人自食惡果不足惜俱恶,卻給世界環(huán)境...
    茶點故事閱讀 42,094評論 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望范舀。 院中可真熱鬧合是,春花似錦、人聲如沸锭环。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,572評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽辅辩。三九已至难礼,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間玫锋,已是汗流浹背蛾茉。 一陣腳步聲響...
    開封第一講書人閱讀 33,671評論 1 274
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留撩鹿,地道東北人谦炬。 一個月前我還...
    沈念sama閱讀 49,159評論 3 378
  • 正文 我出身青樓,卻偏偏與公主長得像节沦,于是被迫代替她去往敵國和親键思。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 45,747評論 2 361

推薦閱讀更多精彩內容