(12)做好系統(tǒng)穩(wěn)定性建設(shè)(上)

穩(wěn)定性建設(shè)四要素:人耽装、工具愤炸、預(yù)案、目標(biāo)

穩(wěn)定性建設(shè)四個(gè)方向:根基牢(45%)日常(30%)預(yù)案(15%)容量(10%)

一掉奄、穩(wěn)定性建設(shè)四要素

人规个、工具、預(yù)案和目標(biāo)姓建。

(1)人

主導(dǎo)是開(kāi)發(fā)诞仓、測(cè)試和運(yùn)維,還有安全速兔、產(chǎn)品等參與墅拭,在OKR中背負(fù)一部分,合規(guī)化涣狗,有跡可循谍婉,

1)編碼規(guī)范:對(duì)外接口命名、統(tǒng)一異常父類(lèi)镀钓、異常碼規(guī)范穗熬、對(duì)外拋異常還是返回錯(cuò)誤碼、統(tǒng)一三方庫(kù)版本掸宛、哪些場(chǎng)景必須用內(nèi)部公共庫(kù)死陆、埋點(diǎn)日志怎么打、統(tǒng)一日志唧瘾、監(jiān)控切面實(shí)現(xiàn)等

? 為什么統(tǒng)一異常父類(lèi)和異常碼:統(tǒng)一后措译,很多切面就可公共庫(kù)做,如監(jiān)控饰序、出入口日志打印领虹,異常攔截,壓測(cè)標(biāo)識(shí)透?jìng)髑笤ァ⑻厥獾淖侄温顸c(diǎn)等塌衰。例:可能不同模塊異常父類(lèi)不同的诉稍,訂單模塊異常父類(lèi)OrderException、交易支付TradeException最疆,OrderException和TradeException的父類(lèi)BizException(定義在通用共公共庫(kù)中)杯巨,統(tǒng)一200代表正確碼,異常6位數(shù)字(前3位模塊努酸,后3位異常類(lèi)型)服爷,

2)公共庫(kù):內(nèi)部公共庫(kù)(也升級(jí)迭代),如日志庫(kù)获诈、HTTP庫(kù)仍源、線程池庫(kù)、監(jiān)控埋點(diǎn)庫(kù)等舔涎,都“久經(jīng)考驗(yàn)”應(yīng)強(qiáng)制用笼踩,。

3)項(xiàng)目結(jié)構(gòu)規(guī)范:統(tǒng)一結(jié)構(gòu)快速接手項(xiàng)目

4)數(shù)據(jù)庫(kù)規(guī)范:庫(kù)名亡嫌、表名嚎于、索引、字段挟冠、分庫(kù)分表規(guī)范明確匾旭,分表數(shù)不用2的冪(很多人認(rèn)為計(jì)算分表時(shí)用位運(yùn)算更快,這個(gè)開(kāi)銷(xiāo)相比數(shù)據(jù)庫(kù)操作可忽略)圃郊,1024張表用質(zhì)數(shù)(接近1024的1019)价涝,數(shù)據(jù)分的更均勻

(2)工具

能做什么持舆?做到什么程度色瘩?如何降低穩(wěn)定性工作成本?

日志采集分析檢索(滴滴Arius)逸寓、監(jiān)控告警(滴滴Odin Metrics)居兆、分布式追蹤系統(tǒng)(Google的Dapper、滴滴把脈)竹伸、自動(dòng)化打包部署(滴滴One Experience)泥栖、服務(wù)降級(jí)系統(tǒng)(滴滴SDS)、預(yù)案平臺(tái)(滴滴911)勋篓、根因定位(記錄所有故障發(fā)生前所有系統(tǒng)變更事件)吧享、放火平臺(tái)等。

內(nèi)部公共庫(kù)譬嚣,接入Odin Metrics和把脈幾乎不要做額外工作(接入把脈要提日志采集工單钢颂,頭疼),不要吝嗇工具投入拜银,用或參考開(kāi)源框架

(3)預(yù)案

故障時(shí)通知:團(tuán)隊(duì)內(nèi)其他成員殊鞭、Leader(尋求幫助)和客服遭垛、上游業(yè)務(wù)開(kāi)發(fā)等可能影響方

選出協(xié)調(diào)者,什么情況選

協(xié)調(diào)者職責(zé):排查和止損操灿,避免介入同學(xué)重復(fù)工作锯仪,持續(xù)和影響方溝通。

操作開(kāi)關(guān)誰(shuí)決策:對(duì)于排查問(wèn)題和止損同學(xué)來(lái)說(shuō)趾盐,查代碼看開(kāi)關(guān)名卵酪,關(guān)掉一個(gè)功能需多個(gè)開(kāi)關(guān),什么條件能操作

止損方式谤碳、原則善后方案誰(shuí)拍板

(4)目標(biāo)

星辰花將故障分成P0至P5六個(gè)等級(jí)溢豆,P0蜒简、P1、P2屬重大:

二漩仙、穩(wěn)定性建設(shè)四個(gè)方向

(1)根基牢(45%)

CR:閉環(huán)搞定搓茬,時(shí)間長(zhǎng)容易懈怠,大于4人日項(xiàng)目進(jìn)小黑屋CR

設(shè)計(jì):講最終和淘汰方案队他!

提測(cè):補(bǔ)單測(cè)卷仑、自測(cè)、聯(lián)調(diào)麸折、通過(guò)用例

上線流程:小流量集群灰度(單量少城市做小流量集群)锡凝,再線上灰度,觀察線上大盤(pán)和日志垢啼,有問(wèn)題快回滾

(2)日常工作在(30%)

監(jiān)控告警窜锯、及時(shí)消滅線上小隱患、跨團(tuán)隊(duì)溝通芭析、復(fù)盤(pán)锚扎、定期會(huì)議來(lái)總結(jié)

(3)預(yù)案(15%)

去定位和止損復(fù)雜的線上問(wèn)題時(shí)。緊急預(yù)案重要馁启,動(dòng)態(tài)預(yù)案才有效

1)分場(chǎng)和完善:分場(chǎng)景整理如MySQL驾孔、MQ、發(fā)單接口故障惯疙。如有損翠勉,副作描述清楚。

2)驗(yàn)證預(yù)案:借助放火平臺(tái)和降級(jí)系統(tǒng)霉颠,給主流程非核心依賴注入故障

(4)容量(10%)

老板問(wèn)你明年單量要Double要預(yù)算眉菱,要規(guī)劃你憑什么給?壓測(cè)容量來(lái)預(yù)估掉分。摸到分布式系統(tǒng)中“短木板”才知道系統(tǒng)吞吐量(容量)

投入10%的精力來(lái)摸容量俭缓、擴(kuò)容量克伊、水位預(yù)警等。線上有大約10%故障和容量有關(guān)华坦,擴(kuò)容三點(diǎn):

1)全鏈路壓測(cè):老瓶頸可能消失愿吹,新的出現(xiàn),之前結(jié)果失效惜姐,定期去摸這個(gè)閾值犁跪。

2)擴(kuò)容演練:緊急時(shí)候,彈性云擴(kuò)容比修改閾值重新上線更快

3)多活建設(shè)


https://blog.csdn.net/manzhizhen/article/details/103642565

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末歹袁,一起剝皮案震驚了整個(gè)濱河市坷衍,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌条舔,老刑警劉巖枫耳,帶你破解...
    沈念sama閱讀 218,386評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異孟抗,居然都是意外死亡迁杨,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,142評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門(mén)凄硼,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)铅协,“玉大人,你說(shuō)我怎么就攤上這事摊沉『罚” “怎么了?”我有些...
    開(kāi)封第一講書(shū)人閱讀 164,704評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵说墨,是天一觀的道長(zhǎng)预皇。 經(jīng)常有香客問(wèn)我,道長(zhǎng)婉刀,這世上最難降的妖魔是什么吟温? 我笑而不...
    開(kāi)封第一講書(shū)人閱讀 58,702評(píng)論 1 294
  • 正文 為了忘掉前任,我火速辦了婚禮突颊,結(jié)果婚禮上鲁豪,老公的妹妹穿的比我還像新娘。我一直安慰自己律秃,他們只是感情好爬橡,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,716評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著棒动,像睡著了一般糙申。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上船惨,一...
    開(kāi)封第一講書(shū)人閱讀 51,573評(píng)論 1 305
  • 那天柜裸,我揣著相機(jī)與錄音缕陕,去河邊找鬼。 笑死疙挺,一個(gè)胖子當(dāng)著我的面吹牛扛邑,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播铐然,決...
    沈念sama閱讀 40,314評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼蔬崩,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了搀暑?” 一聲冷哼從身側(cè)響起沥阳,我...
    開(kāi)封第一講書(shū)人閱讀 39,230評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎自点,沒(méi)想到半個(gè)月后桐罕,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,680評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡樟氢,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,873評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了侠鳄。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片埠啃。...
    茶點(diǎn)故事閱讀 39,991評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖伟恶,靈堂內(nèi)的尸體忽然破棺而出碴开,到底是詐尸還是另有隱情,我是刑警寧澤博秫,帶...
    沈念sama閱讀 35,706評(píng)論 5 346
  • 正文 年R本政府宣布潦牛,位于F島的核電站,受9級(jí)特大地震影響挡育,放射性物質(zhì)發(fā)生泄漏巴碗。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,329評(píng)論 3 330
  • 文/蒙蒙 一即寒、第九天 我趴在偏房一處隱蔽的房頂上張望橡淆。 院中可真熱鬧,春花似錦母赵、人聲如沸逸爵。這莊子的主人今日做“春日...
    開(kāi)封第一講書(shū)人閱讀 31,910評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)师倔。三九已至,卻和暖如春周蹭,著一層夾襖步出監(jiān)牢的瞬間趋艘,已是汗流浹背疲恢。 一陣腳步聲響...
    開(kāi)封第一講書(shū)人閱讀 33,038評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留致稀,地道東北人冈闭。 一個(gè)月前我還...
    沈念sama閱讀 48,158評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像抖单,于是被迫代替她去往敵國(guó)和親萎攒。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,941評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容