可觀測(cè)性(一)

可觀測(cè)性頭圖.jpg

可觀測(cè)性一詞誕生于幾十年前的控制理論乱陡。近年來(lái)捣炬,隨著企業(yè)以微服務(wù)熊昌、?服務(wù)器和容器技術(shù)的形式迅速采?了AWS、阿里云等云原?基礎(chǔ)設(shè)施服務(wù)湿酸。在這些分布式系統(tǒng)中追蹤事件的起源需要在云上婿屹、本地或兩者上運(yùn)?的數(shù)千個(gè)進(jìn)程。傳統(tǒng)的監(jiān)控技術(shù)和?具就很難跟蹤這些分布式架構(gòu)中的許多通信路徑和相互依賴關(guān)系推溃。更別提排查問(wèn)題并定位根本原因了昂利。

監(jiān)控技術(shù)和工具革新迫在眉睫。

而可觀測(cè)性一詞近兩年火起來(lái)的導(dǎo)火索是 CNCF 在云原生定義中提到 Observerbility铁坎,并聲稱這是云原生時(shí)代的必備能力蜂奸。

于是從生產(chǎn)所需到概念發(fā)聲,加之包括谷歌在內(nèi)的眾多大廠一擁而上厢呵,“可觀測(cè)性”正式出道窝撵。

可觀測(cè)性的定義

Observability是來(lái)自控制論的一個(gè)概念:

In control theory, observability is a measure for how well internal states of a system can be inferred by knowledge of its external outputs. The observability and controllability of a system are mathematical duals. The concept ofobservability was introduced by American-Hungarian scientist Rudolf E. Kalmanfor linear dynamic systems.

官方話語(yǔ),感興趣的讀者可以自行翻譯襟铭。

用相對(duì)嚴(yán)謹(jǐn)?shù)脑拋?lái)說(shuō)碌奉,可觀測(cè)性指的是一種能力--是通過(guò)檢查其輸出來(lái)衡量系統(tǒng)內(nèi)部狀態(tài)的能?。這些輸出體現(xiàn)內(nèi)部系統(tǒng)狀態(tài)的能力越強(qiáng)寒砖,可觀測(cè)性也就越好赐劣。

簡(jiǎn)單來(lái)看,如果僅使?來(lái)?輸出的信息(即傳感器數(shù)據(jù))可以估計(jì)當(dāng)前狀態(tài)哩都,則系統(tǒng)被認(rèn)為是“可觀測(cè)的”魁兼。

可觀測(cè)性的價(jià)值

谷歌給出可觀測(cè)性的核心價(jià)值很簡(jiǎn)單:快速排障(troubleshooting)。

這個(gè)世界上沒(méi)有不存在 Bug 的系統(tǒng)漠嵌,而隨著系統(tǒng)越來(lái)越精細(xì)咐汞,越來(lái)越復(fù)雜,越來(lái)越動(dòng)態(tài)儒鹿,越來(lái)越龐大化撕,潛藏的問(wèn)題和風(fēng)險(xiǎn)也就越來(lái)越多。

因此约炎,任何一個(gè)軟件的成功植阴,不僅僅要依靠軟件架構(gòu)的合理設(shè)計(jì)蟹瘾,軟件開(kāi)發(fā)的代碼質(zhì)量,更要依靠軟件系統(tǒng)的運(yùn)行維護(hù)掠手。而運(yùn)行維護(hù)的基礎(chǔ)憾朴,就是可觀測(cè)性。

從銀行的交易系統(tǒng)喷鸽,互聯(lián)網(wǎng)公司的業(yè)務(wù)平臺(tái)众雷,到運(yùn)營(yíng)商的云化核心網(wǎng)等運(yùn)行在云上的各類軟件系統(tǒng),每時(shí)每刻都處在一定的風(fēng)險(xiǎn)之中魁衙。而保證這些系統(tǒng)能夠風(fēng)險(xiǎn)可控报腔,穩(wěn)定運(yùn)行,需要做的就是提前發(fā)現(xiàn)異常剖淀,快速定位根本原因,迅速排除或者規(guī)避故障纤房。

因此纵隔,在 CNCF 對(duì)于云原生的定義中,已經(jīng)明確將可觀測(cè)性列為一項(xiàng)必備要素炮姨。

可觀測(cè)性的三大支柱

業(yè)界對(duì)可觀測(cè)性的共識(shí)捌刮,基于可觀測(cè)性的三大支柱“metrics、logs舒岸、traces”绅作。

1、logs(日志)

?志是在特定時(shí)間發(fā)?的事件的?本記錄蛾派,包括說(shuō)明事件發(fā)?時(shí)間的時(shí)間戳和提供上下?的有效負(fù)載俄认。?志有三種格式:純?本、結(jié)構(gòu)化和?進(jìn)制洪乍。純?本是最常?的眯杏,但結(jié)構(gòu)化?志?包括額外的數(shù)據(jù)和元數(shù)據(jù)并且更容易查詢?正變得越來(lái)越流?。當(dāng)系統(tǒng)出現(xiàn)問(wèn)題時(shí)壳澳,?志通常也是您?先查看的地?岂贩。

2、metrics(指標(biāo))

指標(biāo)是在?段時(shí)間內(nèi)測(cè)量的數(shù)值巷波,包括特定屬性萎津,例如時(shí)間戳、名稱抹镊、KPI 和值锉屈。與?志不同,指標(biāo)在默認(rèn)情況下是結(jié)構(gòu)化的髓考,這使得查詢和優(yōu)化存儲(chǔ)變得更加容易部念,讓您能夠?qū)⑺鼈儽A舾?時(shí)間。

3、traces(跟蹤)

跟蹤表示請(qǐng)求通過(guò)分布式系統(tǒng)的端到端旅程儡炼。當(dāng)請(qǐng)求通過(guò)主機(jī)系統(tǒng)時(shí)妓湘, 對(duì)其執(zhí)?的每個(gè)操作(稱為“跨度”)都使?與執(zhí)?該操作的微服務(wù)相關(guān)的重要數(shù)據(jù)進(jìn)?編碼。通過(guò)查看跟蹤乌询,每個(gè)跟蹤都包含?個(gè)或多個(gè)跨度榜贴,您可以通過(guò)分布式系統(tǒng)跟蹤其進(jìn)程并確定瓶頸或故障的原因。

從一個(gè)簡(jiǎn)單的“系統(tǒng)探查--日志搜集--日志統(tǒng)計(jì)”流程來(lái)看:三者之間的關(guān)系從 traces 開(kāi)始妹田,通過(guò)探查等手段采集眾多信息唬党,形成logs,logs詳細(xì)記錄了各種邊界行為(如登陸鬼佣,開(kāi)啟服務(wù)驶拱,關(guān)閉服務(wù),退出系統(tǒng)晶衷,修改數(shù)據(jù))蓝纲,而對(duì)于系統(tǒng)運(yùn)行來(lái)說(shuō),更重要的是 特定事件發(fā)生的次數(shù)晌纫。這些信息可以從日志中提取税迷,但是有一種更有效的方法:metrics。

至此锹漱,如果你的 metrics 與告警相關(guān)聯(lián)箭养,則可在系統(tǒng)關(guān)鍵節(jié)點(diǎn)設(shè)置閾值。如果指標(biāo)超過(guò)了閾值哥牍,隨叫隨到的人員就會(huì)收到Slack或微軟團(tuán)隊(duì)中的電子郵件毕泌、短信或消息∩靶模快速響應(yīng)排出故障懈词。

總結(jié)

可觀測(cè)性簡(jiǎn)單來(lái)說(shuō)就是通過(guò)檢查其輸出來(lái)衡量系統(tǒng)內(nèi)部狀態(tài)的能?。這些輸出體現(xiàn)內(nèi)部系統(tǒng)狀態(tài)的能力越強(qiáng)辩诞,可觀測(cè)性也就越好坎弯。

其價(jià)值在于快速排障(troubleshooting)。

當(dāng)下译暂,業(yè)界對(duì)可觀測(cè)性的共識(shí)抠忘,基于三大支柱“metrics、logs外永、traces”崎脉。

那么,要構(gòu)建一個(gè)優(yōu)秀的可觀測(cè)系統(tǒng)伯顶,僅有 metrics囚灼、logs骆膝、traces 是不是就夠用了呢?我們下期再接著聊灶体。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末阅签,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子蝎抽,更是在濱河造成了極大的恐慌政钟,老刑警劉巖,帶你破解...
    沈念sama閱讀 217,826評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件樟结,死亡現(xiàn)場(chǎng)離奇詭異养交,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)瓢宦,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,968評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門碎连,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人刁笙,你說(shuō)我怎么就攤上這事破花。” “怎么了疲吸?”我有些...
    開(kāi)封第一講書人閱讀 164,234評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)前鹅。 經(jīng)常有香客問(wèn)我摘悴,道長(zhǎng),這世上最難降的妖魔是什么舰绘? 我笑而不...
    開(kāi)封第一講書人閱讀 58,562評(píng)論 1 293
  • 正文 為了忘掉前任蹂喻,我火速辦了婚禮,結(jié)果婚禮上捂寿,老公的妹妹穿的比我還像新娘口四。我一直安慰自己,他們只是感情好秦陋,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,611評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布蔓彩。 她就那樣靜靜地躺著,像睡著了一般驳概。 火紅的嫁衣襯著肌膚如雪赤嚼。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書人閱讀 51,482評(píng)論 1 302
  • 那天顺又,我揣著相機(jī)與錄音更卒,去河邊找鬼。 笑死稚照,一個(gè)胖子當(dāng)著我的面吹牛蹂空,可吹牛的內(nèi)容都是我干的俯萌。 我是一名探鬼主播,決...
    沈念sama閱讀 40,271評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼上枕,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼咐熙!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起姿骏,我...
    開(kāi)封第一講書人閱讀 39,166評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤糖声,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后分瘦,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體蘸泻,經(jīng)...
    沈念sama閱讀 45,608評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,814評(píng)論 3 336
  • 正文 我和宋清朗相戀三年嘲玫,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了悦施。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 39,926評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡去团,死狀恐怖抡诞,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情土陪,我是刑警寧澤昼汗,帶...
    沈念sama閱讀 35,644評(píng)論 5 346
  • 正文 年R本政府宣布,位于F島的核電站鬼雀,受9級(jí)特大地震影響顷窒,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜源哩,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,249評(píng)論 3 329
  • 文/蒙蒙 一鞋吉、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧励烦,春花似錦谓着、人聲如沸。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,866評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)。三九已至却音,卻和暖如春改抡,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背系瓢。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 32,991評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工阿纤, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人夷陋。 一個(gè)月前我還...
    沈念sama閱讀 48,063評(píng)論 3 370
  • 正文 我出身青樓欠拾,卻偏偏與公主長(zhǎng)得像胰锌,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子藐窄,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,871評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容