應(yīng)用性能監(jiān)控方法一覽

在基于云的服務(wù)中杨凑,正常運(yùn)行時間應(yīng)該是最為重要的運(yùn)維指標(biāo)之一。服務(wù)如果頻繁地中斷狈定,不僅會導(dǎo)致正常使用的中斷漫雷,還會對品牌帶來負(fù)面影響瓜富。99.9% 或 99.99% 已經(jīng)算不上高水準(zhǔn)的高可用性了,用戶期望的是 100% 的可用性降盹。為了達(dá)到這一點(diǎn)与柑,我們不僅需要遵循良好的設(shè)計模式并保持服務(wù)的可擴(kuò)展性,同時還要保證硬件蓄坏、應(yīng)用服務(wù)器以及數(shù)據(jù)庫服務(wù)器的健康運(yùn)行价捧。

近日,來自 Zephyr 的 CTO Shailesh Mangal 撰文總結(jié)了各種監(jiān)控類型以及所需的工具涡戳。Zephyr 致力于為開發(fā)和QA 團(tuán)隊提供解決方案结蟋,幫助交付高質(zhì)量的軟件,他們所提供的企業(yè)級測試管理產(chǎn)品能夠與各種工具集成渔彰,實(shí)現(xiàn)測試的實(shí)時管理嵌屎。

在 Shailesh Mangal 的文章中,他總結(jié)了核心基礎(chǔ)設(shè)施監(jiān)控恍涂、應(yīng)用級別監(jiān)控宝惰、微服務(wù)監(jiān)控以及多租戶日志監(jiān)控的工具以及各自的指標(biāo),為我們進(jìn)行應(yīng)用的全方位監(jiān)控提供了指導(dǎo)再沧。

核心基礎(chǔ)設(shè)施監(jiān)控(Core Infrastructure Monitoring尼夺,CIM)

在目前的云基礎(chǔ)設(shè)施中,出現(xiàn)硬件故障是難以避免的炒瘸。核心基礎(chǔ)設(shè)施監(jiān)控會探測硬件瓶頸相關(guān)的早期跡象并捕獲硬件故障信號淤堵,在出現(xiàn)更大的問題之前對其進(jìn)行應(yīng)對∈惭啵基礎(chǔ)設(shè)施監(jiān)控的范圍包括機(jī)器的健康狀況、CPU 使用竞端、內(nèi)存消耗以及網(wǎng)絡(luò)帶寬屎即,基于這些監(jiān)控信息,能夠判斷基礎(chǔ)設(shè)施的當(dāng)前狀態(tài)事富,從而進(jìn)行必要的擴(kuò)展技俐。

有眾多的工具都能幫助我們獲取硬件的健康狀態(tài)。在大多數(shù)情況下统台,托管提供商(如 Amazon AWS 雕擂、 Heroku )的工具基本上就能滿足這種監(jiān)控的需要。

CIM 的指標(biāo)包括:

  • CPU 的平均使用率
  • CPU 峰值的持續(xù)時間
  • 內(nèi)存的平均使用情況
  • 帶寬的輸入輸出情況

應(yīng)用級別監(jiān)控(Application Level Monitoring贱勃,ALM)

應(yīng)用級別的監(jiān)控涉及到監(jiān)控各種服務(wù)器的狀態(tài)井赌,如數(shù)據(jù)庫服務(wù)器谤逼、應(yīng)用服務(wù)器、分析服務(wù)器以及 Hadoop 集群仇穗,而要監(jiān)控的參數(shù)則是與應(yīng)用或工具相關(guān)的流部。

應(yīng)用監(jiān)控方面有不少偉大的工具,如 Datadog New Relic 纹坐。

應(yīng)用監(jiān)控的指標(biāo)包括:

  • JVM 進(jìn)程的內(nèi)存
  • 內(nèi)部線程的數(shù)量
  • 磁盤 IO
  • 索引的讀取 / 寫入操作

微服務(wù)監(jiān)控(Micro Service Monitoring枝冀,MSM)

微服務(wù)是現(xiàn)代云架構(gòu)的組成部分,是實(shí)現(xiàn)水平擴(kuò)展的關(guān)鍵耘子。不管你運(yùn)行的是傳統(tǒng)的單塊系統(tǒng)還是設(shè)計良好且組織精密的微服務(wù)果漾,這些系統(tǒng)都會有不同的 API 端點(diǎn),遵循不同的協(xié)議谷誓,滿足不同的 SLA 需求绒障。微服務(wù)監(jiān)控就是要監(jiān)控每個服務(wù)的吞吐量和性能,進(jìn)而確保在任何時間都能滿足 SLA 的需求片林。這種類型的監(jiān)控一般都需要對應(yīng)用進(jìn)行 instrument 操作端盆,讓 instrumentation 是可配置的,通過收集器(collector)收集應(yīng)用的狀態(tài)费封,并階段性地將這些狀態(tài)發(fā)送到永久存儲焕妙、分析器和預(yù)警系統(tǒng)中。此類監(jiān)控往往會產(chǎn)生大量的數(shù)據(jù)弓摘,因此有可能會影響到性能焚鹊,因此需要仔細(xì)設(shè)計。

微服務(wù)監(jiān)控的工具方面韧献,存儲引擎可以選擇 GraphiteDB InfluxDB 末患,可視化工具可以選擇 Kibana Grafana

微服務(wù)監(jiān)控的指標(biāo)包括:

  • 請求所需的最大時間
  • 請求所需的平均時間
  • 每分鐘請求的平均速度
  • 每天峰值的請求速度

多租戶日志監(jiān)控(Multitenant Log Monitoring锤窑,MLM)

對于多租戶部署的系統(tǒng)來講璧针,很大的一個挑戰(zhàn)就是監(jiān)控日志并推斷系統(tǒng)的內(nèi)部情況,或者當(dāng)出現(xiàn)問題時識別出根本的原因渊啰。無數(shù)的客戶端會產(chǎn)生大量的日志探橱,因此對于日志隔離來說,有唯一的標(biāo)識(如 tenantId)是第一步绘证。除此之外隧膏,日志還需要根據(jù)請求分組,如果請求要跨多個服務(wù)時嚷那,這一點(diǎn)尤為重要胞枕,每個服務(wù)都產(chǎn)生一些日志信息將會有助于識別問題。

多租戶日志監(jiān)控中有非常經(jīng)典的工具魏宽,也就是 ELK( Elasticsearch , Logstash , Kibana )技術(shù)棧腐泻。

多租戶日志監(jiān)控的指標(biāo)包括:

  • 每個租戶的日志
  • 每個請求的日志
  • 每天總的錯誤數(shù)量

總而言之决乎,好的監(jiān)控要涉及到系統(tǒng)各個方面,從硬件贫悄、應(yīng)用再到服務(wù)瑞驱。如果需要構(gòu)建多租戶應(yīng)用的話,使用配置恰當(dāng)?shù)?ELK 技術(shù)棧也有助于快速診斷問題窄坦。

目前唤反,隨著云服務(wù)和移動應(yīng)用的發(fā)展,在國內(nèi)外APM(Application Performance Management)相關(guān)的服務(wù)得到了空前的關(guān)注鸭津,希望Shailesh Mangal 的這篇文章能夠幫助讀者對該領(lǐng)域有一個宏觀的了解和掌握彤侍。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市逆趋,隨后出現(xiàn)的幾起案子盏阶,更是在濱河造成了極大的恐慌,老刑警劉巖闻书,帶你破解...
    沈念sama閱讀 221,198評論 6 514
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件名斟,死亡現(xiàn)場離奇詭異,居然都是意外死亡魄眉,警方通過查閱死者的電腦和手機(jī)砰盐,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,334評論 3 398
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來坑律,“玉大人岩梳,你說我怎么就攤上這事』卧瘢” “怎么了冀值?”我有些...
    開封第一講書人閱讀 167,643評論 0 360
  • 文/不壞的土叔 我叫張陵,是天一觀的道長宫屠。 經(jīng)常有香客問我列疗,道長,這世上最難降的妖魔是什么浪蹂? 我笑而不...
    開封第一講書人閱讀 59,495評論 1 296
  • 正文 為了忘掉前任抵栈,我火速辦了婚禮,結(jié)果婚禮上乌逐,老公的妹妹穿的比我還像新娘竭讳。我一直安慰自己创葡,他們只是感情好浙踢,可當(dāng)我...
    茶點(diǎn)故事閱讀 68,502評論 6 397
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著灿渴,像睡著了一般洛波。 火紅的嫁衣襯著肌膚如雪胰舆。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 52,156評論 1 308
  • 那天蹬挤,我揣著相機(jī)與錄音缚窿,去河邊找鬼。 笑死焰扳,一個胖子當(dāng)著我的面吹牛倦零,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播吨悍,決...
    沈念sama閱讀 40,743評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼扫茅,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了育瓜?” 一聲冷哼從身側(cè)響起葫隙,我...
    開封第一講書人閱讀 39,659評論 0 276
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎躏仇,沒想到半個月后恋脚,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,200評論 1 319
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡焰手,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,282評論 3 340
  • 正文 我和宋清朗相戀三年糟描,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片册倒。...
    茶點(diǎn)故事閱讀 40,424評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡蚓挤,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出驻子,到底是詐尸還是另有隱情灿意,我是刑警寧澤,帶...
    沈念sama閱讀 36,107評論 5 349
  • 正文 年R本政府宣布崇呵,位于F島的核電站缤剧,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏域慷。R本人自食惡果不足惜荒辕,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,789評論 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望犹褒。 院中可真熱鬧抵窒,春花似錦、人聲如沸叠骑。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,264評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽宙枷。三九已至掉房,卻和暖如春茧跋,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背卓囚。 一陣腳步聲響...
    開封第一講書人閱讀 33,390評論 1 271
  • 我被黑心中介騙來泰國打工瘾杭, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人哪亿。 一個月前我還...
    沈念sama閱讀 48,798評論 3 376
  • 正文 我出身青樓粥烁,卻偏偏與公主長得像,于是被迫代替她去往敵國和親蝇棉。 傳聞我的和親對象是個殘疾皇子页徐,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,435評論 2 359