prometheus之docker監(jiān)控與告警系列(三)

本系列主要介紹prometheus+cadvisor+alertmanager打造docker監(jiān)控,主要監(jiān)控指定docker容器是否掛掉

本節(jié)主要熟悉prometheus+cadvisor+alertmanager實(shí)現(xiàn)docker監(jiān)控卵慰,以監(jiān)控docker容器grafana是否掛掉作為例子

一辐益、服務(wù)器安裝cadvisor啡直,監(jiān)控docker织堂,如果服務(wù)器沒有安裝grafana的docker鏡像也一并安裝一下瓦灶,我們今天就是來監(jiān)控這個(gè)grafana是否掛掉

grafana 鏡像安裝

docker run -d \
  -p 3000:3000 \
  --restart=always \
  --name=grafana \
  -e "GF_SECURITY_ADMIN_PASSWORD=admin" \
  -e "GF_INSTALL_PLUGINS=grafana-clock-panel,grafana-simple-json-datasource,raintank-worldping-app,grafana-piechart-panel" \
  grafana/grafana

cadvisor 鏡像安裝

sudo docker run \
  --volume=/:/rootfs:ro \
  --volume=/var/run:/var/run:rw \
  --volume=/sys:/sys:ro \
  --volume=/var/lib/docker/:/var/lib/docker:ro \
  --publish=8090:8080 \
  --detach=true \
  --name=cadvisor \
  google/cadvisor:latest

其中8090是映射到外部的端口村斟,需要服務(wù)器開放這個(gè)端口外部才可以訪問

查看監(jiān)控到的docker的相關(guān)信息

http://ip:8090/containers/docker

二贫导、配置prometheus監(jiān)控cadvisor

  - job_name: 'aliyun-cadvisor'
    scrape_interval: 5s
    static_configs:
      - targets: ['ip:8090']  

targets中的ip換成你服務(wù)器的ip

三、配置prometheus.rules.yml監(jiān)控grafana是否掛掉

- name: DockerInstance
  rules:
  - alert: DockerInstanceDown
    expr: rate(container_last_seen{name="xservicesswagger_swagger_1"}[1m]) < 0.5
    for: 5s
    labels:
      severity: page
    # Prometheus templates apply here in the annotation and label fields of the alert.
    annotations:
      description: '{{ $labels.instance }} of job {{ $labels.job }} has been down for more than 5 s.'
      summary: 'Instance {{ $labels.instance }} down'

expr:rate(container_last_seen{name="xservicesswagger_swagger_1"}[1m]) < 0.5 這行函數(shù)表示給定的容器不存在則報(bào)警

打開http://localhost:9090/rules可以查看配置的規(guī)則蟆盹,點(diǎn)擊超鏈接可以查看配置的規(guī)則是否正確

image.png
image.png

如果value結(jié)果為1孩灯,說明觸發(fā)了規(guī)則,如果沒有說明規(guī)則還沒有被觸發(fā)

把規(guī)則文件加入prometheus.yml

rule_files:
  - 'prometheus.rules.yml'

四逾滥、配置alertmanager.yml峰档,設(shè)置webhook為告警處理方式败匹,即告警觸發(fā)一個(gè)接口調(diào)用

global:
  resolve_timeout: 5m

route:
  group_by: ['alertname']
  group_wait: 5s
  group_interval: 5s
  repeat_interval: 5s
  receiver: 'web.hook'
receivers:
- name: 'web.hook'
  webhook_configs:
  - url: 'http://localhost:5200/auth/alter'

repeat_interval 表示重復(fù)間隔,這里配置5s讥巡,即如果觸發(fā)報(bào)警規(guī)則每隔5s報(bào)警一次

五掀亩、配置完之后我們實(shí)驗(yàn)一下,在服務(wù)器把grafana鏡像rm掉欢顷,看下是否觸發(fā)了alert槽棍,alert是否觸發(fā)了接口調(diào)用

訪問http://localhost:9090/alerts查看alert是否被觸發(fā)

image.png

如果active的數(shù)量大于0則說明有規(guī)則被觸發(fā)了,點(diǎn)開了可以查看

image.png

本系列到此就結(jié)束了抬驴,謝謝大家炼七!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市布持,隨后出現(xiàn)的幾起案子豌拙,更是在濱河造成了極大的恐慌,老刑警劉巖题暖,帶你破解...
    沈念sama閱讀 217,277評(píng)論 6 503
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件按傅,死亡現(xiàn)場離奇詭異,居然都是意外死亡胧卤,警方通過查閱死者的電腦和手機(jī)唯绍,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,689評(píng)論 3 393
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來灌侣,“玉大人推捐,你說我怎么就攤上這事〔嗵洌” “怎么了牛柒?”我有些...
    開封第一講書人閱讀 163,624評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵,是天一觀的道長痊乾。 經(jīng)常有香客問我皮壁,道長,這世上最難降的妖魔是什么哪审? 我笑而不...
    開封第一講書人閱讀 58,356評(píng)論 1 293
  • 正文 為了忘掉前任蛾魄,我火速辦了婚禮,結(jié)果婚禮上湿滓,老公的妹妹穿的比我還像新娘滴须。我一直安慰自己,他們只是感情好叽奥,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,402評(píng)論 6 392
  • 文/花漫 我一把揭開白布扔水。 她就那樣靜靜地躺著,像睡著了一般朝氓。 火紅的嫁衣襯著肌膚如雪魔市。 梳的紋絲不亂的頭發(fā)上主届,一...
    開封第一講書人閱讀 51,292評(píng)論 1 301
  • 那天,我揣著相機(jī)與錄音待德,去河邊找鬼君丁。 笑死,一個(gè)胖子當(dāng)著我的面吹牛将宪,可吹牛的內(nèi)容都是我干的绘闷。 我是一名探鬼主播,決...
    沈念sama閱讀 40,135評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼涧偷,長吁一口氣:“原來是場噩夢啊……” “哼簸喂!你這毒婦竟也來了毙死?” 一聲冷哼從身側(cè)響起燎潮,我...
    開封第一講書人閱讀 38,992評(píng)論 0 275
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎扼倘,沒想到半個(gè)月后确封,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 45,429評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡再菊,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,636評(píng)論 3 334
  • 正文 我和宋清朗相戀三年爪喘,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片纠拔。...
    茶點(diǎn)故事閱讀 39,785評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡秉剑,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出稠诲,到底是詐尸還是另有隱情侦鹏,我是刑警寧澤,帶...
    沈念sama閱讀 35,492評(píng)論 5 345
  • 正文 年R本政府宣布臀叙,位于F島的核電站略水,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏劝萤。R本人自食惡果不足惜渊涝,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,092評(píng)論 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望床嫌。 院中可真熱鬧跨释,春花似錦、人聲如沸厌处。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,723評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽嘱蛋。三九已至蚯姆,卻和暖如春五续,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背龄恋。 一陣腳步聲響...
    開封第一講書人閱讀 32,858評(píng)論 1 269
  • 我被黑心中介騙來泰國打工疙驾, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人郭毕。 一個(gè)月前我還...
    沈念sama閱讀 47,891評(píng)論 2 370
  • 正文 我出身青樓它碎,卻偏偏與公主長得像,于是被迫代替她去往敵國和親显押。 傳聞我的和親對(duì)象是個(gè)殘疾皇子扳肛,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,713評(píng)論 2 354

推薦閱讀更多精彩內(nèi)容

  • 主機(jī)數(shù)據(jù)收集 主機(jī)數(shù)據(jù)的采集是集群監(jiān)控的基礎(chǔ);外部模塊收集各個(gè)主機(jī)采集到的數(shù)據(jù)分析就能對(duì)整個(gè)集群完成監(jiān)控和告警等功...
    梅_梅閱讀 6,682評(píng)論 0 7
  • 序 本系列主要介紹prometheus+cadvisor+alertmanager打造docker監(jiān)控乘碑,主要監(jiān)控指...
    2遠(yuǎn)閱讀 2,849評(píng)論 0 0
  • 隨著線上服務(wù)的全面docker化挖息,對(duì)docker容器的監(jiān)控就很重要了。SA的監(jiān)控系統(tǒng)是物理機(jī)的監(jiān)控兽肤,在一個(gè)物理機(jī)跑...
    __七把刀__閱讀 14,123評(píng)論 3 22
  • 1.事件:多年未見的大學(xué)同學(xué)向我借錢套腹,我拒絕了。今天下午五點(diǎn)多我微信里收到了我大學(xué)同學(xué)向我借錢的信息资铡。我們自從畢業(yè)...
    心晴芳菲閱讀 126評(píng)論 0 0
  • 天色微微向晚电禀,天上飄著懶洋洋的云彩。下半截沉在黑暗里笤休,上半截仍浮在陽光中尖飞。那一天我二十一歲,在我一生的黃金時(shí)代店雅,我...
    436be74c111b閱讀 281評(píng)論 0 1