目錄
一荐虐、系統(tǒng)監(jiān)控項(xiàng)
二、集群監(jiān)控項(xiàng)
三、主題監(jiān)控項(xiàng)
四捏浊、消費(fèi)組監(jiān)控項(xiàng)
五、發(fā)送客戶端監(jiān)控項(xiàng)
六撞叨、消費(fèi)客戶端監(jiān)控項(xiàng)
一呛伴、系統(tǒng)監(jiān)控項(xiàng)
1.CPU
CPU使用率、CPU Load谒所、
2.內(nèi)存
內(nèi)存使用率
3.磁盤
磁盤使用率热康、磁盤IO、磁盤IOWAIT
4.帶寬
帶寬檢測
5.實(shí)例存活
集群實(shí)例是否存活劣领、實(shí)例端口是否可達(dá)
二姐军、集群監(jiān)控項(xiàng)
1.集群節(jié)點(diǎn)數(shù)量
注:比如RocketMQ集群中有4主4從;當(dāng)Master節(jié)點(diǎn)數(shù)量小于4時(shí)
2.集群節(jié)點(diǎn)可用性
注:檢測集群節(jié)點(diǎn)是否可達(dá)以及RT Time
3.集群寫入TPS
注:例如集群寫入TPS壓測值的40%
4.集群消費(fèi)TPS
注:集群消費(fèi)TPS需關(guān)注帶寬及CPU
5.集群寫入TPS變化率
注:例如5分鐘內(nèi)集群TPS陡增30%
6.集群寫入TPS變化率
注:例如5分鐘內(nèi)集群TPS陡增30%
7.集群日消息總量的變化
注:例如集群中每日的消息總量監(jiān)控
8.Broker寫入/消費(fèi)TPS
注:單節(jié)點(diǎn)的寫入/消費(fèi)TPS
三尖淘、主題監(jiān)控項(xiàng)
1.主題寫入TPS
注:單一主題的寫入速率
2.主題寫入TPS的變化率
注:例如某一主題5分鐘內(nèi)速率陡增30%
3.主題日消息量
注:例如單一主題每日消息量
4.死信隊(duì)列監(jiān)控
注:被丟入死信隊(duì)列的消息監(jiān)控
四奕锌、消費(fèi)組監(jiān)控項(xiàng)
1.消費(fèi)積壓
注:積壓量的監(jiān)控
2.消費(fèi)TPS
注:消費(fèi)速率監(jiān)控
3.消費(fèi)阻塞
注:消費(fèi)者隔特定時(shí)間未消費(fèi)數(shù)據(jù)
4.消費(fèi)速率變化
注:例如5分鐘之內(nèi)消費(fèi)速率陡降了30%
五、發(fā)送客戶端監(jiān)控項(xiàng)
1.發(fā)送消息體大小變化
注:發(fā)送消息的大小在小于1K村生、1~2K惊暴、大于5K等的分布
2.發(fā)送耗時(shí)變化
注:單節(jié)點(diǎn)消息發(fā)送在不通時(shí)間范圍內(nèi)的分布
3.發(fā)送速率變化
注:單個(gè)發(fā)送節(jié)點(diǎn)速率變化
4.發(fā)送成功失敗分布
注:消息發(fā)送成功/失敗分布情況
六、消費(fèi)客戶端監(jiān)控項(xiàng)
1.消費(fèi)速率變化
注:單節(jié)點(diǎn)速率變化
2.消費(fèi)耗時(shí)變化
注:單節(jié)點(diǎn)發(fā)送耗時(shí)分布情況
3.消費(fèi)成功失敗分布
注:單節(jié)點(diǎn)消費(fèi)成功失敗的分布情況
作者老梁趁桃,哈啰出行高級(jí)技術(shù)專家辽话,參與了《RocketMQ技術(shù)內(nèi)幕》審稿工作肄鸽。專注后端中間件方向,已陸續(xù)發(fā)表RocketMQ系列油啤、Kafka系列典徘、gRPC系列、Sentinel系列益咬、Java NIO系列逮诲。其中RocketMQ系列已發(fā)表40余篇。源碼幽告、實(shí)戰(zhàn)梅鹦、原理、調(diào)優(yōu)期待與你一起學(xué)習(xí)冗锁。