摘要
文章主要介紹:7年做Zabbix二次開發(fā)勿侯,講述那些從技術方向的選擇拓瞪,到開發(fā)、架構設計助琐、深度定制祭埂,到我們的更多前瞻性想法。
關于MIUI
“專注兵钮、極致蛆橡、口碑、快“成了雷布斯的口頭禪掘譬,根植于這樣的產品文化泰演,小米的MIUI基于Android開源系統實現的貼近中國用戶使用習慣的手機操作系統,簡單總結MIUI的做法:
1. 替代Google服務體系的小米云服務體系屁药,這些云服務體系更全面粥血,更好用柏锄,更接地氣酿箭,更符合中國普通消費者使用習慣;
2. 以周為單位的快速迭代趾娃;
3. 以論壇為中心的粉絲交流社群
4. 界面更美觀缭嫡;
5. 細節(jié)更人性化。
總之抬闷,用MIUI你會發(fā)現妇蛀,你能想到的能用到的耕突,它已經很好地躺在那里了,你有一種被無微不至地呵護著的感覺评架。在國內用原生的Android系統都屬于一些玩主眷茁,技術極客,我曾經也是纵诞,試過各種Rom上祈,MIUI是其中的佼佼者,甚至浙芙,在xda-developers上發(fā)現國外還有一批忠實米粉登刺。
是的!我們正在一步步學習著MIUI嗡呼,在此纸俭,向小米,向雷軍獻上我們的膝蓋南窗!
為什么選擇Zabbix
為什么要做監(jiān)控
運維的正確姿勢肯定不是從處理故障開始揍很,一定是從監(jiān)控開始的。
從軍事的角度出發(fā)矾瘾,監(jiān)控是一種積極防御戰(zhàn)略女轿,是未戰(zhàn)之戰(zhàn),有效的監(jiān)控可以拓寬戰(zhàn)略縱深壕翩,可以更積極地保護我重點軍事目標蛉迹。以下是我們要求運維團隊時時牢記的兩句話。
1. 出了任何故障放妈,其他環(huán)節(jié)都可能有問題北救,唯獨監(jiān)控環(huán)節(jié)一定有問題!
2. 海恩法則:每1起嚴重事故的背后芜抒,必然有29次輕微事故和300起未遂先兆以及1000起事故隱患珍策。
IT服務成熟度模型中,監(jiān)控手段是轉被動運維為主動運維的必然“預防“和”度量“手段宅倒。因此攘宙,在這么多年的重大故障分析會議上,監(jiān)控問題總是在會議前期和后期都拿出來重點討論的拐迁,
會議一開始就要問“為什么故障沒有被監(jiān)控出來”或者”在故障發(fā)生的前后都監(jiān)控出來什么異樣“蹭劈。
會議結束前的總結通常是“對于漏掉的監(jiān)控項一定要被加入“或者是”對于監(jiān)控到的指標或閥值一定要被優(yōu)化“。
如果這四個問題都被很好地回答并改善线召,我想下次類似的故障是不可能出現的铺韧,因此,做監(jiān)控需要有一個PDCA持續(xù)改進的過程缓淹,當然哈打,改進的核心有且只有兩個“覆蓋率“和”準確率“塔逃。
當然,對于一個更優(yōu)秀的監(jiān)控系統料仗,他還可以有如下價值:
對組織:
1. 全局監(jiān)控幫助組織制定IT管理戰(zhàn)略
2. 從IT資源到組織業(yè)務的直接對接
3. 制定IT資源湾盗、IT組織工作管理的基礎
4. 組織與內外部IT組織的溝通樞紐
對IT管理者
1. IT管理者工作價值體現
2. 幫助IT管理者全面了解IT現狀
3. 方便IT管理者管理IT組織的工作績效
4. 搞高IT部門的工作效率,減少企業(yè)成本
5. 降低業(yè)務系統宕機風險
對IT操作者
1. 及時發(fā)現業(yè)務系統各個單元故障
2. 深度定位系統的故障根源立轧,及時解決
3. 拉近IT操作者與組織業(yè)務的距離
4. 直接體現具體IT操作者的工作業(yè)績
5. 幫助從IT的角度提高促進業(yè)務高效穩(wěn)定
為什么是Zabbix
前不久看到一則路邊社報道淹仑,在中國有80%的企業(yè)在使用Zabbix做監(jiān)控,不知道統計的方法和口徑是怎樣的肺孵,不過匀借,80%這個數值也感性地傳達了他的熱度。
統計數據
在Zabbix的官網上找到一個清單平窘,一堆國外知名公司都是他的合作伙伴吓肋,就最近的交流溝通中,但凡有計劃做監(jiān)控的組織無不試用Zabbix的瑰艘,如果有網友有更值得參考的統計數據是鬼,可以回復本文,并注明數據來源紫新。
目前均蜜,從IT Central Station的官網找到一份統計信息,這份統計數據是由加入這個網站的企業(yè)CIO反饋的信息實時得到芒率,以下這份數據是2017年11月18日生成的囤耳。
這份統計數據主要來自北美的參與者,在國內沒有代表性偶芍,不過充择,我相信在國內的數據會比這個更高,國內對于免費和開源的被教育程度顯然是更高匪蟀,這個得益于紅衣教主周鴻祎椎麦,更被一堆互聯網公司的推高和強化,至于背后的商業(yè)倫理和其他成本問題姑且不論材彪。