客戶背景
北京優(yōu)絡(luò)時(shí)代科技有限公司——也就是 YOLO宠进,是一個(gè)專注于移動(dòng)互聯(lián)網(wǎng)的創(chuàng)業(yè)團(tuán)隊(duì),成立之初就獲得百萬級美金的種子輪投資歹袁。
旗下產(chǎn)品 YOLO 是一款私密視頻直播互動(dòng)工具屹篓,在 YOLO 里通過簡單地操作便可選定好友技肩,發(fā)起直播俗孝,共享屬于特定小圈子的生活樂趣酒甸。私密的房間入口可以保護(hù)隱私,讓直播只屬于被邀請的人赋铝,同時(shí) YOLO 獨(dú)創(chuàng)了進(jìn)行多人語音互動(dòng)功能插勤,采取了「閱后即焚」的直播方式,讓直播沒有備份革骨,沒有重來农尖,這也貼合 You Only Live Once 的理念。
YOLO 團(tuán)隊(duì)組建于2015年5月良哲,位于北京市三里屯 SOHO卤橄。三位創(chuàng)始人曾為某過億用戶量產(chǎn)品運(yùn)營總監(jiān)、游戲界傳奇副總裁以及視頻直播界的技術(shù)男神臂外,還有來自新浪窟扑、騰訊、金山的資深互聯(lián)網(wǎng)人漏健。
YOLO 選擇以私密視頻直播互動(dòng)工具為切入點(diǎn)嚎货,還原了現(xiàn)實(shí)世界人與人之間的長連接及強(qiáng)互動(dòng),是一種新穎的方式蔫浆。而作為一個(gè)初創(chuàng)團(tuán)隊(duì)殖属,在技術(shù)方面也不能因人員和資源較少而含糊,這個(gè)時(shí)候瓦盛,YOLO 選擇了 Cloud Insight 作為性能監(jiān)控解決方案洗显。
面臨問題
客戶搭建了數(shù)臺阿里云主機(jī),采用 nignx+php+Redis 架構(gòu)原环。由于客戶是初創(chuàng)團(tuán)隊(duì)挠唆,在人員和資源方面都比較不足。因此需要一款優(yōu)秀的性能監(jiān)控工具嘱吗,對云主機(jī)和 Redis 進(jìn)行監(jiān)控玄组,幫助其提高在運(yùn)維方面的效率同時(shí)降低運(yùn)維成本。
Cloud Insight 采用 StatsD 的采集技術(shù)谒麦,對接 MySQL俄讹、Redis、MongoDB绕德,以及 CentOS患膛、RedHat 操作系統(tǒng),利用 Hbase 存儲和 OpenTSDB 的數(shù)據(jù)聚合耻蛇、切片等功能踪蹬,最終流向 Cloud Insight 進(jìn)行展現(xiàn)胞此。從而幫助優(yōu)絡(luò)時(shí)代實(shí)現(xiàn)低成本、高效的自動(dòng)化運(yùn)維延曙。
解決方案
客戶使用 Cloud Insight 和阿里云進(jìn)行基礎(chǔ)組件的監(jiān)控豌鹤,利用 Application Insight 和 Cloud Insight 結(jié)合解決了 Redis 連接數(shù)和其他性能問題。
基礎(chǔ)組件監(jiān)控
通過 Cloud Insight 的拓?fù)涔δ苤Φ蓿覀兛梢酝瑫r(shí)看到優(yōu)絡(luò)時(shí)代幾臺云主機(jī)的實(shí)時(shí)性能狀況布疙,迅速了解哪一臺云主機(jī)出現(xiàn)了資源緊張或其他問題,定位到該機(jī)器愿卸。再通過 system 指標(biāo)總覽圖灵临,對性能有進(jìn)一步了解,包括系統(tǒng)負(fù)載趴荸、CPU 使用率儒溉、磁盤容量、IO 讀寫速率和次數(shù)等发钝。
Regis 連接數(shù)
Cloud Insight 提供包括的 Redis 在內(nèi)的 20 多種平臺監(jiān)控服務(wù)顿涣,從 Redis 總覽部分可以看到 Redis 的實(shí)時(shí)性能。再輕松地切換到 Application Insight 產(chǎn)品酝豪,可以看到 Redis 每次請求的的響應(yīng)時(shí)間涛碑、執(zhí)行次數(shù),點(diǎn)進(jìn)數(shù)據(jù)庫可以了解到 Redis 的詳細(xì)性能情況孵淘,包括響應(yīng)時(shí)間蒲障、吞吐量、調(diào)用時(shí)間占比等等瘫证。
客戶反饋
不足之處
客戶希望能夠?qū)⑦M(jìn)程的監(jiān)控集成到現(xiàn)在 Cloud Insight 的基礎(chǔ)組件監(jiān)控之中揉阎。同時(shí)對我們與阿里云的區(qū)別有一些疑問。
傳統(tǒng)的使用阿里云或者 Zabbix 進(jìn)行運(yùn)維會明顯感受到一個(gè)痛點(diǎn):沒有辦法對數(shù)據(jù)做聚合背捌,只能挨個(gè)查看主機(jī)的性能指標(biāo)毙籽,更不用說有管理的功能。而 Cloud Insight 在支持多種操作系統(tǒng)载萌、云主機(jī)惧财、數(shù)據(jù)庫和中間件的監(jiān)控的基礎(chǔ)上,還能夠?qū)?shù)據(jù)進(jìn)行聚合與分組扭仁,對集群的監(jiān)控來說更為方便。關(guān)于這一點(diǎn)厅翔,我們在早期的一篇文章 數(shù)據(jù)聚合 & 分組:新一代系統(tǒng)監(jiān)控的核心功能 中進(jìn)行過講解乖坠。
除此之外,更擁有邏輯清晰刀闷、簡潔的事件流展示熊泵,在提供報(bào)警之外還能夠方便用戶在 Cloud Insight 平臺中進(jìn)行跨部門協(xié)作仰迁。
優(yōu)絡(luò)時(shí)代也曾經(jīng)自行搭建對進(jìn)程的監(jiān)控,但由于算法的問題存在一些數(shù)據(jù)不準(zhǔn)的問題顽分,產(chǎn)品經(jīng)理說:「所以暫時(shí)先把這個(gè)功能下線了徐许,后期我們會優(yōu)化后再上線的∽湔海」而 Cloud Insight 也會進(jìn)一步改善我們的產(chǎn)品雌隅,更深層的發(fā)掘自身的核心價(jià)值,為客戶提供更好的用戶體驗(yàn)缸沃。
客戶對 Cloud Insight 價(jià)值的認(rèn)可
- Cloud Insight整體是比較贊恰起,能夠真正的幫其解決實(shí)際問題,降低運(yùn)維成本趾牧。
- 頁面展示和實(shí)際的用戶體驗(yàn)比較好检盼,尤其是在頁面展示上優(yōu)于阿里云自帶的監(jiān)控軟件。
- SDK 功能很強(qiáng)大翘单,以后會有相應(yīng)的基于 Cloud Insight 自主開發(fā)的需求吨枉。
Cloud Insight 集監(jiān)控、管理哄芜、計(jì)算貌亭、協(xié)作、可視化于一身忠烛,幫助所有 IT 公司属提,減少在系統(tǒng)監(jiān)控上的人力和時(shí)間成本投入,讓運(yùn)維工作更加高效美尸、簡單冤议。本文由 OneAPM 工程師翻譯整理,想閱讀更多技術(shù)文章师坎,請?jiān)L問 OneAPM 官方技術(shù)博客恕酸。
本文轉(zhuǎn)自 OneAPM 官方博客