國(guó)內(nèi)企業(yè)智能化運(yùn)維&DevOps建設(shè)和前沿研究

云計(jì)算和人工智能的發(fā)展不僅改變了普通人日常生活的方式碳却,同時(shí)也改變了運(yùn)維人員的工作模式。智能化運(yùn)維就是用機(jī)器來(lái)代替人,在最少的人為干預(yù)下保證業(yè)務(wù)7*24小時(shí)的高效穩(wěn)定運(yùn)行。2015年被稱為是中國(guó)互聯(lián)網(wǎng)智能化運(yùn)維發(fā)展的元年掂恕,多家IT大廠相繼提出這一思路,并做了一些極具價(jià)值的嘗試弛槐。

2017年10月19日-21日在北京新云南皇冠假日酒店召開(kāi)的第九屆系統(tǒng)架構(gòu)師大會(huì)就洞察到了這一變化竹海,開(kāi)設(shè)了“智能化運(yùn)維&DevOps”的技術(shù)專場(chǎng),邀請(qǐng)了多家知名企業(yè)的技術(shù)大咖來(lái)和大家分享交流他們的心得丐黄。

“DevOps”是最近幾年炒得比較火的話題之一,但你真的了解什么是DevOps嗎?中國(guó)SaltStack用戶組發(fā)起人趙舜東表示:DevOps絕不是簡(jiǎn)單的運(yùn)維開(kāi)發(fā)孔飒,也不僅僅是自動(dòng)化灌闺,更不是讓開(kāi)發(fā)自己做運(yùn)維,DevOps強(qiáng)調(diào)的是研發(fā)坏瞄、技術(shù)運(yùn)營(yíng)桂对、質(zhì)量部門在軟件生命周期和服務(wù)生命周期的協(xié)作,從而來(lái)構(gòu)建一條IT服務(wù)供應(yīng)鏈鸠匀,同時(shí)也是價(jià)值交付鏈蕉斜。我們經(jīng)常提到的敏捷研發(fā),精益管理,持續(xù)交付宅此,技術(shù)運(yùn)營(yíng)都是DevOps的知識(shí)體系机错。

大數(shù)據(jù)驅(qū)動(dòng)的阿里巴巴國(guó)際化基礎(chǔ)架構(gòu)

對(duì)于現(xiàn)代人來(lái)說(shuō),“雙十一”不再只是一個(gè)普通的日子父腕,也不再只有“光棍節(jié)”這層含義弱匪,阿里賦予了“雙十一”更廣為人知的含義——全民購(gòu)物狂歡節(jié)。那在國(guó)內(nèi)購(gòu)物用淘寶璧亮,在國(guó)外購(gòu)物用什么呢?其實(shí)淘寶也有海外版本——AliExpress萧诫。

AliExpress在全球排名52,如果要在購(gòu)物App中按下載數(shù)量來(lái)排名的話枝嘶,其iOS應(yīng)用程序在96個(gè)國(guó)家排在Top 5帘饶,Android應(yīng)用程序在56個(gè)國(guó)家排在Top 5。本次大會(huì)AliExpress技術(shù)部架構(gòu)團(tuán)隊(duì)及商家平臺(tái)團(tuán)隊(duì)負(fù)責(zé)人李彥超(驗(yàn)鈔)和我們分享了他們的國(guó)際化基礎(chǔ)架構(gòu)群扶。

由于AliExpress面向的是全球化的業(yè)務(wù)所以其天然的就必須面對(duì)長(zhǎng)距離訪問(wèn)帶來(lái)延遲問(wèn)題及刻,其次AliExpress單日的全球交易量能夠達(dá)到2000次/秒,并且這個(gè)數(shù)字還在逐年遞增;第三穷当,AliExpress業(yè)務(wù)沒(méi)有低谷提茁,提供7*24服務(wù),故障會(huì)發(fā)生在任何時(shí)間馁菜。

阿里在全球部署了多個(gè)IDC茴扁,在淘寶的基礎(chǔ)上做到了用戶干預(yù),對(duì)于用戶的訪問(wèn)采取最近原則汪疮,在符合政策和合規(guī)性的條件下默認(rèn)性能優(yōu)先;所有IDC向一個(gè)IDC做復(fù)制峭火,同時(shí)基于合規(guī)性做流量路由表,并在所有可能的地方插入路由表智嚷,保證全局變更卖丸。

基于Kubernetes的持續(xù)集成平臺(tái)建設(shè)

相信各位技術(shù)人前兩天的朋友圈都被“Docker宣布支持Kubernetes”的消息刷屏了,這從側(cè)面證明了Kubernetes正在逐步強(qiáng)大盏道,獲得了全球的廣泛認(rèn)可稍浆。在“智能化運(yùn)維&DevOps”技術(shù)專場(chǎng),為勝科技技術(shù)總監(jiān)郭宏澤為我們帶來(lái)了“基于Kubernetes的持續(xù)集成平臺(tái)建設(shè)”的主題演講猜嘱。

創(chuàng)業(yè)公司往往運(yùn)維需求變化快衅枫,資源相對(duì)有限,所以IT基礎(chǔ)設(shè)施建設(shè)要以速度為中心朗伶,實(shí)現(xiàn)快速響應(yīng)弦撩、降低成本、穩(wěn)定安全的運(yùn)維要求论皆。而以DevOps為指導(dǎo)思想益楼,建設(shè)一套基于容器的持續(xù)集成發(fā)布平臺(tái)就是這些創(chuàng)業(yè)公司的首選猾漫。

在Kubernetes的使用上郭宏澤也有一些自己的心得,首先Kubernetes每三個(gè)月就會(huì)發(fā)布一個(gè)版本感凤,所以大家不要盲目追求最新版本;其次悯周,K8s每個(gè)版本將會(huì)發(fā)布三種功能:Aplpha功能,預(yù)覽功能俊扭,不穩(wěn)定;Beta功能队橙,測(cè)試中的功能,不保證穩(wěn)定;正式功能萨惑,已經(jīng)經(jīng)過(guò)測(cè)試的穩(wěn)定功能捐康,不保證無(wú)BUG;第三,盡可能減少對(duì)功能的使用庸蔼,保持簡(jiǎn)單;最后解总,不要輕易升級(jí)生產(chǎn)系統(tǒng)。

百度AIOps實(shí)踐:?jiǎn)螜C(jī)房故障自愈

AIOps是Gartner在2016年提出的概念,其預(yù)測(cè)到2020年AIOps的采用率將會(huì)達(dá)到50%姐仅。目前國(guó)內(nèi)的IT大廠都有在嘗試AIOps花枫,今天百度監(jiān)控平臺(tái)技術(shù)負(fù)責(zé)人哈晶晶就為我們分享了百度在AIOps上的實(shí)踐—單機(jī)房故障自愈。

百度運(yùn)維平臺(tái)經(jīng)歷了基礎(chǔ)運(yùn)維平臺(tái)掏膏、開(kāi)放運(yùn)維平臺(tái)和智能化運(yùn)維平臺(tái)的演變劳翰。近年來(lái),我們看到了多起業(yè)界單機(jī)房故障事件馒疹,不僅造成了PV佳簸、流水損失,商業(yè)賠付颖变,影響用戶體驗(yàn)生均,而且還會(huì)給競(jìng)品以機(jī)會(huì),造成研發(fā)成果浪費(fèi)腥刹、用戶信任度下降等嚴(yán)重后果马胧。

百度基于AIOps故障自愈的解決思路為:書同文:運(yùn)維知識(shí)庫(kù),一致運(yùn)維“語(yǔ)言”;車同軌:運(yùn)維開(kāi)發(fā)框架衔峰,一致運(yùn)維“方法”;行同倫:運(yùn)維策略庫(kù)佩脊,一致運(yùn)維“模式”。目前垫卤,單機(jī)房故障自愈已覆蓋百度80%的核心業(yè)務(wù)威彰,止損效率較人工提升60%以上,業(yè)務(wù)L4故障葫男,服務(wù)層能夠在2min內(nèi)完成單機(jī)房故障止損。

美團(tuán)外賣自動(dòng)化業(yè)務(wù)運(yùn)維系統(tǒng)建設(shè)

對(duì)于現(xiàn)代人來(lái)說(shuō)崔列,外賣絕對(duì)是不可或缺的一部分梢褐,90后專欄作家李宮俊曾說(shuō)過(guò)“生我者父母旺遮,養(yǎng)我者外賣∮龋”雖然天天點(diǎn)外賣耿眉,但是你清楚外賣背后的技術(shù)支撐嗎?本次專場(chǎng)美團(tuán)外賣業(yè)務(wù)架構(gòu)負(fù)責(zé)人劉宏偉就和我們分享了他們的自動(dòng)化業(yè)務(wù)運(yùn)維系統(tǒng)的建設(shè)。

劉宏偉表示:外賣業(yè)務(wù)后臺(tái)服務(wù)交互復(fù)雜鱼响,從用戶下單à商家接單à騎手接單à發(fā)配送à用戶收到熱乎乎的外賣鸣剪,我們需要在20多分鐘之內(nèi)完成這一系列流程。而在這背后丈积,整個(gè)產(chǎn)品線上還會(huì)涉及很多數(shù)據(jù)分析筐骇,統(tǒng)計(jì),結(jié)算江滨,合同等各個(gè)端的交互铛纬,一致性要求高,并發(fā)高唬滑。

如何將運(yùn)維人員從繁重的工作中解放出來(lái)告唆,應(yīng)用自動(dòng)化措施提升業(yè)務(wù)效率,劉宏偉認(rèn)為可以從以下方面著手:

? 前期當(dāng)用戶接收到診斷報(bào)警后晶密,直接引導(dǎo)用戶進(jìn)入該報(bào)警可能會(huì)影響的業(yè)務(wù)大盤擒悬,查看業(yè)務(wù)圖表,如果影響到業(yè)務(wù)直接進(jìn)入該業(yè)務(wù)圖表對(duì)應(yīng)的核心鏈路定位最終的問(wèn)題根本原因稻艰,從而判斷是否要觸發(fā)該核心鏈路上對(duì)應(yīng)的服務(wù)保護(hù)開(kāi)關(guān)或預(yù)案懂牧,以達(dá)到快速解決問(wèn)題的目的。

? 用戶也可以直接通過(guò)診斷報(bào)警進(jìn)入對(duì)應(yīng)的核心鏈路连锯,查看最終的引起異常的根本原因归苍,引導(dǎo)用戶判斷是否需要觸發(fā)相應(yīng)的服務(wù)保護(hù)預(yù)案。

? 發(fā)現(xiàn)問(wèn)題à診斷問(wèn)題à解決問(wèn)題 這個(gè)過(guò)程每一步都需要不斷的提升準(zhǔn)確度运怖,通過(guò)全鏈路壓測(cè)不斷的驗(yàn)證這一流程的準(zhǔn)確度拼弃,當(dāng)某些場(chǎng)景準(zhǔn)確度非常高的時(shí)候,可以變?yōu)樽詣?dòng)化方案摇展。

? 當(dāng)整個(gè)方案可以自動(dòng)化進(jìn)行下去之后吻氧, 對(duì)于用戶來(lái)說(shuō)的使用場(chǎng)景就變成了:收到異常報(bào)警à收到業(yè)務(wù)服務(wù)恢復(fù)通知。

技術(shù)前沿發(fā)展:系統(tǒng)自動(dòng)化調(diào)優(yōu)

上面幾位嘉賓和我們分享的都是智能化運(yùn)維的現(xiàn)在咏连,那么智能化運(yùn)維的未來(lái)應(yīng)該是什么呢?優(yōu)調(diào)科技技術(shù)總監(jiān)朱妤晴給出了答案——《技術(shù)前沿緊張:系統(tǒng)自動(dòng)化調(diào)優(yōu)》盯孙。

為了適應(yīng)不同應(yīng)用需求,系統(tǒng)在開(kāi)發(fā)時(shí)就暴露了大量與部署祟滴、應(yīng)用場(chǎng)景相關(guān)的參數(shù)振惰,這些參數(shù)與系統(tǒng)性能緊密相關(guān),在調(diào)優(yōu)時(shí)需要對(duì)系統(tǒng)和應(yīng)用有資深經(jīng)驗(yàn)的技術(shù)人員來(lái)進(jìn)行垄懂。而系統(tǒng)自動(dòng)化調(diào)優(yōu)就是指將這一過(guò)程自動(dòng)化骑晶。

系統(tǒng)調(diào)優(yōu)目前面臨的難題是:為了適應(yīng)更多的部署環(huán)境和應(yīng)用場(chǎng)景痛垛,系統(tǒng)參數(shù)個(gè)數(shù)越來(lái)越多;為了滿足不同的應(yīng)用負(fù)載需求,涉及的系統(tǒng)越來(lái)越多;參數(shù)設(shè)置與系統(tǒng)桶蛔、應(yīng)用緊密相關(guān)匙头,性能曲線復(fù)雜多變。

而系統(tǒng)自動(dòng)化調(diào)優(yōu)好處多多:僅調(diào)整系統(tǒng)參數(shù)值仔雷,即可使性能最大提升11倍;節(jié)省人力開(kāi)銷;減少硬件開(kāi)銷;更公平地測(cè)試和比較系統(tǒng)性能;確定系統(tǒng)瓶頸蹂析。目前,系統(tǒng)自動(dòng)化調(diào)優(yōu)的前沿研究成果有兩個(gè)碟婆,一個(gè)是卡耐基梅隆大學(xué)數(shù)據(jù)庫(kù)團(tuán)隊(duì)研發(fā)的OtterTune电抚,另一個(gè)是由中科院計(jì)算所先進(jìn)計(jì)算機(jī)系統(tǒng)研究中心研發(fā)的BestConfig。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末脑融,一起剝皮案震驚了整個(gè)濱河市喻频,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌肘迎,老刑警劉巖甥温,帶你破解...
    沈念sama閱讀 218,036評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異妓布,居然都是意外死亡姻蚓,警方通過(guò)查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,046評(píng)論 3 395
  • 文/潘曉璐 我一進(jìn)店門匣沼,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)狰挡,“玉大人,你說(shuō)我怎么就攤上這事释涛〖尤” “怎么了?”我有些...
    開(kāi)封第一講書人閱讀 164,411評(píng)論 0 354
  • 文/不壞的土叔 我叫張陵唇撬,是天一觀的道長(zhǎng)它匕。 經(jīng)常有香客問(wèn)我,道長(zhǎng)窖认,這世上最難降的妖魔是什么豫柬? 我笑而不...
    開(kāi)封第一講書人閱讀 58,622評(píng)論 1 293
  • 正文 為了忘掉前任,我火速辦了婚禮扑浸,結(jié)果婚禮上烧给,老公的妹妹穿的比我還像新娘。我一直安慰自己喝噪,他們只是感情好础嫡,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,661評(píng)論 6 392
  • 文/花漫 我一把揭開(kāi)白布。 她就那樣靜靜地躺著酝惧,像睡著了一般榴鼎。 火紅的嫁衣襯著肌膚如雪涧尿。 梳的紋絲不亂的頭發(fā)上,一...
    開(kāi)封第一講書人閱讀 51,521評(píng)論 1 304
  • 那天檬贰,我揣著相機(jī)與錄音,去河邊找鬼缺亮。 笑死翁涤,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的萌踱。 我是一名探鬼主播葵礼,決...
    沈念sama閱讀 40,288評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開(kāi)眼,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼并鸵!你這毒婦竟也來(lái)了鸳粉?” 一聲冷哼從身側(cè)響起,我...
    開(kāi)封第一講書人閱讀 39,200評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤园担,失蹤者是張志新(化名)和其女友劉穎届谈,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體弯汰,經(jīng)...
    沈念sama閱讀 45,644評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡艰山,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,837評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了咏闪。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片曙搬。...
    茶點(diǎn)故事閱讀 39,953評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖鸽嫂,靈堂內(nèi)的尸體忽然破棺而出纵装,到底是詐尸還是另有隱情,我是刑警寧澤据某,帶...
    沈念sama閱讀 35,673評(píng)論 5 346
  • 正文 年R本政府宣布橡娄,位于F島的核電站,受9級(jí)特大地震影響哗脖,放射性物質(zhì)發(fā)生泄漏瀑踢。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,281評(píng)論 3 329
  • 文/蒙蒙 一才避、第九天 我趴在偏房一處隱蔽的房頂上張望橱夭。 院中可真熱鬧,春花似錦桑逝、人聲如沸棘劣。這莊子的主人今日做“春日...
    開(kāi)封第一講書人閱讀 31,889評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)茬暇。三九已至首昔,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間糙俗,已是汗流浹背勒奇。 一陣腳步聲響...
    開(kāi)封第一講書人閱讀 33,011評(píng)論 1 269
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留巧骚,地道東北人赊颠。 一個(gè)月前我還...
    沈念sama閱讀 48,119評(píng)論 3 370
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像劈彪,于是被迫代替她去往敵國(guó)和親竣蹦。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,901評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容