云博士簡(jiǎn)介
云博士依托于海量數(shù)據(jù)分析、自然語(yǔ)義分析和云產(chǎn)品智能自學(xué)習(xí)等技術(shù),面向用戶提供了最懂云計(jì)算的智能問(wèn)答服務(wù)夸研,為阿里云用戶提供秒級(jí)響應(yīng)、多端觸達(dá)的智能化服務(wù)體驗(yàn)依鸥。
業(yè)務(wù)背景
阿里云業(yè)務(wù)的快速發(fā)展亥至,帶來(lái)了云計(jì)算背后的巨大服務(wù)壓力!如何為用戶更快速高效把問(wèn)題解決呢 贱迟?我們?cè)谒惴ㄍ扑]上做了很多實(shí)驗(yàn)和突破姐扮,努力提升答案的命中概率,為用戶的問(wèn)題推送期望的知識(shí)點(diǎn)衣吠。后來(lái)我們逐漸發(fā)現(xiàn):在用戶使用云計(jì)算產(chǎn)品的過(guò)程中茶敏,很多時(shí)候只能看到問(wèn)題現(xiàn)象,而經(jīng)常有很多問(wèn)題的現(xiàn)象是相同或者類似的缚俏,這時(shí)候即便我們推送答案的計(jì)算邏輯百分百正確惊搏,也不能解決用戶的所有問(wèn)題贮乳。因?yàn)檫@些從描述上來(lái)說(shuō)幾乎一樣的問(wèn)題,背后的原因多種多樣恬惯,解決方案也千差萬(wàn)別向拆。
通過(guò)查看大量的工單,我們看到售后工程師在解這些問(wèn)題時(shí)酪耳,面對(duì)相同的“工單內(nèi)容“亲铡,工程師們需要花費(fèi)大量的時(shí)間,穿梭于不同的系統(tǒng)平臺(tái)獲取用戶的線上實(shí)例數(shù)據(jù)葡兑,來(lái)解決這些看上去類似的問(wèn)題奖蔓。通過(guò)不斷實(shí)驗(yàn)和討論,云博士把這樣相同現(xiàn)象的問(wèn)題合并形成一類問(wèn)題讹堤,并針對(duì)每一類問(wèn)題分別建立了決策樹(shù)吆鹤,來(lái)替售后工程師更精準(zhǔn)的解決用戶問(wèn)題,從而大大提升解決效率洲守!將之前人工半小時(shí)才能解決的問(wèn)題疑务,在1秒內(nèi)快速完成,整體提高了阿里云用戶解決問(wèn)題的體驗(yàn)梗醇。
阿里云工單案例
現(xiàn)象:無(wú)法遠(yuǎn)程 -> 原因:windows 3389端口問(wèn)題!
現(xiàn)象:無(wú)法遠(yuǎn)程 -> 原因:ssh 22端口問(wèn)題!
現(xiàn)象:無(wú)法遠(yuǎn)程 -> 原因:機(jī)器重啟中!
以上的工單內(nèi)容都是用戶無(wú)法遠(yuǎn)程連接到自己的ecs知允,面對(duì)同樣的語(yǔ)義,基于Q/A原理的任何算法都無(wú)法解上面的場(chǎng)景叙谨,但是云博士卻針對(duì)性的給出了三個(gè)不同的解決方案温鸽,并且用戶查看后主動(dòng)關(guān)閉工單確認(rèn)問(wèn)題解決。那么問(wèn)題來(lái)了手负,云博士是如何做到的呢涤垫?
問(wèn)題本質(zhì)
ecs無(wú)法遠(yuǎn)程這種問(wèn)題現(xiàn)象對(duì)應(yīng)的原因有很多種:ecs實(shí)例運(yùn)行狀態(tài)(啟動(dòng)中、關(guān)閉竟终、關(guān)閉中等)蝠猬、網(wǎng)絡(luò)被黑洞清洗、主機(jī)的使用情況(cpu/內(nèi)存/iops異常)等!
是不是表示我依次判斷各個(gè)條件是否異常就可以了? No统捶,比如應(yīng)用被攻擊導(dǎo)致網(wǎng)絡(luò)被黑洞榆芦,同時(shí)可能cpu、內(nèi)存喘鸟、iops都會(huì)異常匆绣,故在判斷各個(gè)條件是有先后順序的,而且各個(gè)條件組合起來(lái)解決方案可能也不同迷守。
誰(shuí)知道這些判斷的組合關(guān)系及先后順序及對(duì)應(yīng)的解決方案是什么犬绒? 工作在不同業(yè)務(wù)線解工單的一線售后工程師們旺入,對(duì)業(yè)務(wù)以及排查流程最了解兑凿。這些工程師知道這些現(xiàn)象背后具體的原因排查方法及對(duì)應(yīng)的解決方案凯力。但是他們很難打通并獲取十幾個(gè)系統(tǒng)平臺(tái)的數(shù)據(jù)來(lái)自動(dòng)解這些問(wèn)題
傳統(tǒng)解法
業(yè)務(wù)線的售后工程師作為需求方,給云博士的開(kāi)發(fā)團(tuán)隊(duì)提需求礼华,case by case的解類似的問(wèn)題咐鹤,但是這個(gè)方式有個(gè)弊端,每一個(gè)千人千面的場(chǎng)景都需要售后工程師+開(kāi)發(fā)同學(xué)逐一區(qū)別攻克圣絮,這樣會(huì)導(dǎo)致開(kāi)發(fā)同學(xué)陷入了具體的業(yè)務(wù)場(chǎng)景里祈惶,不斷去硬編碼這些業(yè)務(wù)邏輯。那么有沒(méi)有更好的方式來(lái)解這個(gè)問(wèn)題扮匠?
千人千面解決方案
先來(lái)一張?jiān)撇┦亢?jiǎn)單的架構(gòu)圖捧请,讓大家對(duì)云博士有一個(gè)全景的認(rèn)識(shí)!
云博士的千人千面能力作為語(yǔ)義分析的一部分,去幫助云博士解決那些語(yǔ)義相同但是答案不同的場(chǎng)景棒搜,并把這部分能力開(kāi)放出來(lái)疹蛉,讓普通、不懂算法業(yè)務(wù)同學(xué)參與進(jìn)來(lái)力麸。
簡(jiǎn)單流程如下:
業(yè)務(wù)同學(xué)定義決策樹(shù)可款,不同的千人千面場(chǎng)景定義不同的決策樹(shù)(標(biāo)準(zhǔn)的bpmn流程圖),并在葉子節(jié)點(diǎn)給出最終的解決方案,下面是遠(yuǎn)程無(wú)法連接部分決策樹(shù)場(chǎng)景!
開(kāi)發(fā)同學(xué)負(fù)責(zé)解析決策樹(shù)克蚂,并打通各個(gè)平臺(tái)獲取支撐決策樹(shù)的決策變量(針對(duì)遠(yuǎn)程無(wú)法連接的場(chǎng)景:cpu闺鲸、mem、iops等)
總結(jié)
通過(guò)上面的千人千面解決方案埃叭,我們把耦合在一起的開(kāi)發(fā)和業(yè)務(wù)需求最大限度的隔離摸恍,開(kāi)發(fā)不需要關(guān)心if else的先后順序、相關(guān)因素的組合關(guān)系赤屋、具體的解決方案是什么误墓,只需要一套代碼框架,做到了“一勞永逸“益缎。對(duì)于業(yè)務(wù)同學(xué)谜慌,我們把“定制能力”開(kāi)放給解工單的售后工程師,來(lái)方便的修改增加決策邏輯莺奔,更好的支持線上解決用戶問(wèn)題以應(yīng)對(duì)各種各樣的千人千面場(chǎng)景欣范。