讓語音助手發(fā)100元紅包給好友游昼,結(jié)果它真發(fā)了“100元紅包”幾個大字......
讓智能客服幫我推薦一下衣服尺碼甘苍,結(jié)果告訴我“親,這個問題我還不會烘豌,輸入人工客服幫您轉(zhuǎn)人工”......
有個能說會道叫Sophia的機(jī)器人被授予沙特公民身份载庭,結(jié)果卻發(fā)現(xiàn)是一個背后由人來操控發(fā)言的木偶......
會聊天的人工智能為什么經(jīng)常被大家吐槽是“人工智障”?智能對話交互為什么經(jīng)忱扰澹“踩雷”囚聚?有什么辦法,能讓對話交互不那么智障嗎标锄?
交互模式的轉(zhuǎn)變:從被動到主動
從1960年命令式交互顽铸,到1984年圖形用戶界面交互,長久以來料皇,人機(jī)交互一直延續(xù)著人類輸入谓松、機(jī)器反饋的交互模式,人類始終占據(jù)主動践剂,而機(jī)器是被動的鬼譬。
隨著近年來對話式交互的出現(xiàn),人機(jī)交互的模式逐漸出現(xiàn)轉(zhuǎn)變:從人類“將就”機(jī)器逊脯,變?yōu)闄C(jī)器“順從”人意优质。
機(jī)器的情境感知和自主認(rèn)知能力的提升,使得能夠“貼心”地主動服務(wù)于人類,例如在車載場景中盆赤,AI 助手主動詢問目的地進(jìn)行導(dǎo)航贾富,或是在購物場景中,智能客服主動為用戶推薦合適的商品牺六。
主動交互的本質(zhì)颤枪,其實是收集用戶的意圖,并把用戶的表達(dá)轉(zhuǎn)變成語義結(jié)構(gòu)淑际,根據(jù)語義結(jié)構(gòu)的內(nèi)容和業(yè)務(wù)邏輯連接不同的功能畏纲。
GUI vs CUI
目前市面上的互聯(lián)網(wǎng)產(chǎn)品,基本采用了 GUI(Graphical User Interface春缕,圖形化交互界面)的交互形式盗胀,用戶進(jìn)行任何操作,都需要知道你要的功能藏在菜單系統(tǒng)的什么地方锄贼,再經(jīng)過層層點擊票灰,獲取功能。
例如手機(jī)淘寶 app宅荤,就是一個典型的層層嵌套的 GUI 交互范本:
而通過自然語言進(jìn)行對話交互屑迂,是唯一的不需要學(xué)習(xí)的主動人機(jī)交互方式:你永遠(yuǎn)都知道如何用語言表達(dá)出你想要做的事情。
基于對話交互的 CUI(Conversational User Interface冯键,對話用戶界面)比起用 GUI 的方式惹盼,大大降低了學(xué)習(xí)和使用門檻,越來越多的人都可以通過自然語言來進(jìn)行對話交互惫确,讓信息觸口可及手报。
對話交互的現(xiàn)狀
近期,奇點機(jī)智作為對話交互領(lǐng)域的 AI 百強(qiáng)企業(yè)改化,受邀參加在紐約舉辦的世界級對話機(jī)器人大會 chatbot conference 2019掩蛤, 會中表明,當(dāng)下對話機(jī)器人應(yīng)用的兩大熱門方向是市場營銷/客戶服務(wù)陈肛,以及企業(yè)自動化進(jìn)程揍鸟。
從行業(yè)角度來看,對話機(jī)器人已經(jīng)出現(xiàn)在各行各業(yè)以及我們生活的方方面面蜈亩。根據(jù) IDC 預(yù)測,對話式 AI 將在未來五年內(nèi)為金融前翎、零售、醫(yī)療等傳統(tǒng)行業(yè)帶來價值提升港华,提升幅度將分別達(dá)到64%、62%、48%臊岸。
技術(shù)上,隨著 EMLO尊流、GPT、BERT崖技、GPT2 等一系列模型的出現(xiàn)和應(yīng)用,以及計算能力的提升迎献, 讓對話交互進(jìn)入到高速發(fā)展與普及的時期。對話機(jī)器人也從 FAQ的方式把一堆信息只要相關(guān)都返回給用戶吁恍,到成為能結(jié)合語境對話的助手、為用戶選擇合適的細(xì)節(jié)信息進(jìn)行反饋冀瓦。
對話機(jī)器人為什么容易變“智障”?
與圖形用戶界面(GUI)相比咕幻,對話用戶界面(CUI)存在著更大的挑戰(zhàn)顶霞。
其一肄程,在圖形用戶界面下选浑,用戶只能嚴(yán)格按照界面定義的菜單和次序進(jìn)行逐步操作蓝厌。但對話界面下,用戶可能不按次序出牌古徒,想到什么說什么拓提。
因此,在定義對話的過程中隧膘,可能存在這樣的問題:在用戶對話的路徑或者先后順序千變?nèi)f化代态,很難覆蓋所有的路徑。
以“推薦餐廳”為例疹吃,大部分對話平臺工具是按照命令式來定義靜態(tài)對話路徑蹦疑,比如按照餐廳類型、距離遠(yuǎn)近萨驶、評分高低的順序進(jìn)行定義歉摧。但當(dāng)用戶不按理想次序進(jìn)行對話時,比如用戶說“幫我推薦個離我最近的、大眾點評口味9.0以上的餐廳叁温,不要日料”時再悼,機(jī)器人很可能因為沒有覆蓋這個路徑而顯得“智障”。
“智障”對話案例
其二膝但,在對話界面下冲九,用戶可以用成千上萬種不同的說法表述同樣的語義,這是自然語言的魅力跟束,同樣也是對話交互的難點娘侍。
以 HR 機(jī)器人例,當(dāng)用戶說:“查詢4月份的稅后薪資”泳炉,機(jī)器人可以成功執(zhí)行憾筏,但當(dāng)用戶的表達(dá)發(fā)生變化,說“幫我查上個月工資”花鹅、或“上次我的薪水發(fā)了多少”時氧腰,它可能就聽不懂了,但其實都是對應(yīng)到“查薪資”這個意圖刨肃。
另外古拴,語音識別、自然語言理解技術(shù)雖然有顯著進(jìn)步真友,仍存在一定使用門檻黄痪,另外很多場景的對話邏輯相對復(fù)雜,這些因素都在為對話機(jī)器人變“智障”添油加醋盔然。
能否打破“人工智障”的魔咒桅打?
聽懂人話,是打破人工智障魔咒的第一步愈案,那么首先就要解決上文提到的“難以覆蓋所有對話路徑”以及“表達(dá)方式千變?nèi)f化”的問題挺尾。
為了解決這兩個問題,奇點機(jī)智推出了對話機(jī)器人開發(fā)維護(hù)平臺“對話流”站绪,為產(chǎn)品經(jīng)理和對話體驗設(shè)計師打造一站式的對話體驗定義維護(hù)環(huán)境。
我們發(fā)現(xiàn)魂挂,在定義對話涂召、收集用戶信息的過程中眯漩,應(yīng)該專注于收集什么麻顶,而不是如何收集辅肾÷肿叮基于這點發(fā)現(xiàn)舍杜,奇點機(jī)智獨創(chuàng)了通過聲明式來定義動態(tài)對話路徑的方式,只需考量向用戶收集什么信息概龄,無需覆蓋所有路徑私杜,可以有效提高開發(fā)效率及產(chǎn)品靈活性救欧。
對話流隱藏了語音識別、自然語言理解等繁瑣的技術(shù)細(xì)節(jié)铝耻,能夠?qū)⒂脩敉徽Z義的不同表達(dá)對應(yīng)到相同的意圖瓢捉,零認(rèn)知也可利用前沿技術(shù)箍铭,有效降低開發(fā)成本和周期椎镣。
人類對話的本質(zhì)状答,說到底是思維的交流或交換。雖然機(jī)器與人的思維高度還存在很大距離拍摇,但讓機(jī)器理解人類并且說人話是創(chuàng)建好的對話體驗的開端充活。
要打破智能對話產(chǎn)品“人工智障”的魔咒,建議企業(yè)選擇合適的垂直領(lǐng)域并設(shè)置好邊界映穗,注重對話系統(tǒng)后的思考及解決問題的能力幕随,而不是為了擁有 AI 而植入智能對話赘淮。