一、語音交互
在《科技想要什么》一書中幔睬,凱文·凱利向我們介紹了一種全新的科技觀,即科技并非是由線路和金屬構成的一團亂麻芹扭,而是有生命力的自然形成的系統(tǒng)麻顶,正如生物演化一般,科技也有獨特的演化路徑舱卡,而通過追蹤長期的技術發(fā)展趨勢辅肾,我們可以對“科技想要什么”有所理解。
那么轮锥,以這種觀點來看待技術的發(fā)展矫钓,我們會發(fā)現(xiàn)技術的一條演化路徑,就是從電氣化舍杜,到互聯(lián)網(wǎng)化新娜,再到移動互聯(lián)網(wǎng)化,最后到現(xiàn)在的智能化既绩。而在這條路徑中概龄,我們可以清晰地發(fā)現(xiàn)人與機器交互方式也在隨著變化,從電氣時代的旋鈕按鍵交互饲握,到互聯(lián)網(wǎng)時代的鼠標鍵盤交互私杜,再到移動互聯(lián)網(wǎng)時代的圖形界面交互,這樣可以看出隨著AI技術的發(fā)展救欧,必然會帶來交互的革命歪今,產(chǎn)生新的交互方式,將我們從鼠標鍵盤和觸摸屏上解放出來颜矿。那么人與機器的交互就會從不平等的單向被動模式轉變?yōu)橹饾u平等雙向的多模態(tài)主動模式,而語音交互就是這個過程的第一步嫉晶,也是基礎性的一步骑疆。
對于語音交互來說田篇,這是一種更自然的交互方式,非常貼合人類的直覺箍铭,即使是一個對技術完全不熟悉的人泊柬,只要給他一個界面,并通過界面問題一個問題诈火,他也可以很自然地進行回復兽赁。并且通過應用語音交互,人們不再是只能跟一款產(chǎn)品進行對話冷守,而是可以同時與多種產(chǎn)品進行對話刀崖,這將極大地增加交互價值,帶來全新的交互體驗拍摇。
雖然語音交互已經(jīng)有了一些落地應用的場景亮钦,但還未成熟到可以替代鼠標鍵盤和觸摸屏,這就需要我們從設計層面思考語音交互的設計原則充活,規(guī)避一些無法實現(xiàn)或不好實現(xiàn)的功能特征蜂莉,從而帶來全新的交互體驗。接下來將從情感設計和用戶界面設計兩個方面闡述我所學習和思考的關于語音交互設計的一些原則方法混卵。
二映穗、情感設計
從語音交互的特性上來講,其主要載體為語音幕随,是人類主要的溝通方式蚁滋,其中包含了語氣、音量合陵、語調和語速枢赔,能夠傳達大量的特征信息,比起簡單的文字來可以讓人感受到同理心拥知,體驗到生命感踏拜,就會讓人對產(chǎn)品產(chǎn)生依賴,寄托情感低剔,所以情感設計必不可少速梗。
2.1人物模型
對于新生事物,尤其是沒有實體襟齿、需要依靠想象的事物來說姻锁,人們更傾向于從人類形態(tài)對其進行認知,如影視作品中的外星人大多是人形的猜欺,所以位隶,對于語音交互產(chǎn)品這種新生事物來說,賦予其人格化开皿,會更符合人類的認知涧黄,而且人格化更有利于表達情感篮昧,容易讓用戶接受,所以在情感設計中笋妥,最基礎也是最先需要考慮的就是要為產(chǎn)品設定一個人物模型懊昨。
設定人物模型還有一個好處是用戶可以通過與產(chǎn)品的交互感知到這個人物模型,進而推斷出產(chǎn)品人格或角色的標準化心理形象春宣。所以酵颁,通過人物模型這一媒介,可以在用戶認知中塑造出特定的品牌形象月帝,因此躏惋,人物模型的設定決定了用戶對產(chǎn)品的態(tài)度,就需要謹慎細致地進行人物模型的設定嫁赏,總的來說有以下幾個各方面需要考慮其掂。
2.1.1情感存在性
雖然情感是語音交互的一大亮點設計,但也是可以考慮反其道而行之潦蝇,把語音交互設計成一個工具款熬,因此在考慮如何設計人格時,首先要解決的是人物模型的情感存在性問題攘乒,人物模型是否存在情感決定了后續(xù)的一系列設計贤牛。可以回答以下幾個問題:
你介意打破用戶把語音交互幻想成人類的傾向嗎则酝?
你會讓用戶問系統(tǒng)自身相關的問題嗎殉簸?比如喜好、經(jīng)歷背景等
你認為的系統(tǒng)自然擁有的價值觀和行為應該有哪些沽讹?
對于不符合價值觀的事應如何處理般卑?比如如何處理粗魯和粗俗的行為?
當你確定了以上幾個問題的答案后爽雄,只會產(chǎn)生兩種結果:一是不需要情感蝠检,那么之后所有的設計就需要從工具的角度出發(fā)進行設計,所有的設計都是為了提高效率而設計挚瘟;二是需要設定情感叹谁,那么對以上問題的回答就會讓你有一個大致思考的方向,而接下來就需要細化這個方向乘盖,進行人格化特征的落實焰檩。
2.1.2人格特征?
在設定產(chǎn)品人格特征時需要考慮兩個原則,一個是真實性原則订框,也就是說對產(chǎn)品人格的設定需要真實可信析苫,符合產(chǎn)品真實的使用情況,所以就需要我們用真實的人格來定義聲音,那么就需要先找到一個這樣的形象衩侥,一個可行的方法是從產(chǎn)品定位的場景和用戶群兩個角度出發(fā)找到最符合用戶認知的真實人格浪腐,然后根據(jù)這個真實人格形象撰寫詳細的個性特征,并設定我們希望用戶如何看待產(chǎn)品顿乒;二是一致性原則,不要貪多求全泽谨,進而過度設計一些不必要的人格特征璧榄,要求設定的人格特征必須適合產(chǎn)品使用場景,不能在嚴肅認真的場景中設計出輕浮吧雹、玩笑的特征骨杂。但要注意一點,不要設置太強的個性雄卷,個性太強會來了負面的影響搓蚪,
2.1.3行為原則
在設定完人格特征后,就會對產(chǎn)品的行為產(chǎn)生影響丁鹉,決定了一些情景下如何表現(xiàn)妒潭。就需要認真思考符合人格設定的一些原則,可以從多個視角考慮這個問題:產(chǎn)品目標揣钦、公司目標雳灾、道德目標和社會目標等。通過對這些目標的思考冯凹,就可以幫助設定一系列的原則谎亩。
對于這些原則來說,一方面是可以演進以適應新的場景宇姚,另一方面需要有一套核心的原則作為指導方針匈庭,定義你設計的人格應該完成什么樣的目標,以及對完成目標有什么幫助浑劳,并以此指導對話阱持。例如如何對辱罵性語言進行回復。
2.2可視化形象
2.2.1存在性
對于語音交互來說呀洲,是否有一個可視化的形象也是一個非常值得考慮的問題紊选,因為一個可視化形象可以讓用戶對產(chǎn)品的感知更加形象,而且提供視覺反饋道逗,會使交流流暢兵罢,在情感表達上也更加方便。但對于不同的產(chǎn)品和場景來說滓窍,一個可視化形象的存在與否有著不同的利弊卖词,因此對于是否設計可視化的形象有以下幾條原則:
1、場景原則,要根據(jù)場景的內在要求決定是否設計可視化形象此蜈。比如當你的產(chǎn)品是用來搜索查詢時即横,就可能不需要一個可視化形象,而如果產(chǎn)品是一個真人對話式場景的話就需要一個可視化形象裆赵。
2东囚、產(chǎn)品載體原則,要針對產(chǎn)品載體設計相應的視覺化形象战授,比如對于無屏幕的硬件產(chǎn)品页藻,如音箱等,可能的視覺化形象就是簡單的發(fā)光提示植兰,而對于App或網(wǎng)站份帐,可能就是一個人物或卡通形象。
3楣导、用戶特性原則废境,視覺化形象有著不同的類型,要根據(jù)用戶群的特性進行選擇筒繁,比如針對兒童群體噩凹,一個可愛的卡通形象比較適合,而對游戲群體來說膝晾,一個真人角色形象比較適合栓始。
2.2.2交互設計原則
當選擇設定一個可視化形象,也即虛擬角色后血当,就需要在與用戶交互的層面上來考慮產(chǎn)品的設計幻赚,主要有以下一些問題:
一是與人物模型匹配的問題,視覺化形象要從角色的頂層人格特質開始設計臊旭,需要設計與人物模型相應的形象來展示相關人格特征落恼,考慮需要展現(xiàn)的博學、專業(yè)或更具有同情心等問題离熏,并且對于性別的設定來講佳谦,雖然現(xiàn)有的產(chǎn)品女性的設定比較多,并且一個女性角色可能會讓用戶更容易交流情感滋戳,但在產(chǎn)品設計時不要假設用戶更喜歡女性虛擬角色钻蔑,而應該盡可能多進行用戶測試;
二是情景匹配的問題奸鸯。虛擬角色的形象和行為表現(xiàn)應該與對話場景匹配一種咪笑,即在快樂的氛圍下,展示愉快的形象娄涩,在傷心的情景下要表現(xiàn)安慰的行為窗怒,需要注意的一點是在該情境下虛擬角色需要展示多少部分,僅展示臉,還是臉和上身扬虚,或是整個身體努隙;
三是對錯誤的處理。當出現(xiàn)未識別到用戶語音或回復內容無法匹配等錯誤時辜昵,需要讓虛擬角色表現(xiàn)出愧疚荸镊、自責等情感,從而將產(chǎn)品錯誤轉化為一次情感交流堪置,減輕用戶對產(chǎn)品的壞印象贷洲,并且通過匹配聰明的回復,來增加趣味性晋柱,讓對話繼續(xù)下去;
四是GUI的使用問題诵叁。在一些產(chǎn)品中雁竞,如App,會有圖形交互界面拧额,因此碑诉,用戶面臨著是選擇通過說話還是使用圖形用戶界面來回復。一般的原則是盡量引導用戶通過語音回復侥锦,培養(yǎng)用戶使用語音交互的習慣进栽,但如果出現(xiàn)異常或錯誤的情景恭垦,可以讓用戶通過GUI進行回復的選擇快毛,這樣可以讓用戶在產(chǎn)品未識別到語音或不太想說話時根據(jù)GUI提示來繼續(xù)對話,可以帶給用戶良好的體驗番挺;
五是話題轉換和打斷的問題唠帝。在對話中,用戶可能并不會等待產(chǎn)品完整的回復就進行打斷玄柏,因此要設置等遇到用戶打斷情況下的角色形象襟衰,不能在用戶打斷后,還繼續(xù)說話粪摘;
六是進入和退出對話時瀑晒,要通過角色的形象產(chǎn)生視覺反饋,讓用戶知道在可以在何時說話徘意,并能夠做出相應的傾聽或回復的動作苔悦。
其次還存在一個需要額外注意的問題就是恐怖谷陷阱,即當你看到一個與人類極其相近但并不完全相像的事物時會感到恐怖映砖,因此在設計時不要讓虛擬角色太過逼真间坐,或是可以使用卡通形象。
總之,設置一個可視化形象的目的就是要吸引用戶注意力竹宋,保持用戶的參與度劳澄,讓用戶能夠更順暢的進行對話,并獲得情感上的交流蜈七,因此就要根據(jù)人物模型設置一個合理的形象秒拔,即符合用戶預期,又能讓用戶對產(chǎn)品有形象化的認知飒硅,產(chǎn)生沉浸式投入砂缩。
三、用戶界面設計
對于語音交互的產(chǎn)品來說三娩,想要帶給用戶真實順暢的體驗庵芭,就要從兩個方向上的進行考慮,一個是前面提到過的情感設計雀监,通過設置一個合適的人物模型双吆,展現(xiàn)出適合場景和用戶的人格特征,以此吸引到用戶的投入会前,并與用戶產(chǎn)生直接的情感交流好乐,同時也可以考慮是否設置一個可視化形象來讓用戶對產(chǎn)品的感知更加形象化,提高用戶參與度瓦宜;另一個就是需要進行用戶界面和產(chǎn)品對話機制的設計蔚万,以保證產(chǎn)品能夠恰當?shù)卣故拘蜗螅c用戶保持一個良好的對話互動临庇,讓對話進行的更加順暢反璃,接下來就講一下關于用戶界面的設計。
3.1對話式設計
語音交互關鍵的一步是要讓用戶有真實的對話感假夺,這樣才能讓用戶投入進去版扩,交流情感,所以一個對話式交互機制的設計必不可少侄泽,而目前產(chǎn)品設計的多是一連串的單輪對話礁芦,每一個獨立對話都是一個簡單的交互,下一對話不會繼承上一個對話里的信息悼尾,只是獨立地完成與用戶的信息交換柿扣。但現(xiàn)實中的對話并非這樣的,真正的對話是具有上下文記憶的闺魏,能夠明白當前對話出現(xiàn)過之前說過的內容未状,感知對話的情景,所以對話式交互設計非常重要析桥,可以帶給用戶真實的對話體驗司草。
一般來說艰垂,會將對話式設計定義為用戶與產(chǎn)品進行一輪以上的交互。而要進行一輪以上的對話埋虹,就需要從對話的設計和管理兩個角度進行考慮猜憎。
3.1.1對話設計
在進行對話設計時,一定要以場景和用戶為中心搔课。以場景為中心胰柑,就是要考慮對話的情景來進行設計,主要分為封閉域對話和開放域對話爬泥。
a柬讨、封閉域場景
對于封閉域場景來說,一般是圍繞一個特定的話題進行交流袍啡,要求用戶輸入指定話語才能繼續(xù)對話踩官,這也就決定了該場景下對話的特征,一是輸入和輸出有具體可分的類別且可以枚舉境输,二是對話有流程卖鲤,具有明確的開始和結束。
因此畴嘶,在產(chǎn)品設計上就有三個特征需要考慮,第一個是對話設計的目的集晚,是為了解決某個特定的問題或需求窗悯,所以對話的輸入輸出是有一定范圍的,而且整個流程具有條理清晰且邏輯合理的特點偷拔。
在設計時蒋院,一是要將用戶的輸入所有可能性句式盡可能窮盡,然后設定同一合理有趣的回復莲绰,讓用戶不管輸入何種句式都能得到回復欺旧;
第二個是場景特性,是單一可控的蛤签,換個角度看就是不同的場景對對話的要求就不一樣辞友,因此對話設計必須符合該封閉域的內在要求;
第三個是對跳出邊界的處理震肮,因為對話的輸入和輸出是一個有限的集合称龙,而用戶并不會嚴格按照集合進行回復,所以隨時面臨用戶跳出話題邊界戳晌,比如聊起其他話題鲫尊、不按規(guī)則出牌等,就需要對這種情況設計如何進行回復沦偎,但不要設置統(tǒng)一回復疫向,而是要想好所有可能的跳出情況咳蔚,然后為每一種情況設計單獨的處理,這樣更能讓用戶有真實的對話體驗搔驼,讓用戶更加投入谈火,帶來沉浸式體驗。
b匙奴、開放域場景
對于開放域場景來說堆巧,對話非常像一個搜索引擎,用戶想說什么就說什么泼菌,系統(tǒng)會針對用戶輸入來回復相應的內容谍肤,這樣對話的輸入輸出無法窮盡,也沒有明確的流程哗伯,就需要有一個嚴格的產(chǎn)品機制來保證對話的流暢性荒揣。
這里在設計時需要考慮的幾點,一是需要不斷的給用戶制造符合情景的話題焊刹,否則用戶就會因為缺少可以繼續(xù)交流的內容而終止話題系任。可行的方法是圍繞情景建立一個話題庫虐块,讓其包括情境下一些基本的話題以及當下的熱點話題俩滥,然后設計一個產(chǎn)品主動問詢機制,當滿足缺少話題的條件時贺奠,系統(tǒng)會主動從話題庫中搜索合適的話題與用戶交流霜旧,這樣既能讓對話進行下去,也能讓用戶感覺到產(chǎn)品的主動性儡率,從而帶來不一樣的體驗挂据,需要注意的一點是不能在用戶不想交談時制造新話題,因此對主動問詢機制觸發(fā)條件的設置需要考慮周全儿普;
二是語料的問題崎逃,由于是在開放的場景下問答,無法通過人力將對話編寫的很全面眉孩,因此所有語料一般都是來自網(wǎng)絡上公共的人人對話个绍,但也可以通過用戶對產(chǎn)品的使用來搜集與用戶的對話,但搜集到并不是終點浪汪,還應該對語料進行相應的處理才可以使用障贸,比如去除不符合場景的、帶有侮辱歧視性質的內容吟宦;
三是要能夠與用戶建立親密感和信任感篮洁,因為現(xiàn)階段用戶使用產(chǎn)品多為嘗鮮調戲而來,輸入也是千奇百怪殃姓,因此如果只針對內容進行回復就無法在用戶心中形成固定的印象袁波,自然也無法建立起親密感和信任感瓦阐,因此在設計時,需要著重考慮人物模型和風格的設定篷牌,回復時要符合這些設定睡蟋,這樣才能讓用戶認知到一個清晰固定的形象,從而讓用戶感受到情感的交流枷颊,進而與用戶建立親密感和信任感戳杀,提升用戶粘性。
c夭苗、用戶中心
以用戶為中心信卡,即在設計對話時,時刻考慮到用戶的意圖题造,要思考用戶是完成一次性的任務還是進行多輪對話傍菇。對于完成一次性的任務,就要設計出合理的流程來對用戶進行引導界赔,讓用戶能夠高效率地完成任務丢习。但對于進行多輪對話時,就要去了解用戶淮悼,要思考用戶的下一步會做些什么咐低,不強迫用戶展開新一輪的對話,并且讓用戶決定何時開啟對話以及對話要持續(xù)多久袜腥。
在設計時见擦,就可以為用戶設計一個私人對話數(shù)據(jù)庫,主要可以存儲三方面的內容:一是通過與用戶對話積累的一些用以支撐對話的通用知識瞧挤,通過查詢這些知識,可以更好地理解與用戶的對話內容儡湾;
二是通過用戶在交流過程中特恬,面對某些問題時所采用的行為模式進行積累。那么在之后的對話中徐钠,就可以根據(jù)這些模式來進行回復癌刽,既可以回復與用戶行為模式不同的對話,帶來趣味性尝丐,保持用戶的新鮮感显拜,也可以回復與用戶行為模式一致的對話,就能維持系統(tǒng)對話行為的一致性爹袁,為用戶提供熟悉感远荠,讓用戶感到是在跟一個對象進行對話;
三是學習并了解一些用戶的基本情感反應失息,能夠知道用戶在什么情景下說的的那些話代表了什么情感譬淳,從而做出更適合的應對档址。
3.1.2對話管理
想要進行真正的多輪對話,除了對話設計外邻梆,還需要對話管理守伸,能夠讓系統(tǒng)記住過去的信息,這樣在后續(xù)的對話中浦妄,能夠利用上下文信息進行合理回復缤弦,保證對話的持續(xù)進行和話題輪換国裳。
首先,需要建立用戶畫像,讓系統(tǒng)能夠感知到一些基本的用戶特征朽褪,然后在這個特征基礎上生成與用戶的對話;
然后幌绍,是讓系統(tǒng)知道需要記憶哪些信息赘娄,比如說對訂外賣來說,要獲得以下信息:店鋪名故黑、飯菜名儿咱、飲料名、街道地址和電話號碼等场晶。因此就要針對產(chǎn)品的應用場景混埠,提前把系統(tǒng)需要的信息想好,并設定合理的詞槽诗轻。
同時钳宪,還要考慮這些信息的獲取機制。需要思考以什么樣的順序獲取信息是比較符合用戶習慣扳炬,是讓用戶一次性提供還是通過對話一點點得到吏颖,并且要在對話中通過合理流程引導用戶,讓他們以自己的方式提供這些信息恨樟。
最后半醉,要把這些獲得的信息儲存起來,就可以進行上下文跟蹤和語境感知劝术,即通過查詢這些記錄著已發(fā)生的對話內容的信息缩多,來理解接下來用戶輸入的內容,就可以清楚知道一些代詞养晋、時間的含義衬吆,既可以給用戶正確的反饋,以及根據(jù)已記錄的信息改變自己的提問方式绳泉,同時避免重復的提問或回答逊抡。
并且在存儲對話信息的同時,也可以設計一個對話自我學習機制零酪,讓系統(tǒng)可以根據(jù)這些對話信息秦忿,提取其中的數(shù)據(jù)特征來優(yōu)化和生成新對話麦射,然后再用這些新生成的對話反哺系統(tǒng),就會產(chǎn)生對話內容的自我循環(huán)進化灯谣,能為用戶提供更多新鮮的回復潜秋,提高用戶體驗。
另外胎许,還要考慮的一點是關于對話標識的設置峻呛。這樣能夠讓用戶了解對話的進展情況,讓對話顯得自然流暢辜窑,使得產(chǎn)品更加人性化钩述。
對于標識,主要考慮的方向就是使用一些基本的對話禮儀穆碎,并且要適合系統(tǒng)角色的設定牙勘,一般包括以下三個方面:時間線,如首先所禀、然后呢方面,最后等;接收回執(zhí)色徘,如謝謝恭金、好的、知道了等褂策;積極反饋横腿,如做的不錯、很高心認識你等斤寂。在編寫完對話方案后耿焊,可通過與別人做一次“劇本朗讀”,這樣能幫助你決定在對話的哪個部分中添加對話標識遍搞。
3.2用戶機制
3.2.1模式選擇
在模式選擇時罗侯,需要考慮是讓用戶隨時可以向系統(tǒng)提問/命令,還是讓用戶進入一個有明確開始和結束的封閉式對話尾抑。
當參加的是一個有明確開始結束流程的對話時歇父,選擇的模式就是命令-控制模式蒂培。在這種模式下再愈,必須考慮用戶如何進行開始和結束以及系統(tǒng)如何回復。對于開始來說护戳,要讓用戶給系統(tǒng)明確的指示翎冲,比如按鍵或者說關鍵詞喚醒。對于系統(tǒng)回復媳荒,需要考慮不同的情況抗悍,在開始時驹饺,可以采用非語言性的提示音效或者視覺反饋的方式進行響應,然后用戶就知道系統(tǒng)正在聆聽缴渊。然后要設置合理的聆聽等待時間赏壹,一般情況下10s是一個合適的值,也可以根據(jù)實際情況進行調整衔沼。當在這段時間內未收到用戶回復時蝌借,根據(jù)對話內容來決定是詢問還是結束對話。在結束對話后指蚁,要根據(jù)對話內容決定是繼續(xù)處理后續(xù)請求還是等待下一次明確對話菩佑。
當選擇讓用戶隨時向系統(tǒng)提問或命令時,就選擇對話模式與用戶進行對話凝化。整個過程是自然開始的稍坯,無需明顯的確認。要在對話過程中利用對話技巧進行話輪轉換搓劫,比如說問問題瞧哟、虛擬形象的眼神交流、適時的停頓以及指出明確的方向糟把,需要注意的是不要強迫用戶對話绢涡,對于可能存在用戶打斷對話的情況時,要先說可能的指令在說問題遣疯,如果為匹配到合適內容雄可,可以設計合理的提示讓用戶明白為了繼續(xù)對話應該做些什么。
當然這兩個模式并不是選擇一個就不可以在使用另一個了缠犀,也可以同時使用数苫,但最好在模式轉換時,設計合適的提示辨液,讓用戶大致知道對話模式已改變虐急。
3.2.2用戶管理
在進行對話設計時,不可避免的一點就是如何對用戶進行管理滔迈,這樣才能夠讓用戶對系統(tǒng)有一個合理的期望止吁,培養(yǎng)用戶的使用習慣。
需要注意的以下幾點燎悍,一是要先理解答案再提問敬惦,比如在用戶寫完電子郵件時,會出現(xiàn)提示“您是發(fā)郵件還是更改郵件”谈山,而用戶遇到此問題的下意識的回答很可能是“是”俄删,所以就要在系統(tǒng)中建立對這種情況的回復,需要修改提示內容,讓其更加明確畴椰,如“您想做什么:發(fā)送郵件還是更改郵件”臊诊;
二是要對已完成的任務有一個提示,雖然不必要斜脂,但萬一遇到設置失敗的情況就可以提醒到用戶抓艳;
三是在用戶設置了可以完成某項任務的預期時,一定要設置相應的取消任務設置帚戳;
四是可發(fā)現(xiàn)性壶硅,要能夠讓用戶知道什么時候可以說話,以及可以說些什么销斟,最好的方式就是借助用戶的自然語言進行功能設計庐椒,這樣比較貼合用戶的實際使用體驗;
最后一點是不要責怪用戶蚂踊,用戶總是對的约谈,要把錯誤歸結為系統(tǒng)設計,然后設置聰明有趣的回復犁钟,這樣不會影響用戶對系統(tǒng)的看法棱诱。
另外,需要額外考慮新手用戶的體驗涝动,通過設置包含教學細節(jié)的引導提示來讓用戶明確使用流程和產(chǎn)品認知迈勋。同時,不要晾著用戶不管醋粟,在用戶要求很多時靡菇,可以先滿足用戶的部分要求∶自福總之厦凤,用戶期望管理的目的就是讓對話適應用戶的行為,不讓用戶感到厭煩育苟。
3.2.3數(shù)據(jù)處理
通過與用戶對話產(chǎn)生的數(shù)據(jù)较鼓,具有巨大的價值,一方面可以讓產(chǎn)品記憶過去的對話內容违柏,與用戶進行多輪對話博烂;另一方面,可以作為素材來讓產(chǎn)品使用漱竖,并且可以通過分析這些數(shù)據(jù)來改進產(chǎn)品禽篱。所以產(chǎn)品都通常都會存儲這些數(shù)據(jù),但不可避免的就是會遇到用戶隱私的問題闲孤,因此在存儲這些數(shù)據(jù)時谆级,一定要采取匿名存儲的方式,將一切有關用戶隱私的信息去除掉讼积。
3.3確認模式
3.3.1喚醒詞
在確認模式中肥照,首先需要考慮的就是產(chǎn)品的喚醒機制,即如何讓產(chǎn)品開始進入回應模式勤众。當前主要的策略就是通過喚醒詞進行產(chǎn)品喚醒舆绎,比如亞馬遜Echo音箱的“Alexa”,這是一種不需要身體接觸設備就可以喚醒產(chǎn)品的非常便捷的方式们颜。
那么如何制訂合適的喚醒詞就很關鍵吕朵,一般來說,喚醒詞首先要易于識別窥突,且不易混淆努溃,因此一些過短的詞句就無法使用,一般會要求使用的詞是多音節(jié)詞阻问,并且需要確保喚醒詞能讓人很容易說出口梧税,因此,現(xiàn)行的喚醒詞大多是產(chǎn)品的名稱称近,或者加上打招呼用的禮貌用語第队,如hi、ok等刨秆。
另外凳谦,還需要考慮的是誤喚醒和喚不醒的情況。首先來說衡未,這是一個識別靈敏度問題尸执,需要多測試調整,讓產(chǎn)品在識別過度和識別不足之間取得平衡缓醋。其次剔交,對于誤喚醒情況來說,要確保不選擇人們在談話中常用的詞改衩,而對于喚不醒來說岖常,可以考慮增加一些視覺識別方案,從語言和行為兩方面來確保能夠喚醒產(chǎn)品葫督。最后竭鞍,需要注意的是要在本地處理喚醒詞,這樣才能最快地響應用戶橄镜。
3.3.2確認策略
在喚醒產(chǎn)品進入對話后偎快,就需要設置合適的確認策略來確保用戶能夠感覺到自己被理解。但也要注意洽胶,不能讓產(chǎn)品出現(xiàn)過度確認的情況晒夹,比如重復向用戶確認命令,這樣會讓用戶脫離對話的情景,并感到厭煩丐怯。
在設計確認策略時喷好,主要從以下幾個方面考慮:一是錯誤的后果是什么?是否重要读跷?對于訂票轉賬這種行為不允許出錯梗搅,而如果是為了娛樂的化,出錯可能是一種加深用戶印象的方式效览;二是系統(tǒng)反饋的方式是什么无切?是文本、語音丐枉,還是視覺反饋哆键,如果帶有屏幕的話又該如何反饋;三是以什么樣的形式來確認比較合適瘦锹,是明確還是含蓄洼哎,或者是混合形式。
而在確認方式上只有兩種沼本,顯性確認和隱性確認噩峦,下面介紹一下具體的方法策略。
a抽兆、顯性確認
一是通過重復用戶的回復/要求來進行強制確認识补,這種方式最直接,但可能在體驗效果上不是很好辫红,只有在一些特殊場景下使用凭涂,比較合理;
二是設置相應的視覺形象贴妻,對于無屏幕的產(chǎn)品可以通過發(fā)光響應切油,而對于有屏幕的,可以通過視覺形象或GUI展示相應的形象或按鍵來對用戶進行確認名惩。
b澎胡、隱性確認
一是將答案和原始問題的一部分連起來一同回復用戶,比如說用戶詢問世界上最高的山峰是什么娩鹉?系統(tǒng)回復“世界上最高的山峰是珠穆朗瑪峰”攻谁;
二通過行動相應,比如說用戶命令開燈時弯予,打開相應的燈光就行戚宦,無需再回復“好的,將為您打開燈光”锈嫩,但要注意用戶指令到操作的延遲受楼,若無法立即產(chǎn)生操作垦搬,需要讓用戶知道系統(tǒng)已經(jīng)接受到指令,一個好的辦法是設計一個操作提示音艳汽。
c猴贰、三級置信度
一個混合顯性確認和隱性確認的策略是通過評估置信度閾值來進行確認,不同的置信度閾值采取不同的確認策略骚灸,一般采用三級置信度的方法,比如在置信度為80%以上的區(qū)間慌植,采取隱性確認的方式甚牲,在79%-50%的區(qū)間內,采取顯性確認的方式蝶柿,當置信度低于50%時丈钙,通過提示用戶再說一遍的方式來進行確認。
3.4異常處理
為了讓用戶有一個良好的體驗交汤,除了需要考慮正常的運行機制外雏赦,還需要考慮對異常的處理,這里主要包括對錯誤芙扎、歧義和延遲的處理星岗。主要的目的就是讓系統(tǒng)在對話出現(xiàn)問題時,也能對用戶提問進行反饋戒洼,讓對話進行下去俏橘,帶給用戶真實的對話體驗。
3.4.1錯誤處理
a圈浇、未檢測到語音
對于未檢測到語音的情況寥掐,首先需要明確的一點就是這并不等于用戶什么也沒說,有可能是因為某種原因磷蜀,系統(tǒng)為檢測到召耘。
一般有兩種處理方式,一是明確地說出來褐隆,一種是什么也不做污它。不同的情況可以采取相應的方式。
當你的系統(tǒng)只使用語音庶弃,用戶沒有其他的回復方式轨蛤,而必須要用戶回復才能繼續(xù)時,就需要采用明確地說出來虫埂;當用戶通過其他方式進行下一步操作祥山,或是就算什么也不做,也不會中斷對話時掉伏,就什么也不做缝呕。
需要注意的是不能每次都提醒用戶澳窑,那樣會很煩人,可以利用人類已經(jīng)適應的對話規(guī)則供常,使用一些微妙的反饋來提醒用戶摊聋。
b、檢測到語音但未識別
在某些情況下栈暇,ASR工具確實檢測到音頻信號麻裁,但無法給出任何可靠地識別結果。面對這種情況源祈,處理方式和第一種錯誤非常相似煎源,可以明確地說出來,或是什么也不做香缺。還有一種處理方式是專門設定一個對這種情況的回復手销,比如說“對不起我走神了,可以再說一遍嗎”图张,通過回復引導用戶進行下一步操作锋拖。
c、識別出語音但系統(tǒng)無法處理
對于識別的內容系統(tǒng)無法處理祸轮,這種情況多是由于在對話數(shù)據(jù)庫中未包括對一些情況的處理兽埃,因此需要對用戶可能會說到的所有情況做更完善的預測,并設置相應的回復适袜。
d讲仰、部分語音識別錯誤
當遇到部分語音識別錯誤時,需要靠系統(tǒng)機制來規(guī)避痪蝇,比如設置一個完備的N-Best列表鄙陡,或對真實用戶響應的數(shù)據(jù)進行分析,來建立解決方案躏啰。
3.4.2歧義消除
歧義通常有三種情況:
一是用戶只提供部分信息趁矾,就會使系統(tǒng)沒有足夠的信息來進行回復。在這種情況下给僵,處理方式是可以通過上下文信息來推測用戶所說的內容是什么意思毫捣,然后直接回復,讓用戶來進行確認帝际。還可以對用戶進行進一步的問詢蔓同,這就需要設置一個主題列表,對于缺失的部分進一步詢問用戶蹲诀;
二是用戶提供過多信息斑粱,導致指令不明確。這種情況下脯爪,可以通過詢問用戶想要做什么來進行確認则北,但不要在下次提問時詢問上次已經(jīng)確認的事矿微;
三是用戶提供的信息超過系統(tǒng)能夠處理的范圍,那么就需要通過對話引導用戶縮小范圍尚揣。
3.4.3延遲
通常延遲由以下原因產(chǎn)生:糟糕的連接性能涌矢、系統(tǒng)處理進程、數(shù)據(jù)庫訪問快骗。面對這些原因娜庇,必須今早考慮到用戶可能面臨的延遲,確保系統(tǒng)有對應的處理措施方篮。一個可行的做法是將原因告知用戶名秀,或者是設置有趣而聰明的回復來讓用戶等待,比如說“突然身體不舒服恭取,等一下再回復你呦”泰偿。還可以做的是將語音進行分布處理熄守,對于喚醒來說放在本地進行蜈垮,而對對話音頻的處理放在云端進行,從而提升效率裕照。另外攒发,需要注意的一點是延遲并不一定都是不好的,有時候晋南,人類對話就是會有延遲惠猿,因此,會在一些地方如回復之前加上一些延遲负间,讓對話顯得流暢偶妖,不會讓用戶感覺到異樣。
3.5幫助和其他通用部分
為了帶給用戶更好的體驗政溃,我們需要確保每一個狀態(tài)都包含一組通用組件:重復趾访、菜單、幫助董虱、操作和再見扼鞋,這樣可以符合用戶已有的操作系統(tǒng),如重復愤诱、取消和獲得幫助云头。
對于系統(tǒng)的幫助部分,要注意以下幾點:一是要做用戶需要時就能得到淫半,因此需要提供操作說明溃槐,讓用戶知道可以做什么,還要考慮用戶會如何表達求助以及該提供怎樣形式的幫助科吭;二是要與上下文有關竿痰,但也要考慮在沒有上下文幫助時如果提供脆粥;三是如果有屏幕時,要利用好視覺空間影涉。
最后值得說的一點是關于交互載體的選擇变隔,雖然語音交互給人的印象可能是用語音進行交互,但實際上語音交互指代的是一種更符合人類交流的一種自然交互方式蟹倾,所以載體并不局限于語音匣缘,對照現(xiàn)實中人類交互,我們可以發(fā)現(xiàn)除了語音外鲜棠,還有視覺肌厨、肢體動作等,因此豁陆,一個好的語音交互設計必定是多模態(tài)的柑爸,通過語音+表情+動作+文字的組合形式,可以減輕用戶的認知負擔盒音,更加合理地給用戶展示信息表鳍,帶給用戶更好的體驗。而在設計多模態(tài)時祥诽,一個可靠的模型是梅拉比安溝通模型譬圣,將動作和語言串在一起。背后的理論是:有效溝通要素的重要性:文字7%雄坪,聲音語調38%厘熟,動作55%。
以上內容來自近期對《語音用戶界面設計:對話式體驗設計原則》一書的閱讀和在飯團AI產(chǎn)品經(jīng)理大本營的學習和思考维哈。