通讀本書,以下拉出各章總結(jié)云稚,僅供參考
前言
? 人們已經(jīng)習(xí)慣于各種各樣的繪畫和社交行為隧饼。比如“你好”和別人打招呼,以及在掛電話或離開前確保結(jié)束談話静陈。VUI并不是人類燕雁,它需要遵守這些基本的社會(huì)習(xí)俗,但即便如此鲸拥,它又是否能夠真正地理解用戶并發(fā)揮價(jià)值呢拐格?
第1章:導(dǎo)語
? 本章介紹VUI系統(tǒng)簡史,以及VUI系統(tǒng)是否適合你和你的應(yīng)用程序刑赶。本章還講述了“對話式”的含義捏浊,并對聊天機(jī)器人(Chatbot)做了簡介。
? 盡管VUI變得越來越常見撞叨,依然有很多用戶不熟悉或者不信任它金踪。很多人嘗試了幾次語音識(shí)別技術(shù),識(shí)別失敗之后就再也不用了牵敷。從一開始就要設(shè)計(jì)好胡岔,意味著要盡可能的覆蓋所有的失敗情況,這樣才可以建立系統(tǒng)與用戶之間的信任枷餐。
第2章:語音用戶界面基本設(shè)計(jì)原則
? 本章為讀者創(chuàng)建一個(gè)VUI系統(tǒng)打下了基礎(chǔ)靶瘸。本章會(huì)以專題形式,闡述設(shè)計(jì)及工具、會(huì)話信息確認(rèn)怨咪、錯(cuò)誤行為處理屋剑,以及如何處理新手用戶和專家用戶等基本設(shè)計(jì)原則。
? 如何分別對待新手和專家用戶惊暴;以及最重要的——如何設(shè)計(jì)出錯(cuò)狀態(tài)饼丘。
? 早在互聯(lián)網(wǎng)普及以及智能手機(jī)發(fā)明之前,IVR(Interactive Voice Response)系統(tǒng)就已經(jīng)存在了辽话。如今肄鸽,IVR系統(tǒng)通常被用來做電話回復(fù)的“第一階段”。完成客戶基本信息的預(yù)先收集油啤,此外還善于將不同的客戶分流給不同職能的客服典徘,作為用戶,相比真人交談益咬,更喜歡IVR逮诲,因?yàn)樗麄兛梢曰ê荛L時(shí)間反復(fù)咨詢而不會(huì)覺得在打擾人類客服。
? 移動(dòng)VUI有他的設(shè)計(jì)原則1幽告、確定它是否需要一個(gè)視覺化的呈現(xiàn)梅鹦,比如虛擬角色。2冗锁、確定VUI什么時(shí)候允許用戶說話齐唆、用戶可以被打斷嗎?需要按鍵功能嗎冻河?(文字箍邮、語言、視覺叨叙、動(dòng)作锭弊、環(huán)境)。移動(dòng)VUI通常用于單論任務(wù)擂错,這種形式的交互是非常獨(dú)立的味滞,不需要系統(tǒng)來維護(hù)大量的信息,而我們更要考慮“對話式設(shè)計(jì)”
? 對話式設(shè)計(jì)——思考如何與VUI系統(tǒng)進(jìn)行一輪以上的交互钮呀,思考用戶接下來可能會(huì)做什么桃犬。不要強(qiáng)迫用戶展開新一輪對話,而是嘗試了解用戶的意圖并允許用戶繼續(xù)交談行楞。此外攒暇,有必要為近期用戶所說的話保留歷史數(shù)據(jù),上下文理解子房,一般來說形用,讓用戶來決定對話要持續(xù)多久就轧。1、如果不能理解答案田度,就不要提問妒御。2、可發(fā)現(xiàn)性(一般來說流程不可見)镇饺,
? 設(shè)計(jì)工具:流程圖乎莉,需要列出用戶進(jìn)入下一個(gè)狀態(tài)分支的所有方式
? 對話式標(biāo)識(shí)是讓用戶了解交談進(jìn)展以及進(jìn)展情況的重要方式。當(dāng)系統(tǒng)在對話中使用了一些基本的對話禮儀后奸笤,用戶的參與度會(huì)更高惋啃,并且會(huì)以同樣的方式進(jìn)行回復(fù),這會(huì)將交互的各個(gè)部分連接在一起监右。對話式標(biāo)識(shí)包括時(shí)間線(首先边灭、最后)、接收回執(zhí)(知道了健盒、好的)绒瘦、積極反饋(很高興聽到。扣癣。)惰帽。
? 確認(rèn)信息的方式:1、三級置信度 2父虑、隱形確認(rèn)(回復(fù)時(shí)添加問題主題)3该酗、非語言確認(rèn)(提示音)4、通用確認(rèn)(對情況進(jìn)行同理心回復(fù)频轿,如聽到后很難過)5、視覺確認(rèn)
? VUI可能出錯(cuò)的情況:1烁焙、未檢測到語音航邢。2、檢測到語音但未識(shí)別骄蝇。3膳殷、語音被正確處理但系統(tǒng)無法識(shí)別。4九火、部分語音識(shí)別錯(cuò)誤赚窃。
? 設(shè)計(jì)IVR系統(tǒng)時(shí),確保每個(gè)狀態(tài)都包含一組通用組件:重復(fù)岔激、主菜單勒极、幫助、操作和再見虑鼎。另一塊重要的部分是辱匿,一個(gè)全局的退出機(jī)制键痛。
? 另一個(gè)經(jīng)常被設(shè)計(jì)師忽略的問題是“延遲”。消除歧義匾七,如果沒有足夠的上下文信息來幫助判斷絮短,系統(tǒng)就需要讓用戶來進(jìn)行確認(rèn)。
? 有關(guān)無障礙設(shè)計(jì)——VUI設(shè)計(jì)中:1昨忆、交互應(yīng)該是省時(shí)高效的(簡短丁频、語速快一些、隨時(shí)打斷) 2邑贴、交互應(yīng)該提供上下文語境(我在哪) 3席里、交互應(yīng)該優(yōu)先考慮個(gè)性化而不是個(gè)性(個(gè)性化TTS)? 最需注意:設(shè)計(jì)者不應(yīng)該去假設(shè)所有的用戶會(huì)以某種模式來訪問系統(tǒng),所有的訪問模式都應(yīng)該隨時(shí)可用痢缎。 減少用戶認(rèn)知負(fù)擔(dān)胁勺,避免在一個(gè)問題中加入過多的信息。
? 小結(jié):
? 典型的VUI項(xiàng)目交付包括以下內(nèi)容
示例對話(真是的錄音)
流程圖
提示列表
界面原型
? 如果是與外部客戶進(jìn)行合作独旷,這些設(shè)計(jì)交付成果將用來展示出最終成品的形態(tài)署穗,供客戶進(jìn)項(xiàng)審閱和反饋,本章介紹的一些更關(guān)鍵設(shè)計(jì)概念包括以下:
確認(rèn)策略(你的用戶如何知道系統(tǒng)理解了自己的話)
你的VUI應(yīng)該使用命令——控制式的對話模式還是對話式的對話模式
異常處理(總會(huì)發(fā)生一些錯(cuò)誤嵌洼,你需要優(yōu)雅地處理)
上下文(記住用戶的話案疲,無論信息在同一會(huì)話還是之前的對話中)
如何處理不明確的輸入信息
幫助命令和其他通用命令
? 為移動(dòng)設(shè)備設(shè)計(jì)是一個(gè)會(huì)豐富你的經(jīng)驗(yàn),也會(huì)更復(fù)雜的工作麻养,你需要確定如何讓你的用戶知道他們可以在何時(shí)何地說話褐啡,以及何時(shí)何地使用視覺反饋。讓用戶能夠與移動(dòng)設(shè)備交談鳖昌,開啟了用戶體驗(yàn)的新世界大門备畦,VUI可以增強(qiáng)日常功能的體驗(yàn)。
第3章:人物模型许昨、虛擬形象懂盐、演員和視頻游戲
? 闡述了VUI系統(tǒng)中必不可少的人物模型設(shè)計(jì)(虛擬形象)
? 判斷是否需要可視化組件,以及如果需要糕档,最好的設(shè)計(jì)方法是什么莉恼。所有VUI系統(tǒng),無論是否有諸如虛擬形象之類的可視化組件速那,都要有一個(gè)人物模型俐银。在語音用戶界面領(lǐng)域,“人物模型”這個(gè)詞基本等同于“角色”端仰,就像書或電影中的角色一樣捶惜,其更適合的術(shù)語定義是:用戶通過應(yīng)用程序的語音以及語言選擇,推斷出的人格或角色的標(biāo)準(zhǔn)化心理形象荔烧。從VUI行業(yè)目標(biāo)角度來說售躁,人物模型是一個(gè)媒介坞淮,通過它,企業(yè)可使用語音來塑造品牌服務(wù)形象陪捷。
? 建議在設(shè)計(jì)角色人格時(shí)回窘,認(rèn)真思考符合你角色人格設(shè)定的原則(產(chǎn)品目標(biāo)、公司目標(biāo)市袖、道德目標(biāo)啡直、社會(huì)目標(biāo)等)
? 話輪轉(zhuǎn)換與打斷:
? 在傳統(tǒng)交互式語音應(yīng)答(IVR)系統(tǒng)中,來電者通巢缘可以在提示回放時(shí)進(jìn)行“打斷”酒觅。這在IVR系統(tǒng)中非常管用。因?yàn)橛脩舨荒茌p易跳過選項(xiàng)微峰,也不想在繼續(xù)他們的任務(wù)前聽完所有的可選項(xiàng)舷丹。
? 在IVR系統(tǒng)中,當(dāng)用戶打斷系統(tǒng)時(shí)蜓肆,提示音會(huì)停止颜凯,并且會(huì)在用戶再次說話時(shí)(huo? 在無語音超時(shí)之后)播放新的提示。
? 你應(yīng)該多花一些時(shí)間決定你的VUI是否需要有一個(gè)可視化組件仗扬,不要因?yàn)樘摂M角色看起來很酷就加一個(gè)症概。你的系統(tǒng)是對話式、娛樂性早芭、移情作用情況下虛擬角色是比較好的選擇彼城。
? 投入創(chuàng)建一個(gè)虛擬角色不是小事,要建立自己的虛擬角色退个,你需要一個(gè)專門的設(shè)計(jì)團(tuán)隊(duì)募壕,或者你考慮用第三方設(shè)計(jì)的角色,讓你的虛擬角色可以表達(dá)情感语盈,但不要看起來毛骨悚然或者僅僅是一遍又一遍重復(fù)同樣的手勢舱馅,這些都是非常具有挑戰(zhàn)性的,仔細(xì)想想是什么讓你想使用一個(gè)虛擬角色黎烈,并用原型進(jìn)行用戶測試以確保不走彎路习柠。
第4章:語音識(shí)別技術(shù)
? 本章對VUI設(shè)計(jì)師來說非常重要匀谣。它是語音識(shí)別技術(shù)的入門介紹照棋,了解一些語音識(shí)別技術(shù)的知識(shí),將對你的設(shè)計(jì)產(chǎn)生重大影響武翎。
? 為了創(chuàng)建一個(gè)VUI系統(tǒng)烈炭,你的APP必須要有一個(gè)關(guān)鍵組件:自動(dòng)語音識(shí)別引擎(ASR)。ASR就是能將用戶語音轉(zhuǎn)換成為文本的技術(shù)宝恶。
? 選擇語音識(shí)別引擎時(shí)符隙,以下兩點(diǎn)很關(guān)鍵:1.穩(wěn)定的數(shù)據(jù)集/識(shí)別準(zhǔn)確性 2.語音端點(diǎn)檢測表現(xiàn)(如何判斷用戶何時(shí)開始或結(jié)束說話)
? 新公司往往很難突入語音識(shí)別市場——就算具有很好的技術(shù)趴捅,但仍缺少大公司經(jīng)年累月沉淀的大量數(shù)據(jù)。也取決于他們涉及的領(lǐng)域范圍有多廣霹疫。
? 語音打斷拱绑,常用于交互式語音應(yīng)答(IVR)系統(tǒng),從而用戶可以隨時(shí)中斷系統(tǒng)丽蝎。當(dāng)系統(tǒng)檢測到任意語音時(shí)猎拨,都會(huì)立即停止播放當(dāng)前提示音并開始收聽用戶講話。在IVR領(lǐng)域屠阻,語音打斷功能的好處顯而易見红省,IVR系統(tǒng)的菜單或選項(xiàng)列表一般都很長,而且流程繁瑣国觉,總是強(qiáng)迫用戶等待吧恃。
? 當(dāng)用戶打斷系統(tǒng)時(shí),你在設(shè)置提示和問題的停頓時(shí)需要格外小心(1.5s適用大多數(shù))麻诀。
? 喚醒詞痕寓,也成熱詞(hot word)或魔法詞(magic word),使用熱詞技術(shù)后针饥,系統(tǒng)只會(huì)在播報(bào)信息時(shí)識(shí)別少數(shù)幾個(gè)關(guān)鍵詞厂抽,例如“上一條”。當(dāng)用戶說話時(shí)丁眼,系統(tǒng)不會(huì)像一般的打斷模式一樣立刻停止播放筷凤。除非系統(tǒng)識(shí)別到了關(guān)鍵詞。
? 分析數(shù)據(jù)是了解如何調(diào)整終止時(shí)間的最佳方法苞七。通過查看真實(shí)用戶所說的錄音文本藐守,你可以找到用戶說話時(shí)經(jīng)常暫停的地方蹂风,而你需要在這些地方增加語音終止超時(shí)時(shí)長卢厂。
? N-BEST列表,最優(yōu)解惠啄,當(dāng)語音識(shí)別引擎識(shí)別到用戶說的話后慎恒,通常不止返回一個(gè)識(shí)別結(jié)果,而是會(huì)根據(jù)用戶說的返回一個(gè)列表撵渡,即一系列用戶可能說的內(nèi)容融柬,并根據(jù)可能性或按照置信度排序。
? 語音識(shí)別的挑戰(zhàn):
? 1.噪音
? ASR工具最棘手的難題之一就是噪聲處理趋距,其中包含恒定噪音以及在用戶說話時(shí)周圍突然產(chǎn)生的噪音粒氧,還包括周遭的說話聲,通常建議 用戶移動(dòng)到一個(gè)噪音比較少的環(huán)境或者利麥克風(fēng)更近一點(diǎn)节腐,但是如果猜測錯(cuò)誤外盯,這些建議反而會(huì)惹惱用戶摘盆。你可以改用不斷升級的錯(cuò)誤提示來幫助用戶,并提供其他非語音的方式來幫助用戶繼續(xù)操作饱苟。
? 2.多人講話的情況? ? ? ? 多設(shè)備下孩擂,無論哪個(gè)響應(yīng)都可以(八章)
? 3.兒童
? 4.名字、拼寫和字母數(shù)字
? 本章小結(jié):
? 作為一個(gè)VUI設(shè)計(jì)師箱熬,了解你設(shè)計(jì)對象的技術(shù)基礎(chǔ)有著重要的意義肋殴。了解ASR工具的優(yōu)缺點(diǎn)可以使你的APP在表現(xiàn)上領(lǐng)先于他人。具備較高的識(shí)別準(zhǔn)確率僅僅是VUI的一部分坦弟,如何圍繞著識(shí)別出來的內(nèi)容進(jìn)行設(shè)計(jì)护锤,在一個(gè)良好的用戶體驗(yàn)中起到了至關(guān)重要的作用。
? 了解語音打斷酿傍、語音超時(shí)烙懦、語音終點(diǎn)檢測以及不同環(huán)境下的技術(shù)挑戰(zhàn)將會(huì)有助于你設(shè)計(jì)出最佳的VUI體驗(yàn)。
第5章:語音用戶界面設(shè)計(jì)進(jìn)階
? 本章內(nèi)容遠(yuǎn)超第2章中已涵蓋的內(nèi)容赤炒,包含了更復(fù)雜的自然語言理解氯析、情感分析、數(shù)據(jù)收集和文本轉(zhuǎn)語音策略莺褒。
? 目前VUI技術(shù)的缺點(diǎn)之一是掩缓,有很多對用戶的承諾無法實(shí)現(xiàn),實(shí)際上遵岩,它可以處理的事情非常有限
? 為了讓你的VUI作用超越基本信息交換你辣,可以利用本章所述的概念,例如不僅僅只是讓VUI識(shí)別基礎(chǔ)關(guān)鍵詞尘执,而是讓用戶輸入更復(fù)雜的內(nèi)容舍哄。
? 仔細(xì)考慮從設(shè)計(jì)方案的選擇,比如使用TTS還是錄制的聲音誊锭。通過使用自然聲音連接策略來提高理解能力表悬。花點(diǎn)時(shí)間想想你的VUI是使用喚醒詞還是使用按鍵通話丧靡。
? 通過已有信息建自助數(shù)據(jù)集成或者采集你自己的數(shù)據(jù)蟆沫,可以使你的VUI在一開始就更好用。利用所有這些技巧會(huì)使你的VUI更易用温治、準(zhǔn)確與成功饭庞。
第6章:語音用戶界面的用戶測試
? 本章詳細(xì)介紹VUI的用戶測試,與移動(dòng)應(yīng)用和網(wǎng)站的用戶測試有哪些不同罐盔。本章將介紹低保真的測試方法但绕、遠(yuǎn)程測試和實(shí)驗(yàn)室測試救崔。本章還將介紹如何測試汽車以及其他設(shè)備的VUI系統(tǒng)惶看。
? 本章講述了語音用戶界面測試的使用方案(成本由低到高)捏顺,包括如何訪談測試對象以及如何衡量測試結(jié)果,幫助VUI設(shè)計(jì)師在開發(fā)的早期階段快速執(zhí)行用戶測試纬黎。
? 如果存在類似的IVR系統(tǒng)幅骄,通常意味著有呼叫中心的人工客服做后盾。用一下午的時(shí)間坐在呼叫中心接聽電話本今,可以獲得豐富的信息拆座。接聽用戶的來電可以了解到真實(shí)的情況,這是僅研究IVR系統(tǒng)本身無法做到的冠息。
第7章:完成VUI后挪凑,下一步該做什么
? 本章概述了當(dāng)你的VUI在投入實(shí)際使用后所需要用到的方法論,包括如何以及通過哪些信息來分析并提升你的VUI系統(tǒng)逛艰。但不要等產(chǎn)品發(fā)布后再閱讀本章躏碳,因?yàn)樵谙到y(tǒng)開發(fā)時(shí),你就需要知道哪些日志需要記錄散怖,這一點(diǎn)很重要菇绵。
? 預(yù)發(fā)布測試
? 1、對話遍歷測試(Dialog Traversal Testing,DTT)镇眷。你需要在真實(shí)環(huán)境下進(jìn)行測試咬最,通過電話運(yùn)行測試腳本遍歷所有對話。該過程中每一步都必須正確執(zhí)行欠动,同時(shí)必須給出正確的提示永乌。
? 2、識(shí)別測試具伍。
? 3铆遭、負(fù)載測試。驗(yàn)證系統(tǒng)在多用戶同時(shí)訪問時(shí)能否正常運(yùn)行沿猜。
? 日志信息:包含以下內(nèi)容
識(shí)別結(jié)果(當(dāng)用戶說話時(shí)枚荣,識(shí)別引擎聽到的內(nèi)容,及其可信度)
如果可以啼肩,記錄N-Best列表(可能的假設(shè)列表)
每個(gè)狀態(tài)下用戶語音的音頻橄妆,包括該時(shí)間點(diǎn)前后的語句(用于轉(zhuǎn)錄,因?yàn)樽R(shí)別結(jié)果不會(huì)100%準(zhǔn)確)
識(shí)別器匹配的內(nèi)容
錯(cuò)誤情況祈坠,包含無語音超時(shí)(包括計(jì)時(shí)信息)害碾、無匹配內(nèi)容和錯(cuò)誤識(shí)別等
狀態(tài)名稱(或其他跟蹤用戶在app中的位置的方法)
延遲
如果出現(xiàn)打斷,記錄打斷信息
? 即使會(huì)話失敗赦拘,也要記錄用戶的語句慌随,包括用戶在給定狀態(tài)下表述了不止一件事情,這個(gè)信息也很重要。
? 轉(zhuǎn)錄阁猜,有了語音識(shí)別結(jié)果丸逸、匹配內(nèi)容和音頻轉(zhuǎn)錄等信息,你才能評估VUI系統(tǒng)的性能剃袍。
? 調(diào)研(SurveyMonkey)
? 在早期設(shè)計(jì)階段黄刚,首先必須明確成功的衡量標(biāo)準(zhǔn)和任務(wù)完成的定義,以便各利益相關(guān)者達(dá)成一致民效,開發(fā)人員也能有充足的時(shí)間為日志任務(wù)構(gòu)建基礎(chǔ)框架憔维。對一個(gè)成功的VUI而言,實(shí)時(shí)跟蹤系統(tǒng)故障并能快速改進(jìn)是必不可少的畏邢。
第8章:帶語音功能的設(shè)備和汽車
? 最后一章側(cè)重于之前章節(jié)中沒有出現(xiàn)的VUI系統(tǒng)业扒,設(shè)備一節(jié)將包括家庭助理設(shè)備和可穿戴設(shè)備。汽車和無人駕駛車輛中回顧了汽車VUI設(shè)計(jì)中的挑戰(zhàn)與最佳實(shí)踐舒萎。本章的大部分內(nèi)容由這些領(lǐng)域的專家們貢獻(xiàn)凶赁。