語音交互入門：從概念巧婶，原理到如何設(shè)計(jì)VUI產(chǎn)品

語音技術(shù)的發(fā)展乾颁，將會給我們的產(chǎn)品設(shè)計(jì)帶來極大的改變。未來的產(chǎn)品方向粹舵，或者說是人機(jī)交互的方式钮孵，極可能是視覺與聽覺的更加立體的交互，我們會有機(jī)會來設(shè)計(jì)一種完全不一樣的用戶體驗(yàn)眼滤，和完全不同的產(chǎn)品認(rèn)知巴席。

語音交互

一、什么是VUI诅需？

作為新一代的交互模式漾唉，通俗的說荧库，VUI（語音用戶界面）就是用人類最自然的語言（開口說話）給機(jī)器下達(dá)指令，達(dá)成自己的目的的過程赵刑，這一過程包括三個(gè)環(huán)節(jié)：

能聽分衫、會說、懂你般此。

VUI是一種以人類內(nèi)心意圖為中心的人機(jī)交互方式蚪战，以交談式為核心的智能人機(jī)交互體驗(yàn)。

最典型的應(yīng)用就是語音助手铐懊，當(dāng)下最熱門的產(chǎn)品就是智能音箱了邀桑。

二、語音交互有什么優(yōu)勢科乎？

輸入更高效壁畸。研究結(jié)果表明，語音輸入比鍵盤輸入快3倍茅茂。如果你從解鎖手機(jī)到設(shè)置鬧鐘需要兩分鐘捏萍，直接說一句話設(shè)置鬧鐘，可能只需要10秒鐘空闲；

表達(dá)更自然令杈。人類是先有語音再有文字，每個(gè)人都會說話但有一部分人不會寫字进副，語音交互比界面交互更自然这揣，學(xué)習(xí)成本更低悔常；

感官占用更少影斑。一張嘴，將人的雙手机打、眼睛從圖形界面交互中解放出來矫户，想象一下當(dāng)你手握方向盤時(shí)，說一句話就直接接聽電話残邀、播放音樂皆辽，是不是更方便也更安全。騰出來的感官芥挣，意味著可以并行處理其他任務(wù)驱闷，理論上有更高的效率。

信息容量更大空免。語音中包含了語氣空另、音量、語調(diào)和語速這些特征蹋砚，交流的雙方可以傳達(dá)大量的信息扼菠，特別是情緒的表達(dá)摄杂，其表達(dá)的方式也更帶有個(gè)人特色和場景特色。當(dāng)見不著面循榆，聽不到聲音的時(shí)候析恢，人與人之間的真實(shí)感就會下降很多。

VUI不再依賴固定的路徑完成操作指令秧饮，而且是每個(gè)人都可以有自己的方式和特色映挂。

這是VUI與GUI革命性的改變。

對今天的App盗尸、瀏覽器而言袖肥，其直接下達(dá)指令的特性，使得語音交互可能成為一個(gè)全新的振劳、去中心化的超級入口椎组，也正是因?yàn)榇耍瑥氐滓苏麄€(gè)市場历恐。

從“百團(tuán)大戰(zhàn)”之后寸癌，我們又見到了“百箱大戰(zhàn)”。

三弱贼、語音交互存在什么障礙蒸苇？

語音百般好，應(yīng)用一時(shí)難吮旅。

語音交互走到今天溪烤，已經(jīng)付出了非常大的努力，但依然是有多少人工庇勃，就有多少智能檬嘀。

“智能”與“智障”之間，隔著一線天责嚷。

當(dāng)然鸳兽，對從業(yè)者來說，當(dāng)下的語音交互認(rèn)為應(yīng)該處于一種“沒有想象的那么好罕拂，也沒有想象的那么差”的境地揍异。

1.注意力障礙

語音交互是非可視化的，帶來的問題就是增加人的記憶負(fù)擔(dān)爆班。你打過銀行的客戶電話就知道衷掷，你必須集中精力聽完語音播報(bào)之后才能做下一步動作，如果你比較著急的話柿菩，那你就會非常的難受戚嗅。事實(shí)上，人在獲取信息的適合，視覺要強(qiáng)過聽覺渡处。

別人講話時(shí)你可能要等他說完你才理解镜悉，而你看文字的時(shí)候，甚至可以直接跳過部分文字你也能理解医瘫，特別是中文侣肄。所以，音箱添加屏幕是趨勢醇份。對于語音的效率問題稼锅，可以說是單方面的輸入更高效，而雙向互動反而效率不高僚纷。

或者說矩距，獲取信息的時(shí)候，視覺有很大的優(yōu)勢怖竭，而聲音的效率并不高（現(xiàn)實(shí)中為什么總會出現(xiàn)“打斷”對話的現(xiàn)象锥债，就是因?yàn)檎Z音的表達(dá)效率不高，聽者等不及）痊臭。

2.心理障礙

想象一下你晚上一個(gè)人在家哮肚，你會不會突然開口叫一句"小明小明，明天什么天氣广匙？"莫名其妙的語音允趟，會讓人感到一絲不自在，特別是一旦小明存在一定缺陷的時(shí)候鸦致，所引發(fā)的錯(cuò)誤潮剪。從心理感受出發(fā)，沒有多少人愿意對著冰冷的機(jī)器說話分唾，然后得到毫無感情的甚至是錯(cuò)誤的回應(yīng)抗碰。語音交互存在的另一個(gè)心理障礙是，語音交互的不可預(yù)設(shè)和預(yù)判性鳍寂。

不同的人改含，在同樣的情境下都可能產(chǎn)生完全不同的行為和預(yù)期情龄。這給設(shè)計(jì)者來說帶來很大困擾迄汛，也為用戶帶來不確定性的擔(dān)憂。

在面對不可預(yù)知的狀況下骤视，設(shè)計(jì)者和使用者互相難以領(lǐng)會彼此的意圖鞍爱，就會形成一種博弈消耗。

為了應(yīng)對這種不確定性，可能導(dǎo)致系統(tǒng)必須通過更多的場景理解和上下文關(guān)系，去解析用戶的意圖來做出可能合理的信息反饋，這將進(jìn)一步帶來技術(shù)的復(fù)雜度猎荠。

3.技術(shù)障礙

語音交互為什么如此受到期待关摇，是因?yàn)樘挥邢胂罂臻g了荒叶，能夠讓我們盡可能的釋放被占用的感官。想象一下输虱，你只說一句“訂一箱牛奶”宪睹，快遞就會在約定好的時(shí)間送過來，多美好的生活∶現(xiàn)實(shí)生活中道宅，人與人的交流泞当，甚至一個(gè)眼神一個(gè)動作就可以引起對方的注意和反饋。

而現(xiàn)階段的智能音箱需要定義一個(gè)將助手從待機(jī)狀態(tài)切換到工作狀態(tài)的詞語，即所謂的“喚醒詞”，這是一個(gè)不得已而為之的蹩腳設(shè)計(jì)后室，你想做什么之前都要先來一句“小明小明”，這種疊詞的對話方式特別讓人反感仅仆。

實(shí)際上，語音交互的技術(shù)依然存在巨大挑戰(zhàn)拄踪，還很難在復(fù)雜的環(huán)境和不確定的情景下，真實(shí)的理解用戶的行為和意圖惶桐，想要給出用戶在不同場景下的期望值，軟硬件技術(shù)都還有漫長的路要走。

今天的語音交互姚糊，在某些場景下贿衍，本身就是一種劣勢。比如你站在電視機(jī)旁邊救恨，開關(guān)機(jī)這個(gè)動作最適合的交互應(yīng)該是手——直接一按就可以解決贸辈，為什么還要開口說話？

這一點(diǎn)說明：不是什么設(shè)備都可以加一個(gè)屏幕肠槽，也不是什么什么都可以加一個(gè)麥克風(fēng)擎淤。

語音交互是否能夠廣泛應(yīng)用，有賴于對場景的深度理解秸仙，以及人能智能技術(shù)的進(jìn)步嘴拢。
語音交互好不好，不僅僅依賴硬件設(shè)備的識別準(zhǔn)確率寂纪，更需要垂直場景下的語義理解席吴，以及后端內(nèi)容服務(wù)的連接。

四捞蛋、語音交互能否取代圖形界面孝冒？

結(jié)論是：語音和圖形交互不存在取代，就像人的眼睛和耳朵一樣拟杉。

不得不感嘆造物主的神奇庄涡，千百萬年來的進(jìn)化，給了我們這樣一個(gè)絢麗多姿的世界搬设。

人類耳聽啼染、眼觀、嘴說焕梅、手動的自然構(gòu)造迹鹅，說明適應(yīng)環(huán)境最好的方式就是分工合作，協(xié)同感知和應(yīng)對環(huán)境贞言，并作出最合適的行為反饋斜棚。

所以，最符合于人類的人機(jī)交互體驗(yàn)该窗，就是在不同的場景由不同的器官（方式）來完成弟蚀，以一種自然的與外界進(jìn)行信息交互。

隨著技術(shù)的進(jìn)步酗失，交互的方式定將發(fā)生顛覆式革新义钉，未來的人機(jī)交互將更趨向于立體和本能。GUI+VUI规肴，是一對有機(jī)的結(jié)合體捶闸，因?yàn)樗先祟惖谋灸芤钩耄Z音交互不是取代觸摸交互的升級，二者之間只會彼此共同促進(jìn)删壮，通過恰當(dāng)?shù)膮f(xié)作機(jī)制提供更好的用戶體驗(yàn)贪绘。

但，我們需要清晰的理解二者之間存在著本質(zhì)性差異：

GUI是一種預(yù)設(shè)路徑的交互方式央碟，通過識別用戶的下滑税灌、點(diǎn)擊、雙擊等交互行為以及用戶所處的頁面位置亿虽，判斷用戶的指令并作出準(zhǔn)確的反饋菱涤。這是一種單一路徑的操作方式，但足夠清晰洛勉。

VUI聚焦于如何發(fā)揮語言和表意的強(qiáng)大力量粘秆，采用人們?nèi)粘５恼Z言來交流，真實(shí)坯认，自然的表達(dá)和獲取反饋翻擒，獲取用戶的信任、傳遞信息牛哺。

語音交互的流程更加直接陋气，用戶甚至可以發(fā)出不同的語音指令來期望獲得同一個(gè)反饋。

五引润、語音交互的未來會變成怎樣巩趁？

1.無處不在

想象一下你在家里，最好的方式一定是不管你在那個(gè)房子淳附，你都可以說一句“小明议慰，明天送一箱牛奶”，而不是非要找到某一個(gè)音箱設(shè)備才能下達(dá)指令奴曙。

也就是未來的語音助手别凹，一定是移動的，或者說是無處不在洽糟。

同時(shí)炉菲，借助一系列的傳感設(shè)備，從聲音紋路坤溃、體征指標(biāo)拍霜、環(huán)境指標(biāo)，綜合評估和理解當(dāng)下的真實(shí)環(huán)境薪介，并給初恰當(dāng)?shù)姆答仭?/p>

2.主動服務(wù)

現(xiàn)在所有的語音助手祠饺，都還是被動地交談，你必須給出命令汁政，它們才會應(yīng)答道偷。

但想像一下未來缀旁，當(dāng)深度學(xué)習(xí)和大數(shù)據(jù)已經(jīng)做好了充足的準(zhǔn)備，語音助手能預(yù)知你接下來要去哪试疙，要見什么人诵棵，甚至在想什么抠蚣，只需要用語音的方式輸出這些信息祝旷。你不再需要點(diǎn)亮手機(jī)去查看這些智能的提醒，隨時(shí)隨地嘶窄，會有一個(gè)聲音和你主動交談怀跛。

也許，未來技術(shù)的發(fā)展柄冲，各種穿戴設(shè)備吻谋，甚至植入體內(nèi)的芯片會帶給我們完全不同的與外界交互的途徑。

但以當(dāng)下我們對自身的理解现横，人的獲取外界信息和表達(dá)內(nèi)在情緒的感官體驗(yàn)漓拾，依然無法被取代。

六戒祠、什么場景適合使用語音交互骇两？

語音交互同互聯(lián)網(wǎng)誕生以來用戶就習(xí)慣的GUI界面交互相比，主要是輸入方式不同導(dǎo)致的姜盈，最顯著特性就是“解放了雙手”——你在使用語音請求時(shí)低千，眼睛和手可以同時(shí)忙于其他的事情，從這點(diǎn)出發(fā)馏颂，語音交互在家居和出行領(lǐng)域有天然的優(yōu)勢示血。

1.智能家居：在家庭“相對封閉與安全”（特指針對語音信號采集的干擾程度），通過語音交互指令控制家居開關(guān)是很好的切入點(diǎn)救拉。相信在不久的將來难审，搭載了語音交互系統(tǒng)的智能家居，都可以聽你的話亿絮，你說所說的每個(gè)指令告喊，都會直接影響/控制到當(dāng)前家居的運(yùn)行狀態(tài)∫嘉蓿“你可能越來越愜意葱绒，也可能越來越懶......”

2.出行車載語音交互系統(tǒng)：釋放了駕駛員的手和眼，讓司機(jī)專注于前方的路況斗锭，如接聽電話地淀、開關(guān)車窗、播放廣播音樂岖是、路線導(dǎo)航等語音交互指令帮毁。

3.企業(yè)應(yīng)用：未來會有各種各樣專業(yè)的知識工作者會在或大或小的程度被簡化或者被替代实苞，比如文本、數(shù)據(jù)的錄入工作烈疚，比如客服機(jī)器人黔牵。但，極不太可能的是直接對著一個(gè)設(shè)備吼兩嗓子做一個(gè)PPT的方式爷肝。

4.醫(yī)療&教育：如語音記錄病歷猾浦，不管對醫(yī)生來說還是患者來說，都是提高看病效率的很好的輔助手段之一灯抛。

以目前的技術(shù)條件而言金赦，單向的指令性動作是最適合語音來表達(dá)的，因?yàn)樗銐蚯逦椭苯印?/p>

七对嚼、語音交互涉及那些技術(shù)?

VUI（語音用戶界面）所涉及的技術(shù)模塊有 4 個(gè)部分夹抗，分別為：

自動語音識別：Automatic Speech Recognition, ASR

自然語言理解：Natural Language Understanding, NLU

自然語言生成：Natural Language Generation, NLG

文字轉(zhuǎn)語音：Text to Speech, TTS

上圖即為語音交互技術(shù)包括的識別、理解和對話三個(gè)部分纵竖。

整個(gè)過程通俗的說极舔，就是通過麥克風(fēng)讓機(jī)器能聽到用戶說的話辽聊，然后聽懂用戶想要表達(dá)的意思锚烦，并把反饋的結(jié)果“說給用戶聽”掸犬。

舉個(gè)例子就是：

小明：明天什么天氣？
助手：晴乏奥，37攝氏度摆舟。

整個(gè)過程分解之后，就變成這樣一個(gè)過程：

小明對著機(jī)器說一句話后邓了，機(jī)器內(nèi)置的麥克風(fēng)識別到小明說的話恨诱，把口語化的文本歸一、糾錯(cuò)骗炉，并書面化（ASR）照宝；

然后機(jī)器根據(jù)文本理解小明的意圖（通常是在云端進(jìn)行語義的理解）并進(jìn)入對話管理，當(dāng)意圖不明確時(shí)句葵，還需要機(jī)器發(fā)起確認(rèn)對話厕鹃，繼續(xù)補(bǔ)充相關(guān)內(nèi)容，這就是多輪對話乍丈；

在明確小明意圖后剂碴，去獲取相關(guān)的數(shù)據(jù)，或者執(zhí)行相關(guān)的命令轻专；

最后把內(nèi)容通過揚(yáng)聲器播放給小明聽（TTS忆矛，語義理解后獲得的結(jié)果文本信息合成為聲音）。

至此完成一個(gè)完成對話過程请垛。（實(shí)際上催训，也是一個(gè)蠻晦澀的過程）

在上述的四個(gè)環(huán)節(jié)洽议，都很關(guān)鍵，都存在很大的技術(shù)挑戰(zhàn)漫拭。

值得特別提出來的是ASR和NLU兩個(gè)環(huán)節(jié)亚兄。

ASR是通過聲學(xué)模型和語言模型，將人的語音識別為文本的技術(shù)采驻。

它依賴麥克風(fēng)本身的性能和設(shè)計(jì)审胚，如何確保在復(fù)雜的現(xiàn)實(shí)環(huán)節(jié)下，把干擾信息過濾挑宠，獲取到準(zhǔn)確的信息菲盾，我們場景的智能音箱颓影，通常都是多個(gè)麥克風(fēng)組成一個(gè)環(huán)形的設(shè)計(jì)各淀，目的就在提供獲取語音的準(zhǔn)確率。

語音識別只是知道我們說了什么诡挂，但真正要理解我們說的是什么碎浇，就需要依靠 NLU 這項(xiàng)技術(shù)。主要解決分詞璃俗、詞性標(biāo)注奴璃、實(shí)體識別、文本分類和情感分析這幾個(gè)問題城豁。

比如：

從北京飛上海要多久苟穆？
到廣州呢？

上例中唱星，實(shí)際上就是試圖通過一個(gè)框架模型解析一句話的意圖雳旅。

目前為止最成功的"框架語義（Frame Semantics）"，即采用領(lǐng)域（Domain）间聊、意圖（Intent）和詞槽（Slot）來表示語義結(jié)果攒盈。

領(lǐng)域（Domain）：領(lǐng)域是指同一類型的數(shù)據(jù)或資源，以及圍繞這些數(shù)據(jù)或資源提供的服務(wù)哎榴。比如“天氣”型豁、“音樂”、“酒店”等尚蝌。

意圖（Intent）：意圖是指對于領(lǐng)域數(shù)據(jù)的操作迎变，一般以動賓短語來命名，比如音樂領(lǐng)域有“查詢歌曲”飘言、“播放音樂”衣形、“暫停音樂”等意圖。

詞槽（Slot）：詞槽用來存放領(lǐng)域的屬性热凹，比如音樂領(lǐng)域有“歌曲名”泵喘、“歌手”等詞槽泪电。

舉個(gè)例子，從“北京明天天氣怎么樣”這句話中纪铺，NLU 可以得到以下語義結(jié)果：

領(lǐng)域（Domain）：天氣

意圖（Intent）：查詢天氣

詞槽（Slot）：

城市（city） = 北京

時(shí)間（date） = 明天

我們再通過問天氣的例子相速，來理解要完成一個(gè)對話的過程：

小明：明天天氣怎么樣？
助手：您要查詢哪個(gè)城市的天氣鲜锚？

在這個(gè)例子中突诬，語音助手試圖獲取更完整的領(lǐng)域、意圖和詞槽數(shù)據(jù)芜繁，也就是語音助手在對話開始后旺隙，會結(jié)合本輪對話提供的語義信息和上下文數(shù)據(jù)，確定當(dāng)前對話狀態(tài)骏令，同時(shí)會補(bǔ)全或替換詞槽蔬捷，并且根據(jù)對話狀態(tài)和具體任務(wù)決定要執(zhí)行什么動作，比如進(jìn)一步詢問用戶以獲得更多的信息榔袋、調(diào)用內(nèi)容服務(wù)等周拐。

這里的三個(gè)核心就是對話的上下文、對話的狀態(tài)跟蹤以及采取的對話策略凰兑，組成DM（對話管理）妥粟，并最終把獲取的文本結(jié)果，合成為人耳聽到的聲音（TTS）吏够。

Q：明天天氣怎么樣勾给？（intent=query_weather，date= 明天锅知，city=null?）
A：您要查詢哪個(gè)城市的天氣播急？（action= 詢問查詢哪個(gè)城市）

在回顧語音交互的全流程，可以看到它的核心就是用戶的意圖喉镰，如何識別意圖以及如何處理意圖旅择。

換句話說，語音是完全以用戶為出發(fā)點(diǎn)的技術(shù)侣姆，而圖形交互更多的是讓用戶在引導(dǎo)下完成指定的任務(wù)生真。

也從這個(gè)特性可以看到，語音交互遠(yuǎn)比圖形交互技術(shù)復(fù)雜捺宗，不同的語種會帶來不同的詞法柱蟀、句法，然后在不同的語境下有著完全不同的語義（意圖）蚜厉。

隨著技術(shù)的發(fā)展长已，機(jī)器結(jié)合更多的傳感器技術(shù)和生物識別技術(shù)，它能感知人們的語音、肢體和手勢甚至表情眼神术瓮，并通過調(diào)整自身的反饋來適應(yīng)人們那一刻提出的需求（包括脾氣性格康聂、聲音特點(diǎn)、外外貌印象）胞四，真正實(shí)現(xiàn)人機(jī)的自然（本能）交互恬汁。

八、語音交互設(shè)計(jì)需要遵循什么原則辜伟？

語言學(xué)家Paul Grice 在1975年提出關(guān)于人們交際的4點(diǎn)合作原則氓侧，即：

1.量的準(zhǔn)則：既要讓人聽懂，又不要說太多廢話导狡。盡量少添加不必要的措辭约巷，比如用戶問什么天氣，直接回答“廣州旱捧，晴”即可独郎。

2.質(zhì)的準(zhǔn)則：說真話，沒有證據(jù)的話不要說廊佩。如果你的語音助手只可以問天氣囚聚，就不要被喚醒后說“有什么需要幫忙的”，當(dāng)用戶被引導(dǎo)而不能達(dá)成标锄，只會給用戶一種挫敗感。

3.關(guān)系準(zhǔn)則：不要前言不搭后語茁计，說話要有聯(lián)系料皇。

4.方式準(zhǔn)則：清晰明了，井井有條不要拐彎抹角也就是星压，我們所設(shè)計(jì)的語音助手践剂，不要說自己做不到的事情，比如“有什么可以幫助到你娜膘？”逊脯，這顯然就是超乎能力范圍了。

也不要在沒有弄明白意圖的時(shí)候竣贪，隨意強(qiáng)行反饋結(jié)果军洼。

然而，人們在實(shí)際言語交際中演怎，卻常常故意違反合作原則匕争，特別是中國人所說的“話里有話”，如何透過說話人話語的表面含義而理解其言外之意的爷耀，對語音交互設(shè)計(jì)而言甘桑，是極其巨大的挑戰(zhàn)。

但，幽默也就時(shí)常在這時(shí)產(chǎn)生跑杭。

九铆帽、如何設(shè)計(jì)語音交互產(chǎn)品？

如同GUI（圖形用戶界面）以點(diǎn)擊-觸發(fā)為各個(gè)節(jié)點(diǎn)的交互邏輯一致德谅，VUI（語音用戶界面）是從提問到回答的流轉(zhuǎn)過程邏輯锄贼，將一個(gè)場景以對話的形式貫穿起來。

回想在GUI時(shí)代女阀，我們?nèi)绾螢橛脩粼O(shè)計(jì)一個(gè)功能宅荤。

通常，我們都需要理清楚需求的邊界浸策，做什么不做什么冯键，然后把用戶的需求做一個(gè)流程的梳理，把各個(gè)環(huán)節(jié)的流轉(zhuǎn)以及可能出現(xiàn)的狀況狀態(tài)完整的表達(dá)出來庸汗，然后制作原型圖惫确，繪制界面，最終迭代開發(fā)上線蚯舱。

我們通過“用戶故事”來描述用戶想要得到什么改化，會做什么，并把它設(shè)計(jì)成一個(gè)產(chǎn)品功能（對于VUI而言枉昏，稱之為語音技能skill）陈肛。

不同的是，設(shè)計(jì)語音skill兄裂，是把戶可能和語音助手發(fā)生的對話 (dialog) 通過腳本（script）和流程（flow）去定義交互的細(xì)節(jié)和多樣化的表達(dá)方式句旱。（variantions）

1.確定目標(biāo)

首先需要搞清楚的是，用戶為什么要用這個(gè)skill晰奖，也就是需要設(shè)計(jì)一個(gè)或者多個(gè)情境谈撒，讓用戶有使用這個(gè)技能的意愿。

為什么用戶需要用它匾南？用戶會做什么啃匿？不做什么？

2.創(chuàng)建故事

user story蛆楞，和GUI下的設(shè)計(jì)是一致的溯乒，必須完整的定義基本的功能點(diǎn)，以及每個(gè)交互節(jié)點(diǎn)臊岸，明確用戶在使用這個(gè)技能的邊界是什么橙数，可以做什么，不能做什么帅戒。

這是設(shè)計(jì)一個(gè)skill的基本原則灯帮。

用戶可以得到什么信息崖技？用戶可以通過什么方式得到這個(gè)信息？為了得到這個(gè)信息钟哥，是否需要更多的服務(wù)作為支撐迎献，比如訂外賣的skill？

3.建立流程

flow腻贰，也就是用戶完成某項(xiàng)任務(wù)的過程路徑吁恍。

在確定邊界范圍之后，需要為用戶設(shè)計(jì)完成任務(wù)所能使用到的不同的路徑播演，也就是需要盡可能的把各種正常的冀瓦、異常的狀況，正向和反向的各種應(yīng)對措施完整的設(shè)計(jì)表達(dá)出來写烤。

在設(shè)計(jì)語音skill的流程時(shí)翼闽，有幾條基本的原則（實(shí)際在也通用于GUI的流程設(shè)計(jì)）：

（1）最短路徑

一次性給出所有的必須信息，在語音交互過程中一句話（一輪對話）即可實(shí)現(xiàn)洲炊，如：明天北京的天氣怎樣嗎感局？

（2）替換路徑

通常，用戶說的話不會包括所有的必要信息暂衡。

比如：明天下雨嗎询微？這里缺少了一個(gè)關(guān)鍵槽位（slot），地域狂巢。

也就是用戶在表達(dá)這句話的是會有兩種情況撑毛，默認(rèn)已知地理位置（當(dāng)前位置），或者需要聽者追問隧膘。

在我們的日常生活中代态，我們常常將把這句話理解為“明天（北京，自動默認(rèn)當(dāng)前位置信息）下雨嗎疹吃？”

所以，必須設(shè)計(jì)完整的替換路徑和決策樹補(bǔ)充用戶對話中的缺失信息西雀。

（3）決策機(jī)制

比如首次使用語音助手的時(shí)候“播放音樂”萨驶，和多次播放音樂之后的決策是會有很大的差異，后臺系統(tǒng)的決策邏輯需要根據(jù)用戶的使用情況艇肴，給出最優(yōu)機(jī)制腔呜，試圖為用戶創(chuàng)建更好的使用體驗(yàn)。

（4）幫助系統(tǒng)

語音交互的特殊性決定它在出現(xiàn)未知和異吃俚浚現(xiàn)象時(shí)核畴，極容易讓用戶感到困惑。

所以冲九，在設(shè)計(jì)一個(gè)語音skill的時(shí)候谤草，必須清晰的給予引導(dǎo)跟束，幫助用戶針獲得skill的使用方式或者全面的指引，以及當(dāng)數(shù)據(jù)缺失的反饋流程丑孩。

假設(shè)用戶小明問“去北京要多久冀宴？”，你大概會需要畫這樣一個(gè)流程圖温学。

4.撰寫腳本

腳本（scripts）略贮，用戶和語音助手之間的對話，這有點(diǎn)像一個(gè)電影或者戲劇的臺本仗岖，這是一種非常有效的定義對話流程的方式逃延。

撰寫腳本的時(shí)候，需要盡可能的遵循前面提到的對話原則轧拄，簡明扼要揽祥，同時(shí)又要能夠挖掘到關(guān)鍵信息。

有兩點(diǎn)需要特別注意：

不要假設(shè)用戶知道做什么或者會發(fā)生什么

只提供用戶所需要的信息

舉個(gè)例子：

小明：明天出差要帶傘嗎紧帕？
助手：你要去哪里盔然？
小明：北京
助手：別帶了，這幾天天氣特別好是嗜。

最后編輯于：2018.05.30 07:18:32

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末愈案，一起剝皮案震驚了整個(gè)濱河市，隨后出現(xiàn)的幾起案子鹅搪，更是在濱河造成了極大的恐慌站绪，老刑警劉巖，帶你破解...
沈念sama閱讀 206,214評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件丽柿，死亡現(xiàn)場離奇詭異恢准，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)甫题，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,307評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門馁筐，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人坠非，你說我怎么就攤上這事敏沉。” “怎么了炎码？”我有些...
開封第一講書人閱讀 152,543評論 0贊 341
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵盟迟，是天一觀的道長。經(jīng)常有香客問我潦闲，道長攒菠，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 55,221評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任歉闰，我火速辦了婚禮辖众，結(jié)果婚禮上卓起，老公的妹妹穿的比我還像新娘。我一直安慰自己赵辕，他們只是感情好既绩，可當(dāng)我...
茶點(diǎn)故事閱讀 64,224評論 5贊 371
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著还惠，像睡著了一般饲握。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上蚕键，一...
開封第一講書人閱讀 49,007評論 1贊 284
城市分裂傳說
那天救欧，我揣著相機(jī)與錄音，去河邊找鬼锣光。笑死笆怠，一個(gè)胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的誊爹。我是一名探鬼主播蹬刷，決...
沈念sama閱讀 38,313評論 3贊 399
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼频丘！你這毒婦竟也來了办成？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 36,956評論 0贊 259
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤搂漠，失蹤者是張志新（化名）和其女友劉穎迂卢，沒想到半個(gè)月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體桐汤，經(jīng)...
沈念sama閱讀 43,441評論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡而克，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,925評論 2贊 323
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了怔毛。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片员萍。...
茶點(diǎn)故事閱讀 38,018評論 1贊 333
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡，死狀恐怖拣度，靈堂內(nèi)的尸體忽然破棺而出充活，到底是詐尸還是另有隱情，我是刑警寧澤蜡娶，帶...
沈念sama閱讀 33,685評論 4贊 322
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站映穗，受9級特大地震影響窖张，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜蚁滋，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,234評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一宿接、第九天我趴在偏房一處隱蔽的房頂上張望赘淮。院中可真熱鬧，春花似錦睦霎、人聲如沸梢卸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,240評論 0贊 19
一樁弒父案副女，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽蛤高。三九已至，卻和暖如春碑幅，著一層夾襖步出監(jiān)牢的瞬間戴陡，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,464評論 1贊 261
情欲美人皮
我被黑心中介騙來泰國打工沟涨，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留恤批，地道東北人。一個(gè)月前我還...
沈念sama閱讀 45,467評論 2贊 352
代替公主和親
正文我出身青樓裹赴，卻偏偏與公主長得像喜庞，于是被迫代替她去往敵國和親。傳聞我的和親對象是個(gè)殘疾皇子棋返，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,762評論 2贊 345

語音交互入門：從概念，原理到如何設(shè)計(jì)VUI產(chǎn)品

語音交互入門：從概念巧婶，原理到如何設(shè)計(jì)VUI產(chǎn)品

一、什么是VUI诅需？

二、語音交互有什么優(yōu)勢科乎？

三弱贼、語音交互存在什么障礙蒸苇？

四捞蛋、語音交互能否取代圖形界面孝冒？

五引润、語音交互的未來會變成怎樣巩趁？

六戒祠、什么場景適合使用語音交互骇两？

七对嚼、語音交互涉及那些技術(shù)?

八、語音交互設(shè)計(jì)需要遵循什么原則辜伟？

九铆帽、如何設(shè)計(jì)語音交互產(chǎn)品？

推薦閱讀更多精彩內(nèi)容

語音交互入門：從概念巧婶，原理到如何設(shè)計(jì)VUI產(chǎn)品

一、什么是VUI诅需？

二、語音交互有什么優(yōu)勢科乎？

三弱贼、語音交互存在什么障礙蒸苇？

四捞蛋、語音交互能否取代圖形界面孝冒？

五引润、語音交互的未來會變成怎樣巩趁？

六戒祠、什么場景適合使用語音交互骇两？

七对嚼、語音交互涉及那些技術(shù)?

八 、語音交互設(shè)計(jì)需要遵循什么原則辜伟？

九铆帽、如何設(shè)計(jì)語音交互產(chǎn)品？

推薦閱讀更多精彩內(nèi)容

八、語音交互設(shè)計(jì)需要遵循什么原則辜伟？