智能語音產(chǎn)品要怎么做俏竞?

問:你覺得智能語音未來會對交互有著怎樣的影響,會不會取代 UI 交互嗎?

答:智能語音是未來的趨勢魂毁,我們現(xiàn)在已經(jīng)開始使用語音交互玻佩。

在一次機器人交流會上,我向一位來自優(yōu)必選的演講人提了上面的問題席楚,但我并沒有得到想要的答案夺蛇。智能語音的未來會是什么樣子,怎么用智能語音做出好的產(chǎn)品呢酣胀?我一直在不斷地嘗試各種產(chǎn)品刁赦,不斷地思考。

試驗

我找到所有涉及智能語音的相關產(chǎn)品闻镶,都挨個體驗了遍甚脉。智能手表,智能音箱铆农,智能機器人牺氨。還有手機上的各種助手,像蘋果的Siri墩剖,Google的 Allo猴凹,微軟的 Cortanna,助理來也岭皂。這些產(chǎn)品有硬件的郊霎,也有軟件的。終端有 PC爷绘,手機书劝,手表。系統(tǒng)平臺又有 mac土至,android购对,iOS等等。

第一次使用上面的產(chǎn)品并不自然陶因。就像第一次使用觸摸屏手機骡苞,沒有鍵盤,很不適應楷扬,特別是打字解幽。缺少按下去的實體感覺,會讓人覺得觸摸是個很生硬的操作毅否。還好亚铁,手機提供按下震動反饋功能。慢慢適用后螟加,不需要震動也可以的徘溢。而相對觸摸操作吞琐,智能語音是一種更前沿的交互方式。

觸摸操作縮短了按鍵操作交互路徑然爆。在手機沒有觸摸功能之前站粟,想要點擊某個按鍵時,得先把焦點移動到目標位置曾雕。有了觸摸功能奴烙,一個手指頭戳過去就行了。那智能語音相較于觸摸操作會不會也有同樣的意義呢剖张?觸摸操作是基于 UI 的切诀,將屏幕作為載體。智能語音則不需要界面搔弄,沒有邊界幅虑。

換句話說,智能語音突破 UI 交互的層級顾犹,直達目標功能倒庵。好比說,以前你去政府機關辦個證件炫刷,你得按流程路徑走擎宝,先去 A 部門蓋個章,再拿這個章去 B 部門蓋個章浑玛,等你集完所有章绍申,就可能兌換最后的卡片了。每個部門都得跑锄奢,跑錯了就辦理不下來失晴,不熟悉的人跑下來暈頭轉(zhuǎn)向的。現(xiàn)在呢拘央,下個 App,按要求上傳幾張電子證件书在,等個幾天灰伟,證件就辦好了。嗯儒旬,還包郵栏账。中間,你不用跑一個部門栈源,也不需要知道先跑哪個部門挡爵,再跑哪個部門,一個操作就搞定了甚垦。語音就類似這樣茶鹃,以前要幾個界面點擊涣雕,現(xiàn)在就是一句話的事兒。

體驗

上面是我對智能語音意義的理解闭翩。但目前真正在應用階段挣郭,并不理想。這里面有諸多原因疗韵,我認為主要是兩方面的限制:

語音識別可靠性兑障。16 年 11 月份的時候,科大訊飛開了個發(fā)布會蕉汪,宣稱語音識別的準確率達到 97%流译。而同一時間,百度者疤,搜狗也開了發(fā)布會先蒋,準確率也達到 97%。這個準確率對于商用的意義有多大呢宛渐?我做的有個機器人的項目竞漾,機器人可以跟用戶聊天對話。機器人語音識別的技術就是采用科大訊飛的窥翩。我們在公司測試的時候业岁,搞個簡單的一問一答對話都沒問題。你問機器人寇蚊,今天天氣怎么樣笔时?結(jié)果很快就能出來。當我們拿到房地產(chǎn)售樓處仗岸,效果不理想允耿,并且跟預期的差距是沒有預料到的。

在公司測試的時候扒怖,會有雜音较锡,整理環(huán)境不算安靜,時而有人說話盗痒。當時蚂蕴,覺得這種測試環(huán)境不算理想,雖然偶爾有錯誤但也能接受俯邓。售樓處環(huán)境不一樣骡楼,因為營銷需要,一直有電視播放營銷視頻稽鞭。就算沒有人說話時鸟整,機器人也會識別這些聲音。這時候要是有人跟機器人對話朦蕴,機器人根本無法準備識別說話的內(nèi)容篮条。人多的時候弟头,售樓大廳里時刻都有人說話,一喚醒機器人兑燥,機器人就在那里嗚哩哇啦了亮瓷,說一些莫名奇妙的話。因為它識別出的內(nèi)容都是亂七八糟的降瞳。

當然嘱支,你也可能說這是場景的原因。在家時或者車里就沒這么糟糕了挣饥,這是應用層面的問題除师。如果語音識別不能在技術上解決可靠性的根本問題,那它的應用領域和范圍也大大受限制了扔枫。這里面需要解決的問題也很多汛聚,多個人同時跟機器人說話時,要區(qū)分好不同人說的話短荐。張三說了哪些話倚舀,李四說了哪些話?如果有背景噪音忍宋,甚至是人說話的噪音痕貌,都要能夠去掉。

語義理解糠排。如果只是單純地解決語音識別可靠性問題舵稠,也就是聽得清的問題,并不能稱得上智能語音入宦,智能語音還要解決聽得懂的問題哺徊。只有聽得清,聽得懂乾闰,才能知道要做什么事情落追。

你對機器說,我要吃蘋果汹忠。蘋果是什么淋硝,它不知道。所以你得告訴它宽菜,讓它學習,有明白蘋果的能力竿报。蘋果可以是一種水果铅乡,可以是一部電影,還可以是一個品牌烈菌。那蘋果到底是什么呢阵幸?如果你告訴機器花履,只有代表水果的那個蘋果才能被吃。那機器就能準確理解你說話的意思挚赊,知道你的意圖了诡壁。做到這一點,就能讓機器明白聽得懂你說話的內(nèi)容荠割。

在語義理解領域妹卿,相關技術成熟度是遠不如語音識別的。要等到語義理解足夠成熟還是需要很長的時間∶镳校現(xiàn)在有第三方開放的自然語言理解接口夺克,像 Google 收購的 api.ai、百度的 UNIT嚎朽。你可以利用它們開放的 API 來讓你的產(chǎn)品有一定的理解能力铺纽,改善你產(chǎn)品的交互體驗。接入的過程就像教一個小朋友不斷地學習新的知識哟忍,不停地寫各種表達式狡门,喂給機器,停不下來锅很。你能積累多大的知識庫其馏,就看你能寫多少。想寫得多粗蔚,那就堆人力唄尝偎。有多少人工就有多少智能,所以人工智能鹏控。傅盛講做小雅智能音箱時說了致扯,像「上一首」、「再來一首」的指令泛化都是靠人工的当辐。

業(yè)務落地

Siri 剛出來那會抖僵,用戶期待很大,媒體說這是喬布斯劃的一道光缘揪,是未來的趨勢耍群。以后想要做什么事情,對著手機講一聲就好了找筝。后面很多公司也出了類似的語音產(chǎn)品:出門問問蹈垢,蟲洞,搜狗語音助手袖裕,百度語音助手曹抬。 大部分產(chǎn)品做了一兩年后都停了。現(xiàn)在只剩下大公司在玩了急鳄,蘋果的 Siri谤民, Google 的 Allo堰酿,微軟的 Cortana,百度的度秘张足。

從 2012 年算起触创,Siri 出來有 5 年多,身邊沒見有一個人用为牍。前幾天哼绑,跟一個做智能語音的朋友交流,他問了兩個問題吵聪。

你覺得 Siri 做得怎么樣凌那?怎樣做得更好?

Siri 必須要做得更好吟逝,12 年出來的產(chǎn)品帽蝶,到現(xiàn)在,并沒有太大的進步块攒。而 Amazon 智能音箱作為后起之秀励稳,卻開拓了新的領域。正好有新聞說囱井,Siri 也要換新掌門人了驹尼,以前一直都是 Eddy Cue 負責,現(xiàn)在改為 Craig Federighi 負責庞呕。蘋果肯定也是想將 Siri 與 iOS 和 macOS 做一步融合新翎,突然對 Siri 也有了很大的期待。

Siri 要想做好住练,先得從入口著手地啰。蘋果給了 Siri 快捷入口,但知道的人不多讲逛,長按本身就是一個較深的操作亏吝。知道的人呢,體驗兩三次就不用了盏混。與同類產(chǎn)品相比蔚鸥,Siri 在很多方面都需要做改進。

適時的引導许赃。Siri 是新產(chǎn)品止喷,學習新的東西就有成本。不像一般類型的產(chǎn)品混聊,有明確的功能启盛,用戶很容易在短時間內(nèi)建立起產(chǎn)品的認知。用戶對 Siri 的理解是技羔,它很厲害僵闯,什么都知道。但你稍微問一個偏門的問題藤滥,Siri 就傻傻不知道了鳖粟。要讓用戶理解智能助手干什么,你需要在合適時間告訴它拙绊。

明確的功能界線向图。Siri 需要給用戶劃出明確的界線,讓用戶知道它可以做什么标沪,哪些事情做得比較好榄攀,哪些是不擅長的。但不要簡單給出提示:「你可以這樣問我:xxxx」金句。

友好的互動檩赢。做智能助手,肯定不能一直沉默在后面违寞,不然就淪為工具贞瞒,只能等到我需要的時候才想起你。而實際上趁曼,Siri 沒有一個聚焦的功能军浆,用戶很少會想得到如何使用它。像Google Now挡闰,Cortana 就比 Siri 好得多乒融,這種互動是雙向的。即時的互動提醒摄悯,根據(jù)詢問內(nèi)容給出多種樣式回復:有圖片赞季,有文字,甚至猜測你的意向來給出相關問題射众。另外還有待處理事務的卡片式提示碟摆。

如果讓你來做語音,怎樣做好智能這個點叨橱?

智能的本質(zhì)是做好兩件事情:預測和建議典蜕。

從用戶角度來講,智能就是我做完第1步罗洗,你知道我第2步想做什么愉舔。而不是說我讓你做1件事情,你就按照命令去做這件事伙菜,這叫功能轩缤。比如說,你對 Siri 說,明天早上 7 點鐘叫我起床火的。Siri 就幫你定好了鬧鐘壶愤,但這沒有什么智能可言。

就目前技術馏鹤,我們不可能做得很智能征椒,預測某支股票是漲還是跌。在一定范圍內(nèi)是可以做一些事情的湃累,已經(jīng)有些產(chǎn)品做得比較好勃救。你對 Cortana 說到沃爾瑪附近的時候,提醒我買牙膏治力。Cortana 會問你哪個沃爾瑪蒙秒?你說哪個沃爾瑪都可以。等你到沃爾瑪?shù)臅r候他就會提醒你買牙膏宵统。Google Now 也是一樣晕讲,你到了上班的時間沒有走,它會提醒你不要遲到了榜田。下班時間到了益兄,它會告訴交通狀況怎么樣,開車回去需要多長時間箭券。這中間我并不需要標記上班的地點净捅,住的地點。Google 會收集我的軌跡辩块,然后自動標記出來蛔六。

上面的的預測和建議都是建立在數(shù)據(jù)源基礎之上。通過收集用戶的行為數(shù)據(jù)來判斷你的生活習慣废亭,意圖国章,情緒等。這些數(shù)據(jù)可以來自:Email豆村,網(wǎng)頁瀏覽歷史液兽,日歷,位置掌动,短信四啰,其它第三方的App。但不是所有人都愿意把自己的隱私開放出來粗恢。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末柑晒,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子眷射,更是在濱河造成了極大的恐慌匙赞,老刑警劉巖佛掖,帶你破解...
    沈念sama閱讀 221,273評論 6 515
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異涌庭,居然都是意外死亡芥被,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,349評論 3 398
  • 文/潘曉璐 我一進店門脾猛,熙熙樓的掌柜王于貴愁眉苦臉地迎上來撕彤,“玉大人,你說我怎么就攤上這事猛拴。” “怎么了牌里?”我有些...
    開封第一講書人閱讀 167,709評論 0 360
  • 文/不壞的土叔 我叫張陵借卧,是天一觀的道長访诱。 經(jīng)常有香客問我,道長跛溉,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 59,520評論 1 296
  • 正文 為了忘掉前任扮授,我火速辦了婚禮芳室,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘刹勃。我一直安慰自己堪侯,他們只是感情好,可當我...
    茶點故事閱讀 68,515評論 6 397
  • 文/花漫 我一把揭開白布荔仁。 她就那樣靜靜地躺著伍宦,像睡著了一般。 火紅的嫁衣襯著肌膚如雪乏梁。 梳的紋絲不亂的頭發(fā)上次洼,一...
    開封第一講書人閱讀 52,158評論 1 308
  • 那天,我揣著相機與錄音遇骑,去河邊找鬼卖毁。 笑死,一個胖子當著我的面吹牛落萎,可吹牛的內(nèi)容都是我干的亥啦。 我是一名探鬼主播,決...
    沈念sama閱讀 40,755評論 3 421
  • 文/蒼蘭香墨 我猛地睜開眼模暗,長吁一口氣:“原來是場噩夢啊……” “哼禁悠!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起兑宇,我...
    開封第一講書人閱讀 39,660評論 0 276
  • 序言:老撾萬榮一對情侶失蹤碍侦,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體瓷产,經(jīng)...
    沈念sama閱讀 46,203評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡站玄,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,287評論 3 340
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了濒旦。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片株旷。...
    茶點故事閱讀 40,427評論 1 352
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖尔邓,靈堂內(nèi)的尸體忽然破棺而出晾剖,到底是詐尸還是另有隱情,我是刑警寧澤梯嗽,帶...
    沈念sama閱讀 36,122評論 5 349
  • 正文 年R本政府宣布齿尽,位于F島的核電站,受9級特大地震影響灯节,放射性物質(zhì)發(fā)生泄漏循头。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 41,801評論 3 333
  • 文/蒙蒙 一炎疆、第九天 我趴在偏房一處隱蔽的房頂上張望卡骂。 院中可真熱鬧,春花似錦形入、人聲如沸全跨。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,272評論 0 23
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽螟蒸。三九已至,卻和暖如春崩掘,著一層夾襖步出監(jiān)牢的瞬間七嫌,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,393評論 1 272
  • 我被黑心中介騙來泰國打工苞慢, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留诵原,地道東北人。 一個月前我還...
    沈念sama閱讀 48,808評論 3 376
  • 正文 我出身青樓挽放,卻偏偏與公主長得像绍赛,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子辑畦,可洞房花燭夜當晚...
    茶點故事閱讀 45,440評論 2 359

推薦閱讀更多精彩內(nèi)容