語音交互會流行嗎？

近幾年制恍，”人工智能“已經(jīng)成為互聯(lián)網(wǎng)圈里面出現(xiàn)頻次最高的一個詞匯父能，隨著技術(shù)的的進(jìn)步和社會的發(fā)展神凑，物聯(lián)網(wǎng)時(shí)代已經(jīng)成為繼移動互聯(lián)時(shí)代之后的下一個浪潮净神。在PC時(shí)代，瀏覽器是流量入口溉委，人類通過鍵盤和鼠標(biāo)和信息進(jìn)行交互鹃唯；在移動互聯(lián)網(wǎng)時(shí)代，以App Store為代表的移動應(yīng)用商店成為了流量入口瓣喊，人類通過觸摸屏上的GUi來操縱App和信息進(jìn)行交互坡慌；在即將到來的物聯(lián)網(wǎng)時(shí)代，人工智能會是流量入口藻三，那么語音交互就成了極具競爭力的交互方式洪橘。

目前，在語音交互相關(guān)的領(lǐng)域已經(jīng)出現(xiàn)了一批玩家和產(chǎn)品棵帽，國外的有Google Now熄求、微軟的Cortana（小娜）、Facebook的Message Platform逗概、蘋果的Siri弟晚、亞馬遜的Echo、Google Home的智能音箱，國內(nèi)的科大訊飛卿城、百度的智能機(jī)器人（度秘）枚钓、搜狗語音、微信的語音功能等瑟押，雖然這么多大牌玩家進(jìn)入語音交互的領(lǐng)域搀捷，但由于技術(shù)和社會環(huán)境的限制，語音交互還處在起步階段多望，相關(guān)的語音交互技術(shù)還無法支持大規(guī)模的應(yīng)用和推廣指煎。

要想讓語音交互流行起來，必須合理解決以下幾點(diǎn)客觀的限制：

1便斥、語音識別技術(shù)還處于起步階段至壤，語音識別技術(shù)，也被稱為自動語音識別Automatic Speech Recognition枢纠，(ASR)像街，其目標(biāo)是將人類的語音中的詞匯內(nèi)容轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入，例如按鍵晋渺、二進(jìn)制編碼或者字符序列镰绎。語音識別的研究工作可以追溯到20世紀(jì)50年代AT&T貝爾實(shí)驗(yàn)室的Audrey系統(tǒng)，它是第一個可以識別十個英文數(shù)字的語音識別系統(tǒng)木西。并且一些行業(yè)巨頭也都是在2010年左右才開始加大對語音技術(shù)的投入畴栖。各大巨頭各自為戰(zhàn)，語音識別領(lǐng)域里面還沒有形成統(tǒng)一的行業(yè)標(biāo)準(zhǔn)和應(yīng)用生態(tài)八千。

2吗讶、使用場景有限。語音識別技術(shù)對環(huán)境要求苛刻恋捆；在識別的準(zhǔn)確率上受較多因素的影響照皆，比如背景噪音、口音沸停、語速膜毁、特定領(lǐng)域的專有名詞等都影響準(zhǔn)確率。有一項(xiàng)這樣的測試愤钾，有人隨機(jī)截取了幾段網(wǎng)絡(luò)課程用主流的云端引擎測試識別準(zhǔn)確度瘟滨，基本上準(zhǔn)確率在70%左右；然后又截取了一段新聞聯(lián)播的音頻能颁，用同樣的云端引擎做測試杂瘸，準(zhǔn)確率達(dá)到了95%左右。由這個測試我們可以清楚的看到客觀因素對語音識別準(zhǔn)確率的影響劲装，要知道在這個行業(yè)5%的準(zhǔn)確率就是可以引起行業(yè)變革的胧沫。目前的技術(shù)先限制導(dǎo)致語音交互體驗(yàn)的機(jī)器感特別強(qiáng)昌简，缺乏人性化的感知，沒有人喜歡跟呆板的機(jī)器一直做交流的绒怨。

3纯赎、語音交互是非可視化的，非常消耗用戶的注意力南蹂，增加記憶負(fù)擔(dān)犬金。人在與系統(tǒng)做交互的時(shí)候，能記住的信息也就10秒左右六剥。舉一個常用的場景晚顷，有時(shí)候打銀行的客服電話，你必須集中精力聽語音播報(bào)疗疟，一旦被打斷就又得從頭聽一遍该默。

4、用戶習(xí)慣還未完全養(yǎng)成策彤。沒有人愿意對著冰冷的機(jī)器說話栓袖，然后得到毫無感情的甚至是錯誤的回應(yīng)。用戶對語音交互對象的要求不但是可以聽懂店诗，還應(yīng)該能人性化的給以回應(yīng)裹刮，人類更期望通過語音達(dá)到人人交互的感受，而不是人機(jī)交互庞瘸，這也是為什么語音交互的普及很大程度上依賴于人工智能技術(shù)的發(fā)展捧弃。

但是，這些客觀條件的限制并不能阻擋語音交互成為物聯(lián)網(wǎng)時(shí)代最流行也是最普遍的交互方式擦囊。

1违霞、語言的本質(zhì)是進(jìn)行信息的交流。從人類進(jìn)化的角度來看霜第，語音是先于文字產(chǎn)生的葛家，我們再來看一個現(xiàn)象户辞，所有的嬰兒都是先學(xué)會了說話泌类，然后才會學(xué)習(xí)寫字。視覺和觸覺的交互都需要硬件在可視范圍之內(nèi)才能完成底燎，而聲音的傳播路徑是球形的360度刃榨，可傳播范圍非常廣，而且獲取信息的方式門檻低双仍。

2枢希、語音交互的兩個關(guān)鍵點(diǎn)為語音識別和語義理解。在語音識別方面朱沃，隨著智能終端的普及應(yīng)用厅须，我們已經(jīng)獲取了大量的語音數(shù)據(jù)資料，再加上算法的優(yōu)化叹誉，這為計(jì)算機(jī)的深度學(xué)習(xí)提供了大量的支持坚嗜。這其實(shí)就跟人類學(xué)習(xí)語言是一個道理。首先陡舅，你的大腦要有學(xué)習(xí)認(rèn)知的能力（相當(dāng)于算法）；同時(shí)，你還要掌握充分的詞匯量摆寄，接受足夠的聽力訓(xùn)練（相當(dāng)于語音數(shù)據(jù)），你才能聽懂一門語言（語音識別）坯门。學(xué)習(xí)英語的時(shí)候通過大量的聽力練習(xí)強(qiáng)化我們的聽力也是同樣的道理微饥；

語義理解依賴于神經(jīng)網(wǎng)絡(luò)（ANN）的技術(shù)，本質(zhì)上是一個自適應(yīng)非線性動力學(xué)系統(tǒng)古戴，將機(jī)器學(xué)習(xí)的方式模擬人類大腦的神經(jīng)元欠橘，當(dāng)處理的語言越來越多時(shí)，這種網(wǎng)絡(luò)就可以逐漸理解語言现恼，實(shí)驗(yàn)結(jié)果發(fā)現(xiàn)简软，這種技術(shù)可以使準(zhǔn)確率提升25%以上。

3述暂、任何新技術(shù)都會經(jīng)過起步痹升、發(fā)展、流行這樣的階段∑杈拢現(xiàn)階段最符合用戶習(xí)慣的交互方式是GUI疼蛾，但GUI也是隨著智能手機(jī)的發(fā)展才逐漸流行起來。語音交互技術(shù)一旦解決了擬人化的問題艺配，賦予聲音情感化察郁，強(qiáng)化人人交互的體驗(yàn)，就會進(jìn)一步促進(jìn)用戶習(xí)慣的養(yǎng)成转唉。

4皮钠、語音交互有著其天然的用戶場景和用戶群體。語音交互創(chuàng)造了全新的伴隨式場景赠法，比如說早晨起床后我們可以一邊洗刷一遍聽廣播麦轰，晚上跑步的同時(shí)還可以聽音樂，語音交互解放了人的手和眼睛砖织，通過語音交互我們可以做到一心二用款侵，這極大的提高了我們在某些場景下的效率，語音交互充分抓住了人類不方便使用手和眼睛的場景侧纯。另外隨著智能設(shè)備影響的擴(kuò)大新锈，用戶群逐步向老齡人群、低齡人群眶熬、身體殘障人群滲透擴(kuò)散的趨勢非常明顯妹笆，而對這些新進(jìn)入人群而言块请，原有的觸控交互方式或許并不太適合，用戶習(xí)慣也未形成拳缠，例如老年人視力下降负乡、手指也不夠靈活；低齡兒童還不能掌握手寫等能力也不適合長時(shí)間看電子屏幕脊凰；弱視/盲人更希望接受語音信息和發(fā)出語音指令抖棘，等等，因此語音交互也更適合拓展智能設(shè)備新的用戶人群狸涌。

語音交互將成為物聯(lián)網(wǎng)時(shí)代最有競爭力的入口切省。語音識別將使人機(jī)交互能夠以人類最熟悉的方式進(jìn)行，語音識別技術(shù)一旦取得進(jìn)一步的突破帕胆，這個行業(yè)就會迎來黃金時(shí)期朝捆，而且語音交互將凌駕于瀏覽器、APP等其他應(yīng)用入口之上懒豹，形成一個以語音交互技術(shù)為核心的全新應(yīng)用生態(tài)鏈芙盘，同時(shí)對人工智能產(chǎn)業(yè)的發(fā)展起到極大的促進(jìn)作用。

可否想象么樣一個場景脸秽，在某個周日的早上儒老，我們起床后，家里的智能音箱會自動給我們播報(bào)今天的天氣狀況记餐，吃早餐的時(shí)候發(fā)現(xiàn)冰箱里的牛奶只剩最后一盒了驮樊，只需要說一句“再幫我訂購一箱牛奶”，快遞就會在約定好的時(shí)間送過來片酝，說一句“幫我叫輛車”囚衔，一會車就到樓下等你了……

最后編輯于：2017.12.05 23:58:46

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市雕沿，隨后出現(xiàn)的幾起案子练湿，更是在濱河造成了極大的恐慌，老刑警劉巖审轮，帶你破解...
沈念sama閱讀 206,723評論 6贊 481
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件肥哎，死亡現(xiàn)場離奇詭異，居然都是意外死亡断国，警方通過查閱死者的電腦和手機(jī)贤姆，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,485評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來稳衬，“玉大人，你說我怎么就攤上這事坐漏”【危” “怎么了碧信？”我有些...
開封第一講書人閱讀 152,998評論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長街夭。經(jīng)常有香客問我砰碴，道長，這世上最難降的妖魔是什么板丽？我笑而不...
開封第一講書人閱讀 55,323評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任呈枉，我火速辦了婚禮，結(jié)果婚禮上埃碱，老公的妹妹穿的比我還像新娘猖辫。我一直安慰自己，他們只是感情好砚殿，可當(dāng)我...
茶點(diǎn)故事閱讀 64,355評論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布啃憎。她就那樣靜靜地躺著，像睡著了一般似炎。火紅的嫁衣襯著肌膚如雪辛萍。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 49,079評論 1贊 285
城市分裂傳說
那天羡藐，我揣著相機(jī)與錄音贩毕，去河邊找鬼。笑死仆嗦，一個胖子當(dāng)著我的面吹牛耳幢，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播欧啤，決...
沈念sama閱讀 38,389評論 3贊 400
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼睛藻，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了邢隧？” 一聲冷哼從身側(cè)響起店印，我...
開封第一講書人閱讀 37,019評論 0贊 259
萬榮殺人案實(shí)錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎倒慧，沒想到半個月后按摘，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 43,519評論 1贊 300
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡纫谅，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 35,971評論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年炫贤，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片付秕。...
茶點(diǎn)故事閱讀 38,100評論 1贊 333
活死人
序言：一個原本活蹦亂跳的男人離奇死亡兰珍，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出询吴，到底是詐尸還是另有隱情掠河，我是刑警寧澤亮元，帶...
沈念sama閱讀 33,738評論 4贊 324
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站唠摹，受9級特大地震影響爆捞，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜勾拉，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,293評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一煮甥、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧藕赞，春花似錦成肘、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,289評論 0贊 19
一樁弒父案艇劫，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至惩激，卻和暖如春店煞，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背风钻。一陣腳步聲響...
開封第一講書人閱讀 31,517評論 1贊 262
情欲美人皮
我被黑心中介騙來泰國打工顷蟀，沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人骡技。一個月前我還...
沈念sama閱讀 45,547評論 2贊 354
代替公主和親
正文我出身青樓鸣个，卻偏偏與公主長得像，于是被迫代替她去往敵國和親布朦。傳聞我的和親對象是個殘疾皇子囤萤，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 42,834評論 2贊 345

語音交互會流行嗎偿洁？

語音交互會流行嗎？

推薦閱讀更多精彩內(nèi)容