本文編輯:Cynthia
2017年散址,人工智能的消費(fèi)產(chǎn)品落地聚焦在了智能音箱上乖阵,谷歌、亞馬遜紛紛推出智能音箱產(chǎn)品预麸,國(guó)內(nèi)的阿里巴巴推出天貓精靈瞪浸,小米推出小米AI音箱。智能音箱通過(guò)語(yǔ)音可以發(fā)出指令吏祸,未來(lái)可能成為智能家居的入口对蒲,通過(guò)語(yǔ)音控制家里的其他智能設(shè)備。
幾個(gè)月前谷歌的語(yǔ)音識(shí)別應(yīng)用推出支持個(gè)性化語(yǔ)音識(shí)別功能贡翘,而本周三蹈矮,也就是10月11日,亞馬遜的Echo音箱也具備了這項(xiàng)功能鸣驱。
當(dāng)不同的人對(duì)著音箱說(shuō)話時(shí)泛鸟,可以自動(dòng)識(shí)別身份,提供比如個(gè)人專屬的音樂(lè)播放列表踊东、個(gè)性化購(gòu)物等功能北滥。總之递胧,可以通過(guò)聲音來(lái)識(shí)別人碑韵,讓語(yǔ)音控制更進(jìn)一步。
亞馬遜Echo音箱背后是亞馬遜的Alexa智能語(yǔ)音技術(shù)缎脾,陳亞是一位華人工程師祝闻,是亞馬遜Alexa機(jī)器學(xué)習(xí)團(tuán)隊(duì)的資深工程師,負(fù)責(zé)語(yǔ)音識(shí)別遗菠、語(yǔ)義理解模型的搭建及優(yōu)化联喘。關(guān)于Alexa的技術(shù)內(nèi)涵壹佰案例特意與陳亞進(jìn)行了交流。
語(yǔ)音識(shí)人的技術(shù)原理
如果在很多人的空間里辙纬,讓Alexa知道是誰(shuí)在說(shuō)話豁遭,使用的是鉚釘語(yǔ)音檢測(cè)的思路,開(kāi)始通過(guò)Alexa來(lái)喚醒系統(tǒng)贺拣,使用一個(gè)RNN從中提取錨定嵌入蓖谢,記錄語(yǔ)音特征,接下來(lái)用另一個(gè)RNN從后續(xù)的請(qǐng)求語(yǔ)句中提取語(yǔ)音特征譬涡,基于此得到一個(gè)端點(diǎn)決策闪幽。
陳亞介紹,Alexa是首個(gè)通過(guò)語(yǔ)音指令驅(qū)動(dòng)的AI語(yǔ)音助理軟件涡匀,只需要呼叫“Aleca”盯腌,就可以對(duì)已經(jīng)連接數(shù)百個(gè)應(yīng)用的Alexa下達(dá)工作指令,比如播放音樂(lè)陨瘩、查找資料腕够、啟動(dòng)其他智能設(shè)備或者購(gòu)物等级乍。
現(xiàn)在Alexa并不只是一個(gè)語(yǔ)音識(shí)別工具,已經(jīng)變成了一個(gè)很成熟的操作系統(tǒng)帚湘,未來(lái)有可能取消傳統(tǒng)的手機(jī)屏幕玫荣,通過(guò)語(yǔ)音就可以進(jìn)行操作。
Alexa的深度學(xué)習(xí)技術(shù)原理
Alexa的開(kāi)發(fā)進(jìn)行了大規(guī)模的深度學(xué)習(xí)大诸,一個(gè)人成長(zhǎng)到16歲耳朵聽(tīng)聲音的時(shí)間大概只有14016小時(shí)崇决,而Alexa的深度學(xué)習(xí)是將幾千個(gè)小時(shí)的真實(shí)語(yǔ)音訓(xùn)練數(shù)據(jù)存儲(chǔ)到S3中,使用EC2云上的分布式GPU集群來(lái)訓(xùn)練深度學(xué)習(xí)模型底挫。
在訓(xùn)練模型方面,Alexa使用幾個(gè)逼近算法減少更新規(guī)模脸侥,隨著GPU線程的增加建邓,訓(xùn)練速度也會(huì)加快,每一秒可以處理大約90分鐘的語(yǔ)音睁枕。人耳16年可以聽(tīng)1.4萬(wàn)個(gè)小時(shí)的語(yǔ)音官边,而Alexa使用3小時(shí)就可以完成。
Alexa的語(yǔ)音識(shí)別系統(tǒng)主要包括信號(hào)處理外遇、聲學(xué)模型注簿、解碼器以及后處理等4大模塊,首先將收集的聲音進(jìn)行信號(hào)處理跳仿,再將語(yǔ)音信號(hào)轉(zhuǎn)化到頻域诡渴,從10毫秒的語(yǔ)音中提取特征向量提供給聲學(xué)模型,聲學(xué)模型負(fù)責(zé)把音頻分成不同的音素菲语,解碼器可以得出概率最高的一串詞串妄辩,經(jīng)過(guò)后處理把單詞組合成容易讀取的文本。
Alexa與其他語(yǔ)音識(shí)別應(yīng)用的優(yōu)勢(shì)
陳亞介紹到山上,Alexa之所以能夠占據(jù)終端市場(chǎng)70%的市場(chǎng)份額眼耀,是因?yàn)閬嗰R遜客戶至上的文化信仰。Alexa能夠取得成功佩憾,是因?yàn)閺漠a(chǎn)品設(shè)計(jì)到開(kāi)發(fā)管理模式等方面都堅(jiān)持客戶至上的原則哮伟,進(jìn)行用戶體驗(yàn)革新,降低智能家居門(mén)檻妄帘,建立Alexa生態(tài)楞黄。
即將在11月9日開(kāi)幕的第六屆TOP100全球軟件案例研究峰會(huì)上,陳亞將以分享嘉賓的身份出席寄摆,從產(chǎn)品設(shè)計(jì)的角度分享亞馬遜用戶至上理念引導(dǎo)的產(chǎn)品設(shè)計(jì)思路谅辣,以及亞馬遜對(duì)人工智能和機(jī)器學(xué)習(xí)的探索經(jīng)驗(yàn)。
更多TOP100案例信息及日程請(qǐng)前往[官網(wǎng)]查閱婶恼。4天時(shí)間集中分享2017年最值得學(xué)習(xí)的100個(gè)研發(fā)案例實(shí)踐桑阶。本平臺(tái)共送出10張開(kāi)幕式單天免費(fèi)體驗(yàn)票柏副,數(shù)量有限,先到先得蚣录。