依圖科技發(fā)布語音開放平臺溪掀，聯(lián)袂微軟事镣、華為撬動語音市場

12月11日，人工智能公司依圖科技公布了在中文語音識別技術(shù)上的最新突破揪胃。在全球最大的中文開源數(shù)據(jù)庫AISHELL-2中璃哟，依圖短語音聽寫的字錯率（CER）僅為3.71%，領(lǐng)先原業(yè)內(nèi)領(lǐng)軍者約20%喊递，大幅刷新現(xiàn)有紀(jì)錄随闪。依圖還聯(lián)合微軟Azure推出依圖語音開放平臺，并攜手華為發(fā)布“智能語音聯(lián)合解決方案”骚勘，將依圖領(lǐng)先的語音識別技術(shù)提供給廣泛的第三方應(yīng)用開發(fā)者铐伴，共同推動智能語音行業(yè)的進步。

依圖首席創(chuàng)新官呂昊博士??

語音識別技術(shù)遠(yuǎn)未成熟俏讹，技術(shù)透明度差

近年來当宴，深度學(xué)習(xí)的爆發(fā)驅(qū)動了語音識別技術(shù)的高速發(fā)展，但相較于人臉識別在準(zhǔn)確率方面的高增速來說泽疆，語音識別的發(fā)展仍較為緩慢户矢。盡管一些機構(gòu)已宣傳達(dá)到了人類水平，但大多數(shù)情況下都來自安靜殉疼、近場等受限場景梯浪。對于電話捌年、語音節(jié)目、遠(yuǎn)場等更復(fù)雜場景驱证，則需要針對性地開發(fā)不同模型延窜，但實際應(yīng)用中的不確定性，使理想和現(xiàn)實仍有較大差距抹锄，導(dǎo)致應(yīng)用場景難以得到更大突破逆瑞。

對語音識別來說，語速伙单、語態(tài)获高、語氣、口音等都會顯著影響識別的準(zhǔn)確率吻育。一般認(rèn)為念秧，字錯率在低于3%時不會影響可讀性，而超過15%則毫無可讀性布疼。這兩個數(shù)據(jù)可認(rèn)為是語音識別的兩條紅線摊趾，而在不同場景下，不同算法的表現(xiàn)可能會有很大差異游两。在中文語音識別技術(shù)領(lǐng)域砾层，漢語的博大精深帶來的同音不同意等問題，更對語音識別的處理難度帶來極大挑戰(zhàn)贱案，顯著影響最終的使用體驗肛炮。

依圖首席創(chuàng)新官呂昊博士表示，“語音識別技術(shù)經(jīng)歷了漫長的發(fā)展進化宝踪，但至今都只能在受限的場景下才能達(dá)到較好的使用效果侨糟。我們認(rèn)為，核心技術(shù)的突破瘩燥，依然是當(dāng)前破局中文語音識別發(fā)展的關(guān)鍵秕重。在語音識別領(lǐng)域，依圖科技是一名新生厉膀，但立志推動行業(yè)創(chuàng)新與發(fā)展悲幅，做世界最好的中文普通話語音識別技術(shù)≌掘穑”

訊飛依圖BAT各家算法差異巨大汰具，訊飛依圖位列第一陣營

依圖此次推出的中文語音識別算法，與業(yè)內(nèi)原有領(lǐng)先者相比菱魔，不僅大幅提升了識別準(zhǔn)確率留荔，且在單個算法模型上，有極為出色的多場景適用性表現(xiàn)。在業(yè)內(nèi)近期公開的AISHELL-2的三個測試子集聚蝶，以及來自第三方的近場口音測試集杰妓、近場安靜聊天測試集、語音節(jié)目測試集碘勉、電話測試集巷挥、遠(yuǎn)場測試集中，依圖均處于業(yè)界領(lǐng)先水平验靡，且字錯率幾乎全部在15%以下倍宾。其中，在AISHELL2-2018A-EVAL數(shù)據(jù)集中胜嗓，依圖的識別準(zhǔn)確率高達(dá)96.29%高职，字錯率（CER）僅為3.71%，領(lǐng)先原業(yè)內(nèi)領(lǐng)軍者約20%辞州。通過“聽寫大會”微信小程序怔锌，讓用戶可以直觀感受到語音識別技術(shù)的真實表現(xiàn)，在業(yè)界也屬首次变过，公開透明的體驗各類算法的水平差異埃元。

AISHELL-2是AISHELL Foundation和希爾貝殼宣布的開源數(shù)據(jù)庫，數(shù)據(jù)規(guī)模達(dá)1000小時媚狰，是目前全球最大的中文開源數(shù)據(jù)庫岛杀。它由1991名來自中國不同口音區(qū)域的發(fā)言人參與錄制，經(jīng)過專業(yè)語音校對人員轉(zhuǎn)寫標(biāo)注哈雏，通過了嚴(yán)格質(zhì)量檢驗楞件，數(shù)據(jù)庫文本正確率在96%以上衫生，錄音文本涉及喚醒詞裳瘪、語音控制詞、智能家居罪针、無人駕駛彭羹、工業(yè)生產(chǎn)等12個領(lǐng)域。

聽寫大會小程序

中文語音識別機器和人還有差距泪酱，產(chǎn)業(yè)發(fā)展任重道遠(yuǎn)

基于在語音識別領(lǐng)域的技術(shù)突破派殷，依圖與微軟也宣布進一步深化合作伙伴關(guān)系，聯(lián)合推出依圖語音開放平臺墓阀。該平臺將基于微軟Azure云毡惜，將行業(yè)領(lǐng)先的語音識別技術(shù)能力開放給廣泛的第三方應(yīng)用開發(fā)者，并攜手為廣大用戶和客戶提供更全面的服務(wù)及更好的體驗斯撮。在聯(lián)合發(fā)布語音開放平臺之后经伙，依圖與微軟還將在智能語音領(lǐng)域展開更深層次的合作，共建AI生態(tài)勿锅。

依圖還攜手華為聯(lián)合發(fā)布“智能語音聯(lián)合解決方案”帕膜，該方案基于依圖語音開放平臺及華為全棧全場景昇騰（Ascend）系列芯片和面向數(shù)據(jù)中心側(cè)的Atlas 300 AI加速卡枣氧，將雙方強大的技術(shù)研發(fā)能力與生態(tài)服務(wù)能力深度結(jié)合，形成軟硬件一體化的聯(lián)合解決方案垮刹。借助該解決方案达吞，第三方應(yīng)用開發(fā)者可進一步提升開發(fā)效率，從業(yè)界領(lǐng)先的語音技術(shù)中受益荒典。

語音識別是AI理解世界最重要的組成部分酪劫，也是人人交互、人機交互最重要的入口种蝶。此次依圖科技在語音識別技術(shù)方面的突破契耿，不僅意味著依圖首次涉足語音識別領(lǐng)域便已經(jīng)躋身中文語音識別第一陣營，同時也說明語音識別在技術(shù)層面還有足夠的進化空間螃征，遠(yuǎn)遠(yuǎn)沒有達(dá)到“超越人類”搪桂。依圖預(yù)計，在未來6個月到12個月盯滚，語音識別技術(shù)的算法性能將呈指數(shù)級增長踢械，更多的場景將被解鎖，為行業(yè)應(yīng)用帶來更大的價值魄藕。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者

人面猴
序言：七十年代末内列，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子背率，更是在濱河造成了極大的恐慌话瞧，老刑警劉巖，帶你破解...
沈念sama閱讀 206,839評論 6贊 482
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件寝姿，死亡現(xiàn)場離奇詭異交排，居然都是意外死亡，警方通過查閱死者的電腦和手機饵筑，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 88,543評論 2贊 382
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進店門埃篓，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人根资，你說我怎么就攤上這事架专。” “怎么了玄帕？”我有些...
開封第一講書人閱讀 153,116評論 0贊 344
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵部脚，是天一觀的道長。經(jīng)常有香客問我裤纹，道長委刘，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 55,371評論 1贊 279
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮钱雷，結(jié)果婚禮上骂铁，老公的妹妹穿的比我還像新娘。我一直安慰自己罩抗，他們只是感情好拉庵，可當(dāng)我...
茶點故事閱讀 64,384評論 5贊 374
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著套蒂，像睡著了一般钞支。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上操刀，一...
開封第一講書人閱讀 49,111評論 1贊 285
城市分裂傳說
那天烁挟，我揣著相機與錄音，去河邊找鬼骨坑。笑死撼嗓，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的欢唾。我是一名探鬼主播且警，決...
沈念sama閱讀 38,416評論 3贊 400
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼礁遣！你這毒婦竟也來了斑芜？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 37,053評論 0贊 259
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤祟霍，失蹤者是張志新（化名）和其女友劉穎杏头，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體沸呐，經(jīng)...
沈念sama閱讀 43,558評論 1贊 300
?護林員之死
正文獨居荒郊野嶺守林人離奇死亡醇王，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 36,007評論 2贊 325
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了垂谢。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片厦画。...
茶點故事閱讀 38,117評論 1贊 334
活死人
序言：一個原本活蹦亂跳的男人離奇死亡疮茄，死狀恐怖滥朱，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情力试，我是刑警寧澤徙邻，帶...
沈念sama閱讀 33,756評論 4贊 324
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站畸裳，受9級特大地震影響缰犁，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 39,324評論 3贊 307
男人毒藥：我在死后第九天來索命
文/蒙蒙一帅容、第九天我趴在偏房一處隱蔽的房頂上張望颇象。院中可真熱鬧，春花似錦并徘、人聲如沸遣钳。這莊子的主人今日做“春日...
開封第一講書人閱讀 30,315評論 0贊 19
一樁弒父案麦乞，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽蕴茴。三九已至，卻和暖如春姐直，著一層夾襖步出監(jiān)牢的瞬間倦淀，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 31,539評論 1贊 262
情欲美人皮
我被黑心中介騙來泰國打工声畏，沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留撞叽，地道東北人。一個月前我還...
沈念sama閱讀 45,578評論 2贊 355
代替公主和親
正文我出身青樓插龄，卻偏偏與公主長得像能扒，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子辫狼，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 42,877評論 2贊 345

依圖科技發(fā)布語音開放平臺，聯(lián)袂微軟抵栈、華為撬動語音市場

依圖科技發(fā)布語音開放平臺溪掀，聯(lián)袂微軟事镣、華為撬動語音市場

語音識別技術(shù)遠(yuǎn)未成熟俏讹，技術(shù)透明度差

訊飛依圖BAT各家算法差異巨大汰具，訊飛依圖位列第一陣營

中文語音識別機器和人還有差距泪酱，產(chǎn)業(yè)發(fā)展任重道遠(yuǎn)

推薦閱讀更多精彩內(nèi)容