依圖科技發(fā)布語音開放平臺溪掀,聯(lián)袂微軟事镣、華為撬動語音市場

12月11日,人工智能公司依圖科技公布了在中文語音識別技術(shù)上的最新突破揪胃。在全球最大的中文開源數(shù)據(jù)庫AISHELL-2中璃哟,依圖短語音聽寫的字錯率(CER)僅為3.71%,領(lǐng)先原業(yè)內(nèi)領(lǐng)軍者約20%喊递,大幅刷新現(xiàn)有紀(jì)錄随闪。依圖還聯(lián)合微軟Azure推出依圖語音開放平臺,并攜手華為發(fā)布“智能語音聯(lián)合解決方案”骚勘,將依圖領(lǐng)先的語音識別技術(shù)提供給廣泛的第三方應(yīng)用開發(fā)者铐伴,共同推動智能語音行業(yè)的進步。

依圖首席創(chuàng)新官呂昊博士??

語音識別技術(shù)遠(yuǎn)未成熟俏讹,技術(shù)透明度差

近年來当宴,深度學(xué)習(xí)的爆發(fā)驅(qū)動了語音識別技術(shù)的高速發(fā)展,但相較于人臉識別在準(zhǔn)確率方面的高增速來說泽疆,語音識別的發(fā)展仍較為緩慢户矢。盡管一些機構(gòu)已宣傳達(dá)到了人類水平,但大多數(shù)情況下都來自安靜殉疼、近場等受限場景梯浪。對于電話捌年、語音節(jié)目、遠(yuǎn)場等更復(fù)雜場景驱证,則需要針對性地開發(fā)不同模型延窜,但實際應(yīng)用中的不確定性,使理想和現(xiàn)實仍有較大差距抹锄,導(dǎo)致應(yīng)用場景難以得到更大突破逆瑞。

對語音識別來說,語速伙单、語態(tài)获高、語氣、口音等都會顯著影響識別的準(zhǔn)確率吻育。一般認(rèn)為念秧,字錯率在低于3%時不會影響可讀性,而超過15%則毫無可讀性布疼。這兩個數(shù)據(jù)可認(rèn)為是語音識別的兩條紅線摊趾,而在不同場景下,不同算法的表現(xiàn)可能會有很大差異游两。在中文語音識別技術(shù)領(lǐng)域砾层,漢語的博大精深帶來的同音不同意等問題,更對語音識別的處理難度帶來極大挑戰(zhàn)贱案,顯著影響最終的使用體驗肛炮。

依圖首席創(chuàng)新官呂昊博士表示,“語音識別技術(shù)經(jīng)歷了漫長的發(fā)展進化宝踪,但至今都只能在受限的場景下才能達(dá)到較好的使用效果侨糟。我們認(rèn)為,核心技術(shù)的突破瘩燥,依然是當(dāng)前破局中文語音識別發(fā)展的關(guān)鍵秕重。在語音識別領(lǐng)域,依圖科技是一名新生厉膀,但立志推動行業(yè)創(chuàng)新與發(fā)展悲幅,做世界最好的中文普通話語音識別技術(shù)≌掘穑”

訊飛依圖BAT各家算法差異巨大汰具,訊飛依圖位列第一陣營

依圖此次推出的中文語音識別算法,與業(yè)內(nèi)原有領(lǐng)先者相比菱魔,不僅大幅提升了識別準(zhǔn)確率留荔,且在單個算法模型上,有極為出色的多場景適用性表現(xiàn)。在業(yè)內(nèi)近期公開的AISHELL-2的三個測試子集聚蝶,以及來自第三方的近場口音測試集杰妓、近場安靜聊天測試集、語音節(jié)目測試集碘勉、電話測試集巷挥、遠(yuǎn)場測試集中,依圖均處于業(yè)界領(lǐng)先水平验靡,且字錯率幾乎全部在15%以下倍宾。其中,在AISHELL2-2018A-EVAL數(shù)據(jù)集中胜嗓,依圖的識別準(zhǔn)確率高達(dá)96.29%高职,字錯率(CER)僅為3.71%,領(lǐng)先原業(yè)內(nèi)領(lǐng)軍者約20%辞州。通過“聽寫大會”微信小程序怔锌,讓用戶可以直觀感受到語音識別技術(shù)的真實表現(xiàn),在業(yè)界也屬首次变过,公開透明的體驗各類算法的水平差異埃元。

AISHELL-2是AISHELL Foundation和希爾貝殼宣布的開源數(shù)據(jù)庫,數(shù)據(jù)規(guī)模達(dá)1000小時媚狰,是目前全球最大的中文開源數(shù)據(jù)庫岛杀。它由1991名來自中國不同口音區(qū)域的發(fā)言人參與錄制,經(jīng)過專業(yè)語音校對人員轉(zhuǎn)寫標(biāo)注哈雏,通過了嚴(yán)格質(zhì)量檢驗楞件,數(shù)據(jù)庫文本正確率在96%以上衫生,錄音文本涉及喚醒詞裳瘪、語音控制詞、智能家居罪针、無人駕駛彭羹、工業(yè)生產(chǎn)等12個領(lǐng)域。

聽寫大會小程序
聽寫大會小程序

中文語音識別機器和人還有差距泪酱,產(chǎn)業(yè)發(fā)展任重道遠(yuǎn)

基于在語音識別領(lǐng)域的技術(shù)突破派殷,依圖與微軟也宣布進一步深化合作伙伴關(guān)系,聯(lián)合推出依圖語音開放平臺墓阀。該平臺將基于微軟Azure云毡惜,將行業(yè)領(lǐng)先的語音識別技術(shù)能力開放給廣泛的第三方應(yīng)用開發(fā)者,并攜手為廣大用戶和客戶提供更全面的服務(wù)及更好的體驗斯撮。在聯(lián)合發(fā)布語音開放平臺之后经伙,依圖與微軟還將在智能語音領(lǐng)域展開更深層次的合作,共建AI生態(tài)勿锅。

依圖還攜手華為聯(lián)合發(fā)布“智能語音聯(lián)合解決方案”帕膜,該方案基于依圖語音開放平臺及華為全棧全場景昇騰(Ascend)系列芯片和面向數(shù)據(jù)中心側(cè)的Atlas 300 AI加速卡枣氧,將雙方強大的技術(shù)研發(fā)能力與生態(tài)服務(wù)能力深度結(jié)合,形成軟硬件一體化的聯(lián)合解決方案垮刹。借助該解決方案达吞,第三方應(yīng)用開發(fā)者可進一步提升開發(fā)效率,從業(yè)界領(lǐng)先的語音技術(shù)中受益荒典。

語音識別是AI理解世界最重要的組成部分酪劫,也是人人交互、人機交互最重要的入口种蝶。此次依圖科技在語音識別技術(shù)方面的突破契耿,不僅意味著依圖首次涉足語音識別領(lǐng)域便已經(jīng)躋身中文語音識別第一陣營,同時也說明語音識別在技術(shù)層面還有足夠的進化空間螃征,遠(yuǎn)遠(yuǎn)沒有達(dá)到“超越人類”搪桂。依圖預(yù)計,在未來6個月到12個月盯滚,語音識別技術(shù)的算法性能將呈指數(shù)級增長踢械,更多的場景將被解鎖,為行業(yè)應(yīng)用帶來更大的價值魄藕。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末内列,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子背率,更是在濱河造成了極大的恐慌话瞧,老刑警劉巖,帶你破解...
    沈念sama閱讀 206,839評論 6 482
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件寝姿,死亡現(xiàn)場離奇詭異交排,居然都是意外死亡,警方通過查閱死者的電腦和手機饵筑,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,543評論 2 382
  • 文/潘曉璐 我一進店門埃篓,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人根资,你說我怎么就攤上這事架专。” “怎么了玄帕?”我有些...
    開封第一講書人閱讀 153,116評論 0 344
  • 文/不壞的土叔 我叫張陵部脚,是天一觀的道長。 經(jīng)常有香客問我裤纹,道長委刘,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 55,371評論 1 279
  • 正文 為了忘掉前任,我火速辦了婚禮钱雷,結(jié)果婚禮上骂铁,老公的妹妹穿的比我還像新娘。我一直安慰自己罩抗,他們只是感情好拉庵,可當(dāng)我...
    茶點故事閱讀 64,384評論 5 374
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著套蒂,像睡著了一般钞支。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上操刀,一...
    開封第一講書人閱讀 49,111評論 1 285
  • 那天烁挟,我揣著相機與錄音,去河邊找鬼骨坑。 笑死撼嗓,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的欢唾。 我是一名探鬼主播且警,決...
    沈念sama閱讀 38,416評論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼礁遣!你這毒婦竟也來了斑芜?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 37,053評論 0 259
  • 序言:老撾萬榮一對情侶失蹤祟霍,失蹤者是張志新(化名)和其女友劉穎杏头,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體沸呐,經(jīng)...
    沈念sama閱讀 43,558評論 1 300
  • 正文 獨居荒郊野嶺守林人離奇死亡醇王,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 36,007評論 2 325
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了垂谢。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片厦画。...
    茶點故事閱讀 38,117評論 1 334
  • 序言:一個原本活蹦亂跳的男人離奇死亡疮茄,死狀恐怖滥朱,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情力试,我是刑警寧澤徙邻,帶...
    沈念sama閱讀 33,756評論 4 324
  • 正文 年R本政府宣布,位于F島的核電站畸裳,受9級特大地震影響缰犁,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 39,324評論 3 307
  • 文/蒙蒙 一帅容、第九天 我趴在偏房一處隱蔽的房頂上張望颇象。 院中可真熱鬧,春花似錦并徘、人聲如沸遣钳。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,315評論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽蕴茴。三九已至,卻和暖如春姐直,著一層夾襖步出監(jiān)牢的瞬間倦淀,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 31,539評論 1 262
  • 我被黑心中介騙來泰國打工声畏, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留撞叽,地道東北人。 一個月前我還...
    沈念sama閱讀 45,578評論 2 355
  • 正文 我出身青樓插龄,卻偏偏與公主長得像能扒,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子辫狼,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 42,877評論 2 345

推薦閱讀更多精彩內(nèi)容