姓名:蔣雪健? ? ? ? 學號:16020130066
轉(zhuǎn)自it之家
【嵌牛導讀】搜狗推出了一種人機交互新技術(shù)“唇語識別”魄宏,通過機器視覺識別說話人唇部動作,來解讀說話者所說的內(nèi)容存筏。
【嵌牛鼻子】人機交互“唇語識別”
【嵌牛提問】唇語識別的準確率有多高宠互?又會有什么應用?
【嵌牛正文】搜狗官方表示椭坚,通過復雜端到端深度神經(jīng)網(wǎng)絡(luò)技術(shù)進行中文唇語序列建模予跌,經(jīng)過數(shù)千小時的真實唇語數(shù)據(jù)訓練,終于取得了唇語識別效果善茎。在非特定人開放口語測試集上券册,該系統(tǒng)達到60%以上的準確率,超過google發(fā)布的英文唇語系統(tǒng)50%以上的準確率垂涯,在垂直場景如車載烁焙、智能家居等場景下甚至已經(jīng)達到90%的準確率。
作為人機交互的形式之一耕赘,未來唇語識別技術(shù)可以輔助語音交互及圖像識別骄蝇,在日常生活、安防操骡、公益等各個領(lǐng)域?qū)崿F(xiàn)廣泛應用乞榨。比如在車載場景下,周圍噪音過大時會對語音指令產(chǎn)生干擾当娱,通過唇語識別技術(shù)則可以規(guī)避干擾吃既,保證人車交互的準確性和穩(wěn)定性,日常不便發(fā)聲的公共場所也可以保證說話內(nèi)容的私密性跨细;在安防領(lǐng)域鹦倚,由于目前多數(shù)監(jiān)控只有攝像頭沒有麥克風,往往只能看清嘴型卻不知道在說什么冀惭,給案情分析帶來很多難題震叙,而唇語識別技術(shù)可以幫助公安人員獲取重要的講話信息,為公共安全提供有效支持散休。除此之外媒楼,唇語識別技術(shù)還能發(fā)揮巨大的公益價值,幫助先天性聽障人群或老年人戚丸,讓他們更好地理解和表達自己划址。