前面幾篇文章在以iOS客戶端為例的情況下端逼,大致說(shuō)了kaldi部署在服務(wù)端的在線識(shí)別昼汗,以及kaldi在iOS項(xiàng)目中的本地識(shí)別。因?yàn)樗芯康臇|西最終都是要在實(shí)際的項(xiàng)目中或者產(chǎn)品中去使用,所以為了更好的看到自己所研究的東西的結(jié)果观谦,我才做了前面的一些demo來(lái)實(shí)際的看到效果和使用情況。當(dāng)然后面還有好玩的桨菜,我都會(huì)發(fā)出實(shí)際應(yīng)用的demo出來(lái)豁状。文章我還會(huì)繼續(xù)更新,因?yàn)楹竺婧猛娴倪€有聲紋識(shí)別,命令詞喚醒倒得。
在線識(shí)別
在線識(shí)別簡(jiǎn)單的理解就是將解碼器放在服務(wù)端泻红,以kaldi為環(huán)境來(lái)識(shí)別。解碼這一塊kaldi也提供了文件解碼的例子屎暇,可以稍加改造用于實(shí)時(shí)流識(shí)別承桥,當(dāng)然我也將改造后的解碼代碼放在前面的文章中,有需要的可以參考根悼。
參考demo:https://github.com/andyweiqiu/SpeechRecognition
本地識(shí)別
這里的本地識(shí)別是將kaldi源代碼編譯成庫(kù)放到iOS或者Android項(xiàng)目中凶异,以提供解碼的環(huán)境。當(dāng)然難點(diǎn)就是kaldi的編譯挤巡。解碼這一套都是通用的剩彬,不管是在線識(shí)別還是本地識(shí)別。我這里也提供了demo矿卑,有需要驗(yàn)證自己模型的喉恋,可以下載demo,在工程中直接替換模型文件母廷,運(yùn)行轻黑,不用管其他實(shí)現(xiàn)。在運(yùn)行demo的過(guò)程中有任何問(wèn)題可以直接聯(lián)系我琴昆。