公司有個(gè)需求,要用類似淘寶上語音輸入搜索的信息。我的思路是將語音轉(zhuǎn)換為文字,然后用UISearchBar或者UISearchBarDisplayController 來做儡炼,因此,重中之重就是語音轉(zhuǎn)文字了查蓉,上網(wǎng)查了一下乌询,語音這方面,國內(nèi)做的最好的就訊飛了(據(jù)說百度也可以豌研,但是我們安卓說還是不太行妹田,我也就沒看百度的,直接訊飛了)鹃共,在網(wǎng)上查了一下鬼佣,這方面的文章并不多,很大一部分都是幾年前的霜浴,沒有比較新的那種晶衷,因此就將自己集成語音聽寫的過程記錄下來,以備參考阴孟。
首先去訊飛的官網(wǎng)注冊一下晌纫,成為開發(fā)者
因?yàn)槭亲稣Z言聽寫的,直接進(jìn)去
-
進(jìn)去之后永丝,詳情部分隨便看看有個(gè)了解就好锹漱,這里說的是其他的,這個(gè)垂直聽寫模型慕嚷;
2016083123474QQ20160831-1.png
這個(gè)垂直聽寫模型大致的意思就是一個(gè)行業(yè)的專業(yè)術(shù)語識(shí)別率會(huì)比較高哥牍。不過可惜的是目前只有商旅,視頻和音樂三個(gè)模塊闯冷,相信以后會(huì)有更多的(不過半年前就是這幾個(gè)了0.0...)
這部分使用的話識(shí)別率高砂心,我也沒有研究過這個(gè)玩意,有需求的可以自己去看看蛇耀。
-
接下來是個(gè)性化聽寫辩诞,這一部分是 用得到的了。
2016083164816QQ20160831-2.png
如果沒有的話就先穿件個(gè)應(yīng)用纺涤。
右邊能夠下載SDK 最好是先下載出來看看官方的demo译暂,但是不要糾結(jié),切記 一定不要糾結(jié)撩炊,官方的demo看看參考下就好外永,一定不要對著剛,會(huì)受傷的(小白請切記拧咳,大神請無視伯顶。。。)
個(gè)性化聽寫里面的熱詞 還是非常有用的祭衩。
它就是讓你自己上傳一個(gè)文本文件灶体,txt格式的,里面記錄一些你應(yīng)用中經(jīng)常會(huì)搜索到的一些詞匯掐暮,專業(yè)性詞匯蝎抽,能夠極大地提高識(shí)別率(據(jù)說的,個(gè)人感覺還是會(huì)偏差一點(diǎn)路克,不過很姓两帷)。
熱詞的格式就是這樣的:
要注意的是:
- 每一行是一個(gè)熱詞
- 每一行結(jié)尾不要有標(biāo)點(diǎn)
- 最多兩千行(要是熱詞從數(shù)據(jù)庫導(dǎo)出的話精算,就要控制下長度了)
開放平臺(tái)看完了馬上就是集成的時(shí)間了瓢宦。。殖妇。
不管集成什么SDK刁笙,不管官方的文檔寫的多垃圾破花,都是必須要到開放平臺(tái)看看官方的文檔的谦趣,畢竟是人家寫的嘛∽浚看看對理解流程還是非常有幫助的前鹅。因?yàn)楝F(xiàn)在做的是語音聽寫的功能,所以語音聽寫部分要認(rèn)真的看峭梳。
-
首先按照文檔的指示舰绘,在Linked Frameworks and Libraries導(dǎo)入依賴庫;
20160831147261873562653.jpg
注意如果是離線識(shí)別的話還要加上libc++.a這個(gè)庫才行
確認(rèn)sdk 路徑這一步很重要葱椭,文檔也謝的很清楚捂寿,在這就不寫了,路徑不對用不了的孵运! -
在需要用到語音識(shí)別的地方導(dǎo)入頭文件秦陋,我這里做的一個(gè)小demo,用了兩個(gè)按鈕來監(jiān)聽錄音的開始和結(jié)束治笨,一個(gè)textFiled顯示識(shí)別結(jié)果驳概,(這里用的是訊飛無UI那個(gè))。
- 注意:
- 頭文件導(dǎo)入有可能沒有提示旷赖,直接復(fù)制下面的顺又。
- 代理方法不要忘了寫,不寫的話是不會(huì)提識(shí)別的
- 注意:
具體的demo就不在這貼了等孵,文章最后面有demo稚照,看下應(yīng)該就名白了的。。果录。腌闯。
詳細(xì)的請自己下載個(gè)看下吧,github