2019.6.21更新
轉(zhuǎn)自蟲部落趙云007提供的免費(fèi)音頻轉(zhuǎn)文字軟件:
軟件基于百度語音識別,正確率和速度都不錯
目前只有音頻轉(zhuǎn)文字的功能窄坦,僅支持普通話唤反,支持批量選取音頻轉(zhuǎn)換,不限時長鸭津,免費(fèi)彤侍,如下圖測試批量音頻識別正確率:
(1)比如批量識別小學(xué)生課文
(2)比如識別長達(dá)五分鐘的《荷塘月色》
(3)識別岳云鵬的相聲
3、軟件操作
打開可能慢逆趋,且軟件開啟后帶著cmd黑框盏阶。
4、軟件下載
鏈接:https://pan.baidu.com/s/1knYlZfj4PayPdHqc3LaMEA
提取碼:oslt
大家在瀏覽闻书、工作的時候可能經(jīng)常碰到以下問題名斟,使得我們非常惱火:
1.網(wǎng)頁限制視頻下載
2.視頻、音頻的格式亂七八糟魄眉,需要轉(zhuǎn)換的時候很不方便
3.沒有靠譜的語音識別/機(jī)器翻譯軟件
4.講座又沒有字幕蒸眠,需要記錄發(fā)言人講的話非常麻煩
不過不用擔(dān)心,本次技術(shù)組針對第四點(diǎn)杆融,將問題本身和衍生出來的子問題一網(wǎng)打盡楞卡,為各位提供便利的方法。
視頻語音如何轉(zhuǎn)成文字脾歇?
Step1:下載視頻
這里技術(shù)組提供了一個好用的視頻鏈接解析網(wǎng)站——視頻魚蒋腮,只要輸入鏈接,就可以在站內(nèi)進(jìn)行下載(也可以用來針對國內(nèi)一些無良的視頻門戶網(wǎng)站)
網(wǎng)址:
也可以自由選擇下載的大小與格式藕各。
Step2:轉(zhuǎn)換成音頻
格式的轉(zhuǎn)換和合并等操作池摧,就需要一門神器——格式工廠的幫助了。
下載:
如果視頻網(wǎng)站把視頻分成了很多片段激况,可以下載后用之前分享的Bulk Rename Utility進(jìn)行編號作彤,然后使用格式工廠將這些片段的視頻進(jìn)行合并膘魄。
再利用格式工廠將視頻格式轉(zhuǎn)換成需要音頻格式。
Step3:語音識別+機(jī)器翻譯
一切準(zhǔn)備工作就緒竭讳,在最后的是最困難的工作创葡。
機(jī)翻其實(shí)目前已有很多成熟的工具,但由于目前的語音識別技術(shù)相比較機(jī)器翻譯绢慢、語音合成技術(shù)并不是非常成熟與完善灿渴,人工語音識別服務(wù)價格太高,希望低成本完成任務(wù)的我們只好使用自動轉(zhuǎn)換機(jī)翻服務(wù)胰舆。但即使利用了ai技術(shù)骚露,這也不是個簡單的活。
因此技術(shù)組特地再試用了十幾種方法后缚窿,采用了其中4種相對可行性較高的推薦給大家棘幸。
(1)訊飛聽見(科大訊飛產(chǎn)品,中文語音識別技術(shù)雄厚倦零,處于國內(nèi)領(lǐng)先地位)
訊飛聽見是科大訊飛(也就是最近世界AI大會上曝出AI同傳包含人工環(huán)節(jié)的企業(yè)误续,雖然是丑聞,但從另一方面說明其資格)以及一系列衍生產(chǎn)品提供了語音轉(zhuǎn)換的服務(wù)光绕,上傳文件后自動接單女嘲。
價格:機(jī)翻價格0.33元/每分鐘,有點(diǎn)貴【剛注冊有2個小時免費(fèi)轉(zhuǎn)換時長】
速度:自動識別诞帐,1小時音頻5分鐘出稿
識別率:經(jīng)過試用有90%以上【官方:最高95%】
(實(shí)際上機(jī)翻識別率達(dá)90%以上就到了及格線欣尼,足以滿足痛點(diǎn)。但再想從95%往上提高停蕉,邊際效益和邊際成本都非常高愕鼓,這個癢點(diǎn)亟待技術(shù)去滿足。不過近期科大訊飛聲稱自己的技術(shù)已經(jīng)達(dá)到了98%的識別率慧起,在可見的未來我們使用語音轉(zhuǎn)換的效率會更高)
存在形式:網(wǎng)頁菇晃、APP
總結(jié):效果最好的一個工具,如果能夠報銷(20元/小時)或者利用注冊福利應(yīng)該是比較好的選擇
(2)錄音啦
下載:
軟件支持3個API接口蚓挤、3個語種進(jìn)行音頻轉(zhuǎn)文字的服務(wù)磺送。
價格:按時間收費(fèi),價格適中灿意,如下圖【每臺計算機(jī)半小時免費(fèi)試用】
速度:自動識別估灿,需等待一小段時間
識別率:綜合來看在75~90%的區(qū)間,轉(zhuǎn)換完了需要校對一遍缤剧,不過也省去了輸入大部分文字的功夫馅袁,勉強(qiáng)可用(推薦云知聲,試用下來識別率較高荒辕,在90%左右)
存在形式:PC端
總結(jié):前期免費(fèi)汗销,目前開始收費(fèi)犹褒,購買的都是目前國內(nèi)比較有實(shí)力的語音識別產(chǎn)品的引擎,起到一個整合性服務(wù)的效果弛针〉铮總體來說比較有性價比,速度也不錯钦奋,但精度不高還需人工校對
(3)speech to text
國外的語音轉(zhuǎn)換產(chǎn)品座云,需要科學(xué)上網(wǎng)
價格:免費(fèi)
速度:需要自動播放一遍疙赠,效率很低
識別率:70~80%付材,非常一般(注意語音模型改成普通話,關(guān)鍵詞輸入多一點(diǎn)圃阳,可以提高識別率)
存在形式:網(wǎng)頁
https://speech-to-text-demo.ng.bluemix.net/
總結(jié):雖然它需要fanqiang厌衔,雖然它需要自動放一遍,但是在目前的環(huán)境下免費(fèi)的你還能說什么呢捍岳?不推薦富寿,僅作為臨時或小段語音轉(zhuǎn)換時的工具
(4)有道云筆記
閑的沒事做可以利用手機(jī)上微信、搜狗锣夹、百度页徐、訊飛等語音輸入APP一直按著輸入,當(dāng)然這樣比較傻...
推薦使用有道云筆記的語音速記功能银萍,并且不需要一直點(diǎn)擊变勇。
價格:免費(fèi)
速度:需要記錄一遍,最長可支持60分鐘
識別率:90%以上贴唇,效果比較好
存在形式:APP(獨(dú)占語音速記功能)
總結(jié):免費(fèi)的總有這么多那么多的限制搀绣,但比起speech to text,有道云筆記的語音速記是一個更好的選擇戳气,除了你需要身邊再放著一塊手機(jī)