MoneyPrinterPlus之前使用的是各種云廠商的語音識別服務來進行語音的視頻和字幕的識別工作拟逮。
但是很多小伙伴說云服務用不起猖凛。
那么沒辦法,MoneyPrinterPlus上線最新版本,支持fasterWhisper本地語音識別模型修肠。
趕緊來體驗吧。
軟件準備
當然户盯,前提條件就是你需要下載MoneyPrinterPlus軟件啦嵌施。
下載地址: https://github.com/ddean2009/MoneyPrinterPlus
用得好的朋友,不妨給個star支持一下莽鸭。 在軟件v4.1版本之后吗伤,MoneyPrinterPlus已經(jīng)支持fasterWhisper本地語音識別模型。
安裝fasterWhipser的模型
fasterWhipser服務直接由MoneyPrinterPlus調用硫眨。所以不需要第三方的fasterWhisper服務足淆。
但是我們需要下載對應的fasterWhipser模型到MoneyPrinterPlus中。
fasterWhisper模型下載地址:https://huggingface.co/Systran
[圖片上傳失敗...(image-87f195-1721790290171)]
可以看到里面有很多種模型礁阁,大家可以根據(jù)需要自行下載對應的模型巧号。
怎么下載呢?
進入到MoneyPrinterPlus的fasterwhisper目錄下:
cd fasterwhisper
執(zhí)行git clone命令:
git clone https://huggingface.co/Systran/faster-whisper-tiny tiny
目前MoneyPrinterPlus支持下面幾種模型名稱:
'large-v3', 'large-v2', 'large-v1', 'distil-large-v3', 'distil-large-v2', 'medium', 'base', 'small', 'tiny'
所以你在git clone的時候姥闭,需要把faster-whisper倉庫中的模型目錄重命名為MoneyPrinterPlus支持的模型名稱丹鸿。
比如faster-whisper-tiny, 對應的模型叫做tiny,所以我們git clone的時候同時做了重命名操作:
git clone https://huggingface.co/Systran/faster-whisper-tiny tiny
上面的命令會在本地創(chuàng)建一個tiny的目錄棚品。目錄里面包含了faster-whisper-tiny的所有模型內容靠欢。
在MoneyPrinterPlus中配置faster-whisper
我們啟動MoneyPrinterPlus廊敌。
在基本配置區(qū)域:
[圖片上傳失敗...(image-18513d-1721790290171)]
可以配置本地語音識別模型。
model name就是你下載下來的模型名字门怪。
device type 可以選擇cpu骡澈,cuda或者auto。
compute type 支持'int8','int8_float16','float16'這幾種類型薪缆。
配置好之后秧廉,在AI視頻區(qū)域。
語音識別配置中我們選擇本地模型拣帽,即可使用到fasterWhisper了疼电。
[圖片上傳失敗...(image-333c09-1721790290171)]
同樣的在視頻混剪區(qū)域,我們也可以選擇本地模型减拭,即可使用到fasterWhisper了蔽豺。
總結
因為是本地運行的fasterWhisper,所以在運行中可能會出現(xiàn)一些環(huán)境的問題拧粪。大家可以參考fasterWhisper的說明來解決修陡。