FunClip是什么
FunClip是阿里達摩院推出的一款完全開源桂肌、本地部署的自動化視頻剪輯工具宪肖,通過調用阿里巴巴通義實驗室的FunASR Paraformer系列模型實現(xiàn)視頻的自動化語音識別。用戶可以根據(jù)識別結果濒生,選擇文本片段或特定說話人埋泵,快速裁剪出所需視頻片段。FunClip的特色包括集成高精度的中文ASR模型罪治、支持熱詞定制化丽声、說話人識別,以及提供Gradio交互界面觉义,使得視頻剪輯變得簡單方便恒序。此外,它還支持多段剪輯谁撼,并能自動生成SRT字幕文件歧胁。
FunClip的主要功能
自動化語音識別:利用阿里巴巴通義實驗室的FunASR Paraformer系列模型滋饲,對視頻進行語音識別,將語音轉換成文字喊巍。
熱詞定制化:通過集成的SeACo-Paraformer模型屠缭,用戶可以指定一些實體詞、人名等作為熱詞崭参,以提升特定詞匯的識別準確率呵曹。
說話人識別:集成CAM++說話人識別模型,允許用戶根據(jù)自動識別的說話人ID裁剪出特定說話人的視頻段落何暮。
視頻裁剪:用戶可以選擇識別結果中的文本片段或指定說話人奄喂,通過點擊裁剪按鈕獲取對應視頻片段。
Gradio交互界面:通過Gradio實現(xiàn)的交互界面海洼,簡化了視頻剪輯的操作流程跨新,用戶可以在服務端搭建服務并通過瀏覽器進行剪輯。
多段剪輯支持:FunClip支持用戶對視頻進行多段剪輯坏逢,提供了靈活的編輯能力域帐。
自動生成字幕:剪輯后的視頻可以自動生成全視頻和目標段落的SRT字幕文件,方便用戶添加或編輯字幕是整。
命令行調用:除了圖形界面肖揣,F(xiàn)unClip還支持通過命令行進行視頻識別和裁剪,提供了更靈活的使用方式浮入。
如何使用FunClip
準確識別龙优,自由復制所需段落,或者設置說話人標識事秀,一鍵裁剪彤断、添加字幕
Step1: 上傳視頻或音頻文件(或使用下方的用例體驗),點擊 識別 按鈕
Step2: 復制識別結果中所需的文字至右上方秽晚,或者右設置說話人標識瓦糟,設置偏移與字幕配置(可選)
Step3: 點擊 裁剪 按鈕或 裁剪并添加字幕 按鈕獲得結果
注:裁剪并添加字幕?功能需要手動安裝imageMagick
下載后,默認路徑安裝就可以了赴蝇,就是一直點下一步菩浙。