語音合成技術已經成熟的應用于各種實際場景中朗和,大部分問題可以通過TTS解決嚷硫,但是有些問題,在具體的場景中症革,總會出現(xiàn)一些合成音頻播報時的錯誤筐咧,所以在設計語音合成產品時,應該怎么樣避免這些問題噪矛,以及用怎樣的方式進行優(yōu)化量蕊。以下將根據實際問題分析具體的解決方案。
1. 數(shù)字播報問題
我們遇到比較多的是數(shù)字播報的問題摩疑,數(shù)字有很多不同的播報方式危融,可以按照數(shù)目讀法,例如雷袋,1234可以讀作“一千二百三十四”,也可以按照數(shù)字串的讀法辞居,讀作“一二三四”楷怒,以及電報讀法“幺兩三四”,所以不同的場景有不同的讀法瓦灶,需要在當前場景設置具體的讀法方式鸠删,具體方式如下:
1) ? 讀法規(guī)則設置
在TTS中,有些讀法是可以添加的讀法規(guī)則中的贼陶,例如:“請問您是尾號為4321的機主嗎刃泡?”可以添加“尾號為+數(shù)字”的讀法規(guī)則,讓數(shù)字按照數(shù)字串的方式播報碉怔。還有“數(shù)字+元”“數(shù)字+美元”等烘贴,這種就按照數(shù)目讀法的方式播報。所以在生活場景有一些場景的讀法是唯一的撮胧,可以通過設置讀法規(guī)則的方式桨踪,使得在TTS播報的時候播報正確。
2) ? 修改文本的方式
在一些場景中芹啥,會出現(xiàn)TTS播報錯誤的情況锻离,例如,“請您來一下205會議室”墓怀,有時候會播報成“二百零五會議室”汽纠,這時候可以在文本的數(shù)字前面加一個標點來規(guī)定讀法,比如 “!+數(shù)字”傀履,就按照數(shù)字串的方式播報數(shù)字虱朵。“請您來一下!205會議室”,則可以播報為“二零五會議室”卧秘;“*+數(shù)字”的規(guī)則就按照數(shù)目讀法來播報呢袱,“我住在*20層”,則播報為“二十層”翅敌。所以根據符號+數(shù)字的方式來確保數(shù)字的讀法羞福,在實際應用場景中,如果某些數(shù)字播報方式錯誤蚯涮,則可以通過修改文本添加符號的方式解決問題治专,這種方式也相對比較簡單。
3)? 標記語言的方式
語音合成標記語言(SSML:Speech Synthesis Markup Language)遭顶,它是W3C的語音接口框架的一部分张峰,是關于語音應用和在萬維網上構建語音應用的一套規(guī)范,通過SSML棒旗,人們可以更多的通過移動電話喘批、桌面計算機和其他設備來聆聽合成語音。通過標記語言可以設置數(shù)字的讀法铣揉,然后將xml格式的標記語言文本傳入給TTS饶深,合成相應的音頻。
下面是ssml的語法圖
4)? 加詞表
有些使用場景修改文本內容不太方便逛拱,例如用戶寫的地址信息敌厘,然后直接傳輸給TTS進行語音合成,這種文本內容不能進行添加修改朽合,需要在文本上傳之后修改播報的音頻俱两,在前一篇文章講到過語言分析部分,在文本轉音素時曹步,可以檢測出對應的文本內容宪彩,文本的音頻強制轉換為需要正確播報的拼音,設置成想要合成的播報音箭窜,這樣可以使音頻播報正確且不需要修改文本毯焕。但是這樣在每次合成的時候都會按照這種設置好的規(guī)則合成,所以在設置的時候盡量確保文本的唯一性磺樱,可以用“文本+數(shù)字+文本”的形式纳猫,這樣其他場景用到同樣的數(shù)字時,不會受到此次設置的影響竹捉。
如下列出了在實際應該場景中芜辕,數(shù)字會出現(xiàn)的一些播報方式。
數(shù)目讀法
數(shù)字串讀法
地址
2. 多音字問題
在漢語中块差,多音字和數(shù)字的讀法一樣侵续,有多種播報讀法倔丈,這時候也需要一些優(yōu)化的方式設置,使其在特定的場景下按照特定的讀音去讀状蜗,確保能正確的播報需五。優(yōu)化的方式和數(shù)字的優(yōu)化方式基本是一致的,可以通過設置讀法規(guī)則轧坎,修改文本宏邮,標記語言,加詞表的方式缸血。通過組合這幾種方式蜜氨,可以避免常見的播報讀法的問題。在產品設計的時候捎泻,需要支持這幾種優(yōu)化方式飒炎,且操作簡單,用戶可以自行操作笆豁,完成TTS的優(yōu)化郎汪。
如下列出多音字姓氏列表,姓氏可以用特定的規(guī)則或者用添加標點的形式渔呵,確保其正確的播報怒竿。
3. 小結
??? 簡單介紹了一些播報錯誤的優(yōu)化方式,還有一些韻律也可以用上面提到的優(yōu)化方式進行優(yōu)化扩氢,例如停頓,重讀等一些節(jié)奏韻律的變化爷辱,可以用加標點的方式录豺,標記語言的方式實現(xiàn)。也可以通過算法優(yōu)化饭弓,但是算法優(yōu)化時間久双饥,難度大。所以可以在產品設計的時候加一些可以優(yōu)化的功能弟断,這樣可以規(guī)避掉一些播報錯誤咏花,也不需要從底層算法在進行優(yōu)化,用戶易操作阀趴,提高用戶體驗昏翰。