語音合成效果優(yōu)化

語音合成技術已經成熟的應用于各種實際場景中朗和,大部分問題可以通過TTS解決嚷硫,但是有些問題,在具體的場景中症革,總會出現(xiàn)一些合成音頻播報時的錯誤筐咧,所以在設計語音合成產品時,應該怎么樣避免這些問題噪矛,以及用怎樣的方式進行優(yōu)化量蕊。以下將根據實際問題分析具體的解決方案。


1. 數(shù)字播報問題

我們遇到比較多的是數(shù)字播報的問題摩疑,數(shù)字有很多不同的播報方式危融,可以按照數(shù)目讀法,例如雷袋,1234可以讀作“一千二百三十四”,也可以按照數(shù)字串的讀法辞居,讀作“一二三四”楷怒,以及電報讀法“幺兩三四”,所以不同的場景有不同的讀法瓦灶,需要在當前場景設置具體的讀法方式鸠删,具體方式如下:

1) ? 讀法規(guī)則設置

在TTS中,有些讀法是可以添加的讀法規(guī)則中的贼陶,例如:“請問您是尾號為4321的機主嗎刃泡?”可以添加“尾號為+數(shù)字”的讀法規(guī)則,讓數(shù)字按照數(shù)字串的方式播報碉怔。還有“數(shù)字+元”“數(shù)字+美元”等烘贴,這種就按照數(shù)目讀法的方式播報。所以在生活場景有一些場景的讀法是唯一的撮胧,可以通過設置讀法規(guī)則的方式桨踪,使得在TTS播報的時候播報正確。

2) ? 修改文本的方式

在一些場景中芹啥,會出現(xiàn)TTS播報錯誤的情況锻离,例如,“請您來一下205會議室”墓怀,有時候會播報成“二百零五會議室”汽纠,這時候可以在文本的數(shù)字前面加一個標點來規(guī)定讀法,比如 “!+數(shù)字”傀履,就按照數(shù)字串的方式播報數(shù)字虱朵。“請您來一下!205會議室”,則可以播報為“二零五會議室”卧秘;“*+數(shù)字”的規(guī)則就按照數(shù)目讀法來播報呢袱,“我住在*20層”,則播報為“二十層”翅敌。所以根據符號+數(shù)字的方式來確保數(shù)字的讀法羞福,在實際應用場景中,如果某些數(shù)字播報方式錯誤蚯涮,則可以通過修改文本添加符號的方式解決問題治专,這種方式也相對比較簡單。

3)? 標記語言的方式

語音合成標記語言(SSML:Speech Synthesis Markup Language)遭顶,它是W3C的語音接口框架的一部分张峰,是關于語音應用和在萬維網上構建語音應用的一套規(guī)范,通過SSML棒旗,人們可以更多的通過移動電話喘批、桌面計算機和其他設備來聆聽合成語音。通過標記語言可以設置數(shù)字的讀法铣揉,然后將xml格式的標記語言文本傳入給TTS饶深,合成相應的音頻。

下面是ssml的語法圖


4)? 加詞表

有些使用場景修改文本內容不太方便逛拱,例如用戶寫的地址信息敌厘,然后直接傳輸給TTS進行語音合成,這種文本內容不能進行添加修改朽合,需要在文本上傳之后修改播報的音頻俱两,在前一篇文章講到過語言分析部分,在文本轉音素時曹步,可以檢測出對應的文本內容宪彩,文本的音頻強制轉換為需要正確播報的拼音,設置成想要合成的播報音箭窜,這樣可以使音頻播報正確且不需要修改文本毯焕。但是這樣在每次合成的時候都會按照這種設置好的規(guī)則合成,所以在設置的時候盡量確保文本的唯一性磺樱,可以用“文本+數(shù)字+文本”的形式纳猫,這樣其他場景用到同樣的數(shù)字時,不會受到此次設置的影響竹捉。


如下列出了在實際應該場景中芜辕,數(shù)字會出現(xiàn)的一些播報方式。


數(shù)目讀法

數(shù)字串讀法

地址

2. 多音字問題

在漢語中块差,多音字和數(shù)字的讀法一樣侵续,有多種播報讀法倔丈,這時候也需要一些優(yōu)化的方式設置,使其在特定的場景下按照特定的讀音去讀状蜗,確保能正確的播報需五。優(yōu)化的方式和數(shù)字的優(yōu)化方式基本是一致的,可以通過設置讀法規(guī)則轧坎,修改文本宏邮,標記語言,加詞表的方式缸血。通過組合這幾種方式蜜氨,可以避免常見的播報讀法的問題。在產品設計的時候捎泻,需要支持這幾種優(yōu)化方式飒炎,且操作簡單,用戶可以自行操作笆豁,完成TTS的優(yōu)化郎汪。

如下列出多音字姓氏列表,姓氏可以用特定的規(guī)則或者用添加標點的形式渔呵,確保其正確的播報怒竿。

3. 小結

??? 簡單介紹了一些播報錯誤的優(yōu)化方式,還有一些韻律也可以用上面提到的優(yōu)化方式進行優(yōu)化扩氢,例如停頓,重讀等一些節(jié)奏韻律的變化爷辱,可以用加標點的方式录豺,標記語言的方式實現(xiàn)。也可以通過算法優(yōu)化饭弓,但是算法優(yōu)化時間久双饥,難度大。所以可以在產品設計的時候加一些可以優(yōu)化的功能弟断,這樣可以規(guī)避掉一些播報錯誤咏花,也不需要從底層算法在進行優(yōu)化,用戶易操作阀趴,提高用戶體驗昏翰。

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市刘急,隨后出現(xiàn)的幾起案子棚菊,更是在濱河造成了極大的恐慌,老刑警劉巖叔汁,帶你破解...
    沈念sama閱讀 211,194評論 6 490
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件统求,死亡現(xiàn)場離奇詭異检碗,居然都是意外死亡,警方通過查閱死者的電腦和手機码邻,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 90,058評論 2 385
  • 文/潘曉璐 我一進店門折剃,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人像屋,你說我怎么就攤上這事怕犁。” “怎么了开睡?”我有些...
    開封第一講書人閱讀 156,780評論 0 346
  • 文/不壞的土叔 我叫張陵因苹,是天一觀的道長。 經常有香客問我篇恒,道長扶檐,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 56,388評論 1 283
  • 正文 為了忘掉前任胁艰,我火速辦了婚禮款筑,結果婚禮上,老公的妹妹穿的比我還像新娘腾么。我一直安慰自己奈梳,他們只是感情好,可當我...
    茶點故事閱讀 65,430評論 5 384
  • 文/花漫 我一把揭開白布解虱。 她就那樣靜靜地躺著攘须,像睡著了一般。 火紅的嫁衣襯著肌膚如雪殴泰。 梳的紋絲不亂的頭發(fā)上于宙,一...
    開封第一講書人閱讀 49,764評論 1 290
  • 那天飘蚯,我揣著相機與錄音嘁锯,去河邊找鬼菲盾。 笑死山析,一個胖子當著我的面吹牛犬辰,可吹牛的內容都是我干的阶牍。 我是一名探鬼主播笙纤,決...
    沈念sama閱讀 38,907評論 3 406
  • 文/蒼蘭香墨 我猛地睜開眼啄骇,長吁一口氣:“原來是場噩夢啊……” “哼宵蛀!你這毒婦竟也來了昆著?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 37,679評論 0 266
  • 序言:老撾萬榮一對情侶失蹤糖埋,失蹤者是張志新(化名)和其女友劉穎宣吱,沒想到半個月后,有當?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體瞳别,經...
    沈念sama閱讀 44,122評論 1 303
  • 正文 獨居荒郊野嶺守林人離奇死亡征候,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 36,459評論 2 325
  • 正文 我和宋清朗相戀三年杭攻,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片疤坝。...
    茶點故事閱讀 38,605評論 1 340
  • 序言:一個原本活蹦亂跳的男人離奇死亡兆解,死狀恐怖,靈堂內的尸體忽然破棺而出跑揉,到底是詐尸還是另有隱情锅睛,我是刑警寧澤,帶...
    沈念sama閱讀 34,270評論 4 329
  • 正文 年R本政府宣布历谍,位于F島的核電站现拒,受9級特大地震影響,放射性物質發(fā)生泄漏望侈。R本人自食惡果不足惜印蔬,卻給世界環(huán)境...
    茶點故事閱讀 39,867評論 3 312
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望脱衙。 院中可真熱鬧侥猬,春花似錦、人聲如沸捐韩。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,734評論 0 21
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽荤胁。三九已至瞧预,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間仅政,已是汗流浹背松蒜。 一陣腳步聲響...
    開封第一講書人閱讀 31,961評論 1 265
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留已旧,地道東北人。 一個月前我還...
    沈念sama閱讀 46,297評論 2 360
  • 正文 我出身青樓召娜,卻偏偏與公主長得像运褪,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子玖瘸,可洞房花燭夜當晚...
    茶點故事閱讀 43,472評論 2 348

推薦閱讀更多精彩內容