文本轉(zhuǎn)語(yǔ)音橱脸,一般會(huì)用在無(wú)障礙開(kāi)發(fā)爸业。下面介紹如何使用Python實(shí)現(xiàn)將文本文件轉(zhuǎn)換成語(yǔ)音輸出掏婶。
[toc]
準(zhǔn)備
我測(cè)試使用的Python版本為2.7.10窒盐,如果你的版本是Python3.5的話草则,這里就不太適合了。
在windows上進(jìn)行測(cè)試的話蟹漓,這里有兩種可選的方式:
使用Speech API
原理
我們的想法是借助微軟的語(yǔ)音接口,所以我們肯定是要進(jìn)行<font color="red" size="5">調(diào)用</font> 相關(guān)的接口牧牢。所以我們需要安裝pywin32來(lái)幫助我們完成這一個(gè)底層的交互看锉。
示例代碼
import win32com.client
speaker = win32com.client.Dispatch("SAPI.SpVoice")
speaker.Speak("Hello, it works!")
小總結(jié)
是的,調(diào)用接口來(lái)實(shí)現(xiàn)語(yǔ)音功能就是這么簡(jiǎn)單塔鳍,但是我們不得不來(lái)聊一聊這種方式的缺點(diǎn)伯铣。
對(duì)中文支持的不夠好,僅僅是這一點(diǎn)轮纫,估計(jì)在中國(guó)沒(méi)幾個(gè)用它的了腔寡。
還有就是語(yǔ)速不能很好的控制,詳細(xì)的API介紹可以參照這里API參考
pyttsx方式
原理
pyttsx 是Python的一個(gè)關(guān)于文字轉(zhuǎn)語(yǔ)音方面的很不錯(cuò)的庫(kù)掌唾。我們還可以借助pyttsx來(lái)實(shí)現(xiàn)在線朗讀rfc文件或者本地文件等等放前,最為關(guān)鍵的是,它對(duì)中文支持的還是不錯(cuò)的糯彬。
示例代碼
# coding:utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf8')
# __author__ = '郭 璞'
# __date__ = '2016/8/6'
# __Desc__ = 文字轉(zhuǎn)語(yǔ)音輸出
import pyttsx
engine = pyttsx.init()
engine.say('hello world')
engine.say('你好凭语,郭璞')
engine.runAndWait()
# 朗讀一次
engine.endLoop()
小總結(jié)
使用pyttsx,我們可以借助其強(qiáng)大的API來(lái)實(shí)現(xiàn)我們基本的業(yè)務(wù)需求撩扒。很酷吧似扔。
pyttsx深入研究
做完上面的小實(shí)驗(yàn),你肯定會(huì)覺(jué)得怎么這么不過(guò)癮呢?
別擔(dān)心炒辉,下面我們就一起走進(jìn)pyttsx的世界豪墅,深入的研究一下其工作原理吧。
語(yǔ)音引擎工廠
類似于設(shè)計(jì)模式中的“工廠模式”黔寇,pyttsx通過(guò)初始化來(lái)獲取語(yǔ)音引擎偶器。當(dāng)我們第一次調(diào)用init操作的時(shí)候,會(huì)返回一個(gè)pyttsx的engine對(duì)象缝裤,再次調(diào)用的時(shí)候屏轰,如果存在engine對(duì)象實(shí)例,就會(huì)使用現(xiàn)有的倘是,否則再重新創(chuàng)建一個(gè)亭枷。
pyttsx.init([driverName : string, debug : bool]) → pyttsx.Engine
從方法聲明上來(lái)看袭艺,第一個(gè)參數(shù)指定的是語(yǔ)音驅(qū)動(dòng)的名稱搀崭,這個(gè)在底層適合操作系統(tǒng)密切相關(guān)的。如下:
-
drivename:由pyttsx.driver模塊根據(jù)操作系統(tǒng)類型來(lái)調(diào)用猾编,默認(rèn)使用當(dāng)前操作系統(tǒng)可以使用的最好的驅(qū)動(dòng)
- sapi5 - SAPI5 on Windows
- nsss - NSSpeechSynthesizer on Mac OS X
- espeak - eSpeak on every other platform
debug: 這第二個(gè)參數(shù)是指定要不要以調(diào)試狀態(tài)輸出瘤睹,建議開(kāi)發(fā)階段設(shè)置為True
引擎接口
要想很好的運(yùn)用一個(gè)庫(kù),不了解其API是不行的答倡。下面來(lái)看看pyttsx轰传。engine.Engine的引擎API。
| 方法簽名| 參數(shù)列表 |返回值|簡(jiǎn)單釋義|
|---|---|---|
|connect(topic : string, cb : callable)|topic:要描述的事件名稱瘪撇;cb:回調(diào)函數(shù) |→ dict|在給定的topic上添加回調(diào)通知|
|disconnect(token : dict)|token:回調(diào)失聯(lián)的返回標(biāo)記| Void| 結(jié)束連接|
|endLoop() |None|→ None|簡(jiǎn)單來(lái)說(shuō)就是結(jié)束事件循環(huán)|
|getProperty(name : string)|name有這些枚舉值“rate, vioce,vioces,volumn| → object|獲取當(dāng)前引擎實(shí)例的屬性值|
|setProperty(name : string)|name有這些枚舉值“rate, vioce,vioces,volumn| → object|設(shè)置當(dāng)前引擎實(shí)例的屬性值|
|say(text : unicode, name : string) | text:要進(jìn)行朗讀的文本數(shù)據(jù); name: 關(guān)聯(lián)發(fā)音人获茬,一般用不到|→ None| 預(yù)設(shè)要朗讀的文本數(shù)據(jù),這也是“萬(wàn)事俱備倔既,只欠東風(fēng)”中的“萬(wàn)事俱備”|
|runAndWait() |None|→ None|這個(gè)方法就是“東風(fēng)”了恕曲。當(dāng)事件隊(duì)列中事件全部清空的時(shí)候返回|
|startLoop([useDriverLoop : bool])|useDriverLoop:是否啟用驅(qū)動(dòng)循環(huán)| → None| 開(kāi)啟事件隊(duì)列|
元數(shù)據(jù)音調(diào)
在pyttsx.voice.Voice中,處理合成器的發(fā)音渤涌。
age
發(fā)音人的年齡佩谣,默認(rèn)為Nonegender
以字符串為類型的發(fā)音人性別: male, female, or neutral.默認(rèn)為Noneid
關(guān)于Voice的字符串確認(rèn)信息. 通過(guò) pyttsx.engine.Engine.setPropertyValue()來(lái)設(shè)置活動(dòng)發(fā)音簽名. 這個(gè)屬性總是被定義挑宠。languages
發(fā)音支持的語(yǔ)言列表虏劲,如果沒(méi)有,則為一個(gè)空的列表肤晓。name
發(fā)音人名稱安皱,默認(rèn)為None.
更多測(cè)試
朗讀文本
import pyttsx
engine = pyttsx.init()
engine.say('Sally sells seashells by the seashore.')
engine.say('The quick brown fox jumped over the lazy dog.')
engine.runAndWait()
事件監(jiān)聽(tīng)
import pyttsx
def onStart(name):
print 'starting', name
def onWord(name, location, length):
print 'word', name, location, length
def onEnd(name, completed):
print 'finishing', name, completed
engine = pyttsx.init()
engine.say('The quick brown fox jumped over the lazy dog.')
engine.runAndWait()
打斷發(fā)音
import pyttsx
def onWord(name, location, length):
print 'word', name, location, length
if location > 10:
engine.stop()
engine = pyttsx.init()
engine.say('The quick brown fox jumped over the lazy dog.')
engine.runAndWait()
更換發(fā)音人聲音
engine = pyttsx.init()
voices = engine.getProperty('voices')
for voice in voices:
engine.setProperty('voice', voice.id)
engine.say('The quick brown fox jumped over the lazy dog.')
engine.runAndWait()
語(yǔ)速控制
engine = pyttsx.init()
rate = engine.getProperty('rate')
engine.setProperty('rate', rate+50)
engine.say('The quick brown fox jumped over the lazy dog.')
engine.runAndWait()
音量控制
engine = pyttsx.init()
volume = engine.getProperty('volume')
engine.setProperty('volume', volume-0.25)
engine.say('The quick brown fox jumped over the lazy dog.')
engine.runAndWait()
執(zhí)行一個(gè)事件驅(qū)動(dòng)循環(huán)
engine = pyttsx.init()
def onStart(name):
print 'starting', name
def onWord(name, location, length):
print 'word', name, location, length
def onEnd(name, completed):
print 'finishing', name, completed
if name == 'fox':
engine.say('What a lazy dog!', 'dog')
elif name == 'dog':
engine.endLoop()
engine = pyttsx.init()
engine.say('The quick brown fox jumped over the lazy dog.', 'fox')
engine.startLoop()
使用一個(gè)外部的驅(qū)動(dòng)循環(huán)
engine = pyttsx.init()
engine.say('The quick brown fox jumped over the lazy dog.', 'fox')
engine.startLoop(False)
# engine.iterate() must be called inside externalLoop()
externalLoop()
engine.endLoop()
總結(jié)
看完了上面的講述调鬓,是不是感覺(jué)Python實(shí)現(xiàn)文本轉(zhuǎn)語(yǔ)音還是蠻簡(jiǎn)單的?
那么酌伊,快來(lái)嘗試嘗試吧袖迎。