感覺(jué)很久沒(méi)寫中文技術(shù)文章了棒坏。說(shuō)實(shí)話蚜迅,學(xué)東西都是基于英文,或者 別人從英文翻譯成中文 我們?cè)?code>撿二手貨學(xué)習(xí)俊抵。所以用中文寫技術(shù)文章怎么都感覺(jué)是在騙人
谁不,怎么都覺(jué)得很別扭
。
但是這一次的主角是百度徽诲。
雖然認(rèn)真來(lái)講刹帕,所有編程語(yǔ)言、框架谎替、核心技術(shù)都是外國(guó)人寫的(開源
)偷溺,但似乎你拼湊一下,仍可以貼上國(guó)產(chǎn)的標(biāo)簽(這個(gè)就相當(dāng)于零件不是我做的钱贯,但我用它拼出了一件產(chǎn)品挫掏,產(chǎn)品是我的)。
而且又加上這個(gè) API 是免費(fèi)的秩命,所以我可以介紹一下尉共。(最近幾年百度為了拿錢換名氣
褒傅,在海外還是做了不少工作,比如建立了 Twitter袄友、Github 賬戶殿托,成立了 AI研究室,開源了一些項(xiàng)目)
我這個(gè)人不喜歡講廢話:
# Author: yingshaoxo
#### For baidu voice
from aip import AipSpeech
APP_ID = '15311704'
API_KEY = 'yTzBl40WBlhFOo1GnKk0YQTN'
SECRET_KEY = 'xpWedO1u0ZLATHijhetFo7dE5ibMsI6Q'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
def get_text(wav_bytes):
result = client.asr(wav_bytes, 'wav', 16000, {'dev_pid': 1536,})
try:
text = result['result'][0]
except Exception as e:
print(e)
text = ""
return text
#### For real time voice recording
import speech_recognition as sr
r = sr.Recognizer()
mic = sr.Microphone()
while 1:
print("\nPlease try to speak something...")
with mic as source:
r.adjust_for_ambient_noise(source)
audio = r.listen(source)
audio_data = audio.get_wav_data(convert_rate=16000)
print("\nGot you, now I'm trying to recognize that...")
text = get_text(audio_data)
print(f"\n{text}")