日常前言
項(xiàng)目教程目錄:https://blog.csdn.net/qq_41082014/article/details/86605663
既然我們有了錄音文件桐款,那么接下來(lái)的事便是要交給語(yǔ)音識(shí)別了假哎。本章介紹百度和訊飛的語(yǔ)音識(shí)別的python調(diào)用方法俄周,以及到底誰(shuí)更好
百度語(yǔ)音識(shí)別
from aip import AipSpeech
APP_ID = 'xxxxxxxx'
API_KEY = 'xxxxxxxx'
SECRET_KEY = 'xxxxxxxx'
#init login
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
# 讀取文件
def get_file_content(filePath):
with open(filePath, 'rb') as fp:
return fp.read()
text = client.asr(get_file_content(filePath), 'wav', 16000, {'lan': 'zh',})
print(text)
訊飛語(yǔ)音識(shí)別
訊飛對(duì)自然語(yǔ)言方面處理的口碑應(yīng)該是國(guó)內(nèi)比較好的了崎弃,但是把文件交給他中間需要的處理步驟太多了想括,這里就直接先給一個(gè)能用的例子好了
import urllib.parse, urllib.request
import time
import json
import hashlib
import base64
url = 'http://api.xfyun.cn/v1/service/v1/iat'
api_key = 'xxxxxxxxxx'
x_appid = 'xxxxxxxxxx'
def shibie(file):
f = open(file, 'rb')
file_content = f.read()
base64_audio = base64.b64encode(file_content)
body = urllib.parse.urlencode({'audio': base64_audio})
param = {"engine_type": "sms16k", "aue": "raw"}
x_time = int(int(round(time.time() * 1000)) / 1000)
x_param = base64.b64encode(json.dumps(param).replace(' ', '').encode('utf-8'))
x_checksum_content = api_key + str(x_time) + str(x_param, 'utf-8')
x_checksum = hashlib.md5(x_checksum_content.encode('utf-8')).hexdigest()
x_header = {'X-Appid': x_appid,
'X-CurTime': x_time,
'X-Param': x_param,
'X-CheckSum': x_checksum}
req = urllib.request.Request(url = url, data = body.encode('utf-8'), headers = x_header, method = 'POST')
result = urllib.request.urlopen(req)
result = result.read().decode('utf-8')
result = json.loads(result)
return result
那么到底哪一個(gè)更好呢儡陨?
- 結(jié)構(gòu):
- 明顯看得出司致,百度要簡(jiǎn)單清晰很多(誰(shuí)讓訊飛不做pip的庫(kù)呢(?Д?*)?)
- 識(shí)別能力:
- 多次實(shí)驗(yàn)中煞躬,發(fā)現(xiàn)肛鹏,百度似乎還要更好一些逸邦,,龄坪,昭雌,
- 速度上:
- 不用說(shuō),百度這個(gè)家伙肯定是最快的了健田,相信很多人都知道烛卧,什么不懂,百度一下妓局!百度肯定是要保持速度的总放,而且大多數(shù)的網(wǎng)絡(luò)對(duì)百度是很開(kāi)放的,比我我在學(xué)校好爬,需要認(rèn)證上網(wǎng)局雄,但是不認(rèn)證也可以訪問(wèn)百度首頁(yè)
-
從圖中可以看到,百度的反應(yīng)速度基本等于瞬間存炮,即使是長(zhǎng)段的識(shí)別炬搭,也毫不遜色,甚至比訊飛更準(zhǔn)確些穆桂,比如斷句方面宫盔。一般來(lái)說(shuō),超過(guò)2s的反應(yīng)享完,也就是使用訊飛的時(shí)候灼芭,人們就會(huì)認(rèn)為他很low,比如我旁邊的同學(xué).........
So般又,當(dāng)然選擇百度啦彼绷!
本文作者: Messy
原文鏈接:https://www.messys.top/detail/19
版權(quán)聲明: 本博客所有文章除特別聲明外, 均采用 CC BY-NC-SA 4.0 許可協(xié)議. 轉(zhuǎn)載請(qǐng)注明出處!