kaldi和psf在Fbank上的區(qū)別

可以進(jìn)行Fbank特征提取的庫(kù)有兩個(gè):

一個(gè)是python_speech_features另一個(gè)是pytorch中的torchaudio

import python_speech_features as psf

import torchaudio as ta?

對(duì)應(yīng)的兩個(gè)函數(shù)分別是:

ta.compliance.kaldi.fbank

psf.base.logfbank

ta調(diào)用了kaldi中的特征提取模塊

kaldi 和 python_speech_features 生成fbank特征的不同地方在于以下幾點(diǎn):

轉(zhuǎn)自:https://zhuanlan.zhihu.com/p/55371926

1.預(yù)加重不同:

* kaldi是先加窗分幀戚宦,再對(duì)幀內(nèi)進(jìn)行預(yù)加重辙培;python_speech_features是全體先預(yù)加重,然后再分幀

* 再看預(yù)加重彼城,會(huì)發(fā)現(xiàn),對(duì)于音頻數(shù)據(jù)(譬如10,17,13,15, ...)第一個(gè)數(shù)據(jù)10退个,python_speech_features是不變(預(yù)加重系數(shù)0.97募壕,預(yù)加重后是 10,7.3,-3.489,2.39,...),kaldi是第一個(gè)數(shù)據(jù)也做預(yù)加重(預(yù)加重后是 0.3,7.3,-3.489,2.39,...)


2. 分幀數(shù)不同语盈,功率譜計(jì)算不同

python_speech_features 對(duì)最后還剩余的數(shù)據(jù)舱馅,不足幀長(zhǎng)的,按照一幀計(jì)算補(bǔ)齊刀荒;

kaldi 如果選擇不切斷最后剩余數(shù)據(jù)(snip-edged = False)代嗤,會(huì)發(fā)現(xiàn)多了一幀(個(gè)人認(rèn)為這里kaldi錯(cuò)了,python_speech_features正確)照棋;如果snip-edged = True资溃,兩者一致

功率譜計(jì)算不同:

python_speech_features 計(jì)算功率譜是:1.0/NFFT * numpy.square(magspec(frames,NFFT))

kaldi? 沒(méi)有乘1.0/NFFT


3. 梅爾濾波器組計(jì)算方法不同

kaldi是在梅爾坐標(biāo)轉(zhuǎn)換后的梅爾值域計(jì)算武翎,index是hz的定義域烈炭,通過(guò)梅爾轉(zhuǎn)換后比較(個(gè)人認(rèn)為計(jì)算量偏大,每次計(jì)算都要經(jīng)過(guò)一次轉(zhuǎn)換)宝恶;

而python_speech_features是先將linspace后的梅爾值統(tǒng)一轉(zhuǎn)成了hz符隙,再進(jìn)行計(jì)算,index也是hz的定義域垫毙,計(jì)算量小

其實(shí)上述兩種的本質(zhì)是一樣的霹疫,計(jì)算方法不同會(huì)導(dǎo)致系數(shù)存在差異



?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市综芥,隨后出現(xiàn)的幾起案子丽蝎,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 218,386評(píng)論 6 506
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件屠阻,死亡現(xiàn)場(chǎng)離奇詭異红省,居然都是意外死亡,警方通過(guò)查閱死者的電腦和手機(jī)国觉,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,142評(píng)論 3 394
  • 文/潘曉璐 我一進(jìn)店門吧恃,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái),“玉大人麻诀,你說(shuō)我怎么就攤上這事痕寓。” “怎么了蝇闭?”我有些...
    開封第一講書人閱讀 164,704評(píng)論 0 353
  • 文/不壞的土叔 我叫張陵呻率,是天一觀的道長(zhǎng)。 經(jīng)常有香客問(wèn)我呻引,道長(zhǎng)筷凤,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,702評(píng)論 1 294
  • 正文 為了忘掉前任苞七,我火速辦了婚禮藐守,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘蹂风。我一直安慰自己卢厂,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,716評(píng)論 6 392
  • 文/花漫 我一把揭開白布惠啄。 她就那樣靜靜地躺著慎恒,像睡著了一般。 火紅的嫁衣襯著肌膚如雪撵渡。 梳的紋絲不亂的頭發(fā)上融柬,一...
    開封第一講書人閱讀 51,573評(píng)論 1 305
  • 那天,我揣著相機(jī)與錄音趋距,去河邊找鬼粒氧。 笑死,一個(gè)胖子當(dāng)著我的面吹牛节腐,可吹牛的內(nèi)容都是我干的外盯。 我是一名探鬼主播,決...
    沈念sama閱讀 40,314評(píng)論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼翼雀,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼饱苟!你這毒婦竟也來(lái)了?” 一聲冷哼從身側(cè)響起狼渊,我...
    開封第一講書人閱讀 39,230評(píng)論 0 276
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤箱熬,失蹤者是張志新(化名)和其女友劉穎,沒(méi)想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體城须,經(jīng)...
    沈念sama閱讀 45,680評(píng)論 1 314
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡护锤,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,873評(píng)論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了酿傍。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片烙懦。...
    茶點(diǎn)故事閱讀 39,991評(píng)論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖赤炒,靈堂內(nèi)的尸體忽然破棺而出氯析,到底是詐尸還是另有隱情,我是刑警寧澤莺褒,帶...
    沈念sama閱讀 35,706評(píng)論 5 346
  • 正文 年R本政府宣布掩缓,位于F島的核電站,受9級(jí)特大地震影響遵岩,放射性物質(zhì)發(fā)生泄漏你辣。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,329評(píng)論 3 330
  • 文/蒙蒙 一尘执、第九天 我趴在偏房一處隱蔽的房頂上張望舍哄。 院中可真熱鬧,春花似錦誊锭、人聲如沸表悬。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,910評(píng)論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)蟆沫。三九已至,卻和暖如春温治,著一層夾襖步出監(jiān)牢的瞬間饭庞,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,038評(píng)論 1 270
  • 我被黑心中介騙來(lái)泰國(guó)打工熬荆, 沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留舟山,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 48,158評(píng)論 3 370
  • 正文 我出身青樓惶看,卻偏偏與公主長(zhǎng)得像捏顺,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子纬黎,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,941評(píng)論 2 355

推薦閱讀更多精彩內(nèi)容