librosa 音頻處理庫(kù)

名詞解釋

名稱	含義
sr(sample_rate)	采樣率,表示一秒采樣多少個(gè)樣本點(diǎn)
hop_length	步幅;幀移對(duì)應(yīng)卷積中的stride;連續(xù)幀分割長(zhǎng)度
overlapping	連續(xù)兩幀的重疊部分
n_fft	窗口大小闸翅；n_fft = hop_length+overlapping
spectrum	光譜碑韵，頻譜
spectrogram:	光譜圖；聲譜圖
Chromagram	色譜圖
Scaleogram
magnitude spectrogram
amplitude	振幅
logarithmic amplitude-frequency	對(duì)數(shù)振幅頻譜圖
mono	單聲道
stereo	立體聲
constant-Q transform (cqt)
pitch	音高
timbral	音色

cqt特征捕獲音高缎脾，mfcc捕獲音色

音頻處理的流程

音頻分幀
通過(guò)使用窗口函數(shù)將長(zhǎng)短不一的音頻分割成大小相同的音頻片段祝闻。(默認(rèn)采樣率22050Hz)
一般有兩種描述方式：
方式一：(幀描述方式)使用2048((20481000ms)/22050=93ms)個(gè)采樣點(diǎn)，前后兩個(gè)窗的重疊5123采樣點(diǎn)遗菠。
方式二：(時(shí)間描述方式)使用 93ms 的幀長(zhǎng)联喘、23ms 的幀移(hop_length)，以及周期性的 Hann 窗口對(duì)語(yǔ)音進(jìn)行分幀辙纬。
例如：下面的圖通過(guò)一個(gè)滑動(dòng)窗口將一個(gè)音頻分割成6個(gè)等成的音頻片段豁遭。

image.png

#這是一個(gè)窗口大小為window_size，連續(xù)窗口的重疊部分為window_size/2
def windows(audio, window_size):
    start = 0
    while start < len(audio):
        #len(audio)是一個(gè)音頻文件的總樣本點(diǎn)數(shù)贺拣。
        yield start, start + window_size #取出長(zhǎng)度為window_size的樣本點(diǎn)下標(biāo)索引
        start += (window_size / 2) #計(jì)算下一個(gè)分割片段的起始位置

計(jì)算每一幀mel聲譜圖蓖谢。

signal = audio[0,2048] #(audio[0,2048] 表示圖中的分割的1片段
#下面一行計(jì)算分割片段audio[0,2048]的64階mel譜
#sr表示采樣率,表示一秒采樣多少個(gè)樣本點(diǎn)。
#n_fft表示短時(shí)傅里葉變化用到的連續(xù)的樣本點(diǎn)個(gè)數(shù)
#hop_length:連續(xù)兩個(gè)傅里葉變化的重疊樣本點(diǎn)個(gè)數(shù)
melspec = librosa.feature.melspectrogram(signal, sr=22050,
                                    n_fft=2048, 
                                    hop_length=512, 
                                    n_mels = 64) 
logspec = librosa.logamplitude(melspec)#計(jì)算log mel

輸出：

#本代碼計(jì)算將一個(gè)原始音頻文件分割成等大小的片段譬涡，
#然后計(jì)算每一個(gè)片段的og mel_sepctrogram.
for (start,end) in windows(audio,window_size):
              #(1)此處是為了是將大小不一樣的音頻文件用大小window_size闪幽，
              #stride=window_size/2的窗口，分割為等大小的時(shí)間片段涡匀。
              #(2)計(jì)算每一個(gè)分割片段的log mel_sepctrogram.
                if(end<= len(audio)): #最后不夠一個(gè)窗口的樣本點(diǎn)舍去
                    signal = audio[start:end] #分割的音頻幀(圖中的1盯腌，2，3陨瘩，4腕够，5级乍，6)
                    melspec = librosa.feature.melspectrogram(signal, n_mels = 64) #計(jì)算每個(gè)分割片段的mel譜
                    logspec = librosa.logamplitude(melspec)#計(jì)算log mel 譜

參考教材：

Urban Sound Classification Part 1 Part 2
Karol J. Piczak github
如何使用TensorFlow實(shí)現(xiàn)音頻分類任務(wù) 教材

LibROSA

LibROSA is a python package for music and audio analysis. It provides the building blocks necessary to create music information retrieval systems.

這個(gè)過(guò)程對(duì)應(yīng)計(jì)算信號(hào)s(t)的
short-time Fourier transform magnitude平方。窗口大小w. spectrogram(t,w) = |STFT(t,w)|**2帚湘∶等伲可以理解為譜是傅里葉變換的平方。

計(jì)算log mel-spectrogram
y 與 S只需提供一個(gè)大诸。y是讀入的音頻文件崇决，S是音頻的譜
n_fft:STFT window size
hop_length : STFT hop length

melspec = melspectrogram(y=None, sr=22050, S=None, n_fft=2048, hop_length=512, power=2.0, **kwargs):
 logspec = librosa.logamplitude(melspec)

def windows(data, window_size):
    start = 0
    while start < len(data):
        yield start, start + window_size
        start += (window_size / 2)

def extract_features(parent_dir,sub_dirs,file_ext="*.wav",bands = 60, frames = 41):
    window_size = 512 * (frames - 1)
    log_specgrams = []
    labels = []
    for l, sub_dir in enumerate(sub_dirs):
        for fn in glob.glob(os.path.join(parent_dir, sub_dir, file_ext)): 
            sound_clip,s = librosa.load(fn)
            label = fn.split('/')[2].split('-')[1]
            for (start,end) in windows(sound_clip,window_size):
              #(1)此處是為了是將大小不一樣的音頻文件用大小window_size，
              #stride=window_size/2的窗口底挫，分割為等大小的時(shí)間片段恒傻。
              #(2)計(jì)算每一個(gè)分割片段的log mel_sepctrogram.
              #或者，先分別計(jì)算大小不一的音頻的log mel_spectrogram,在通過(guò)固定的窗口建邓，
              #切割等大小的頻譜圖盈厘。
                if(len(sound_clip[start:end]) == window_size):
                    signal = sound_clip[start:end]
                    melspec = librosa.feature.melspectrogram(signal, n_mels = bands)
                    logspec = librosa.logamplitude(melspec)
                    logspec = logspec.T.flatten()[:, np.newaxis].T
                    log_specgrams.append(logspec)
                    labels.append(label)

最后編輯于：2017.12.17 16:45:53

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者

人面猴
序言：七十年代末，一起剝皮案震驚了整個(gè)濱河市官边，隨后出現(xiàn)的幾起案子沸手，更是在濱河造成了極大的恐慌，老刑警劉巖注簿，帶你破解...
沈念sama閱讀 211,376評(píng)論 6贊 491
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件契吉，死亡現(xiàn)場(chǎng)離奇詭異，居然都是意外死亡诡渴，警方通過(guò)查閱死者的電腦和手機(jī)捐晶，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 90,126評(píng)論 2贊 385
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門(mén)，熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)妄辩，“玉大人惑灵，你說(shuō)我怎么就攤上這事⊙垡” “怎么了英支？”我有些...
開(kāi)封第一講書(shū)人閱讀 156,966評(píng)論 0贊 347
道士緝兇錄：失蹤的賣(mài)姜人
文/不壞的土叔我叫張陵，是天一觀的道長(zhǎng)哮伟。經(jīng)常有香客問(wèn)我干花，道長(zhǎng)，這世上最難降的妖魔是什么楞黄？我笑而不...
開(kāi)封第一講書(shū)人閱讀 56,432評(píng)論 1贊 283
?港島之戀（遺憾婚禮）
正文為了忘掉前任池凄，我火速辦了婚禮，結(jié)果婚禮上谅辣，老公的妹妹穿的比我還像新娘修赞。我一直安慰自己，他們只是感情好桑阶，可當(dāng)我...
茶點(diǎn)故事閱讀 65,519評(píng)論 6贊 385
惡毒庶女頂嫁案：這布局不是一般人想出來(lái)的
文/花漫我一把揭開(kāi)白布柏副。她就那樣靜靜地躺著，像睡著了一般蚣录。火紅的嫁衣襯著肌膚如雪割择。梳的紋絲不亂的頭發(fā)上，一...
開(kāi)封第一講書(shū)人閱讀 49,792評(píng)論 1贊 290
城市分裂傳說(shuō)
那天萎河，我揣著相機(jī)與錄音荔泳，去河邊找鬼。笑死虐杯，一個(gè)胖子當(dāng)著我的面吹牛玛歌，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播擎椰，決...
沈念sama閱讀 38,933評(píng)論 3贊 406
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開(kāi)眼支子，長(zhǎng)吁一口氣：“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼！你這毒婦竟也來(lái)了达舒？” 一聲冷哼從身側(cè)響起值朋，我...
開(kāi)封第一講書(shū)人閱讀 37,701評(píng)論 0贊 266
萬(wàn)榮殺人案實(shí)錄
序言：老撾萬(wàn)榮一對(duì)情侶失蹤，失蹤者是張志新（化名）和其女友劉穎巩搏，沒(méi)想到半個(gè)月后昨登，有當(dāng)?shù)厝嗽跇?shù)林里發(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 44,143評(píng)論 1贊 303
?護(hù)林員之死
正文獨(dú)居荒郊野嶺守林人離奇死亡贯底，尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點(diǎn)故事閱讀 36,488評(píng)論 2贊 327
?白月光啟示錄
正文我和宋清朗相戀三年丰辣，在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片禽捆。...
茶點(diǎn)故事閱讀 38,626評(píng)論 1贊 340
活死人
序言：一個(gè)原本活蹦亂跳的男人離奇死亡糯俗，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出睦擂，到底是詐尸還是另有隱情得湘，我是刑警寧澤，帶...
沈念sama閱讀 34,292評(píng)論 4贊 329
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布顿仇，位于F島的核電站淘正，受9級(jí)特大地震影響，放射性物質(zhì)發(fā)生泄漏臼闻。R本人自食惡果不足惜鸿吆，卻給世界環(huán)境...
茶點(diǎn)故事閱讀 39,896評(píng)論 3贊 313
男人毒藥：我在死后第九天來(lái)索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望述呐。院中可真熱鬧惩淳，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開(kāi)封第一講書(shū)人閱讀 30,742評(píng)論 0贊 21
一樁弒父案代虾，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽(yáng)。三九已至激蹲，卻和暖如春棉磨，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背学辱。一陣腳步聲響...
開(kāi)封第一講書(shū)人閱讀 31,977評(píng)論 1贊 265
情欲美人皮
我被黑心中介騙來(lái)泰國(guó)打工乘瓤，沒(méi)想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留，地道東北人策泣。一個(gè)月前我還...
沈念sama閱讀 46,324評(píng)論 2贊 360
代替公主和親
正文我出身青樓衙傀，卻偏偏與公主長(zhǎng)得像，于是被迫代替她去往敵國(guó)和親萨咕。傳聞我的和親對(duì)象是個(gè)殘疾皇子统抬，可洞房花燭夜當(dāng)晚...
茶點(diǎn)故事閱讀 43,494評(píng)論 2贊 348