麥克風(fēng)陣列與波束形成
麥克風(fēng)陣列是指由兩個(gè)或者多個(gè)麥克風(fēng)按照一定的幾何結(jié)構(gòu)排列而成的陣列落追,按照拓?fù)浣Y(jié)構(gòu)不同,麥克風(fēng)陣列可以分為均勻線性陣列涯肩,非均勻線性陣列轿钠,非線性陣列,環(huán)形陣列病苗,二維(平面)陣列疗垛,三維(立體)陣列等等
對(duì)各陣元上的信號(hào)進(jìn)行濾波,再相加起來(lái)就是簡(jiǎn)單的波束形成硫朦,
聲源定位算法大致分為三類(lèi):基于可控波束形成器的聲源定位算法(基于最大輸出功率的可控波束形成技術(shù))贷腕、基于到達(dá)時(shí)間差的聲源定位算法(TDOA)、基于高分辨率譜估計(jì)的聲源定位算法。
(1)基于最大輸出功率的可控波束形成技術(shù)
該方法對(duì)麥克風(fēng)所接收到的聲源信號(hào)濾波并加權(quán)求和來(lái)形成波束泽裳,進(jìn)而通過(guò)搜索聲源可能的位置來(lái)引導(dǎo)該波束瞒斩,最終使波束輸出功率最大的點(diǎn)就是聲源的位置
延遲和波束形成法DSB(delay-and-sum beamforming)
該方法對(duì)麥克風(fēng)信號(hào)采用時(shí)間移位以補(bǔ)償聲源到麥克風(fēng)的傳播延時(shí),并通過(guò)相加求平均來(lái)獲取陣列的輸出涮总,但是DSB形成的波束其主瓣的寬度與信號(hào)的頻率相關(guān)胸囱,這在目標(biāo)聲源偏離波束最大增益方向時(shí)會(huì)引起語(yǔ)音的失真。
濾波和波束形成FSB(filter-and-sum beamforming)
該方法在DSB進(jìn)行時(shí)間校正的同時(shí)瀑梗,還對(duì)信號(hào)進(jìn)行了濾波烹笔,通過(guò)一定長(zhǎng)度的FIR濾波器來(lái)實(shí)現(xiàn)頻率不變的空間響應(yīng)特性,也稱(chēng)恒定指向波束形成(CDB)抛丽,但是通常需要大數(shù)量的麥克風(fēng)才能達(dá)到較好的消噪效果谤职,此外它適合于消除非相干噪聲或散射噪聲,而對(duì)相干噪聲則沒(méi)有消除能力亿鲜,因此對(duì)于方向性噪聲和房間混響等不能有效消除允蜈。
上述兩種算法在濾波器設(shè)計(jì)完成后不能變動(dòng),因而稱(chēng)為固定波束形成器狡门,然而在某些環(huán)境下陷寝,信號(hào)和噪聲的統(tǒng)計(jì)特性是隨時(shí)間變化的,這就需要利用自適應(yīng)的波束形成方法
自適應(yīng)波束形成基于MVDR(最小方差無(wú)畸變響應(yīng))準(zhǔn)則其馏,原理是在保證期望方向信號(hào)不變的條件下,使陣列的輸出功率到達(dá)最小來(lái)抑制噪聲
可控波束形成技術(shù)本質(zhì)上是一種最大似然估計(jì)爆安,他需要聲源和環(huán)境噪聲的先驗(yàn)知識(shí)叛复,在實(shí)際使用中,這種先驗(yàn)知識(shí)往往很難獲得扔仓,此外褐奥,最大似然估計(jì)是非線性最優(yōu)化問(wèn)題,這類(lèi)目標(biāo)函數(shù)往往有多個(gè)極點(diǎn)翘簇,且該方法對(duì)初始點(diǎn)的選取也很敏感撬码,因此使用傳統(tǒng)的梯度下降算法往往容易陷于局部極小點(diǎn),從而不能找到全局最優(yōu)點(diǎn)版保,若要通過(guò)其他搜索方法找到全局最優(yōu)點(diǎn)呜笑,就會(huì)極大的增加復(fù)雜度。
(2)基于TDOA的定位方法
基于TDOA的定位方法是一種雙步定位方法彻犁,該方法首先估計(jì)信號(hào)到達(dá)不同麥克風(fēng)之間的時(shí)間差叫胁,進(jìn)而通過(guò)幾何關(guān)系來(lái)確定聲源的位置。
對(duì)于該方法汞幢,穩(wěn)健的時(shí)延估計(jì)是進(jìn)行準(zhǔn)確定位的基礎(chǔ)驼鹅,現(xiàn)有的TDE(時(shí)延估計(jì)方法)分為兩類(lèi):
利用互相關(guān)函數(shù)的時(shí)延估計(jì)方法
如:GCC(廣義互相關(guān)法)、最大似然加權(quán)法(ML)、互功率譜相位(CSP)
通過(guò)求取路徑的脈沖響應(yīng)(或傳遞函數(shù))來(lái)獲取TDOA估計(jì)
如:LMS(自適應(yīng)最小均方)输钩、EVD(子空間分解或特征值分解法)豺型、ATF比(基于傳遞函數(shù)比)
鑒于GCC受混響的影響比較嚴(yán)重,可以在GCC前端加入CEP(倒譜預(yù)濾波)來(lái)改進(jìn)GCC算法买乃,通過(guò)對(duì)通道特性的分析姻氨,有目的地去除信號(hào)中受反射影響嚴(yán)重的部分,再將預(yù)濾波后的信號(hào)通過(guò)GCC方法進(jìn)行TDE为牍,這樣能有效降低混響的影響哼绑,而且也具有一定的扛噪性能。
GCC使用的加權(quán)函數(shù)有CC碉咆、Roth抖韩、SCOT、PHAT疫铜、Eckart茂浮、
可以看出GCC方法是建立在非混響模型基礎(chǔ)上的,由于受模型誤差的影響壳咕,他不能正確辨識(shí)多個(gè)說(shuō)話人和方向性的干擾噪聲席揽,并且更傾向于估計(jì)比較強(qiáng)的信號(hào)的TDOA值,所以GCC方法只能用于低混響和非相關(guān)噪聲的場(chǎng)合谓厘。
時(shí)延估計(jì)技術(shù)需要從三個(gè)方面評(píng)估實(shí)用性幌羞,對(duì)定源和動(dòng)源的跟蹤能力、在不同混響和信噪比環(huán)境下的穩(wěn)健性竟稳、算法的計(jì)算量
(3)基于高分辨率譜估計(jì)的定位方法
該方法來(lái)源于一些現(xiàn)代高分辨率譜估計(jì)技術(shù)属桦,如AR(自回歸模型)、MV(最小方差譜估計(jì))他爸、MUSIC(多重信號(hào)分類(lèi))他們利用EVD(特征值分解)將數(shù)據(jù)的協(xié)方差矩陣分解為信號(hào)子空間和噪聲子空間聂宾,然后找出與噪聲子空間正交的方向矢量來(lái)獲得聲源的方向估計(jì)
該算法不會(huì)受到信號(hào)采樣頻率的限制,并且在一定條件下可以實(shí)現(xiàn)任意定位精度诊笤,但是1)該算法是利用相關(guān)矩陣中最大幾個(gè)特征值來(lái)判定聲源位置的系谐,一旦有方向性噪聲的出現(xiàn),且其能量與聲源相差不大讨跟,算法有時(shí)會(huì)找到方向性噪聲的方向纪他,2)另外房間的反射作用使信號(hào)和干擾之間有一定的相關(guān)性,從而極大降低了該方法的有效性许赃,3)這一方法需要對(duì)整個(gè)空間進(jìn)行搜索來(lái)確定聲源的位置止喷,且其估計(jì)精度與空間的細(xì)分程度有關(guān),計(jì)算復(fù)雜度偏高