簡介
前面兩章我們介紹了PCM音頻格式的錄制和播放腾务,分別是使用AudioRecord
錄制楚午,使用AudioTrack
播放玫锋,其實得到了PCM格式的音頻卵渴,我們并不能隨意在播放器中播放兑障,因為PCM格式的音頻,播放器還不能識別登淘,需要編碼封裝成mp3或者wav等格式才能播放箫老,但是今天我們暫時不討論如何進行PCM編碼,先來對PCM進行一些處理黔州,比如變聲槽惫,添加BGM等,今天我們的主題是變聲
變聲原理
對于變聲的處理一般有以下三種
- 變速又變調(diào)
即改變音頻的速度(語速)辩撑,又改變音頻的頻率(音調(diào))
我們可以對原始音頻進行重采樣,重采樣有上采樣和下采樣仿耽,分別是對原始音頻進行插值和抽取合冀,比如P/Q重采樣,一般我們的處理是项贺,先對原始音頻進行插值君躺,在相鄰兩點間插入P個采樣點,全部插入結(jié)束后再每隔Q個采樣點進行采樣开缎,這樣得到的音頻語速和音調(diào)都是原來的Q/P倍
- 變速不變調(diào)
只改變語速棕叫,不改變音調(diào)
只是改變語速的話,那么就要稍微復(fù)雜點奕删,和重采樣方法差不多俺泣,區(qū)別在于我們需要先規(guī)定一幀音頻的長度,一般我們的采樣率設(shè)為44.1KHz完残,也就是一秒鐘采樣44.1K次伏钠,我們可以規(guī)定一幀為1024,所有我們可以簡單的根據(jù)丟幀和重復(fù)幀來實現(xiàn)變速不變調(diào)谨设,比如對于P/Q變速熟掂,我們先對原始音頻的每一幀重復(fù)P次,最后的結(jié)果再進行每隔Q幀取一幀扎拣,這樣就得到音頻音調(diào)不變赴肚,語速變?yōu)?strong>Q/P的音頻
- 變調(diào)不變速
只改變音調(diào)素跺,不改變語速
如果只是變調(diào)的話,就要結(jié)合重采樣和變速不變調(diào)來做誉券,我們先對音頻信號進行變速不變調(diào)處理指厌,再對其進行重采樣,比如横朋,我想要讓音調(diào)變?yōu)樵瓉淼?strong>P/Q倍仑乌,那么我們需要先對其進行P/Q變速不變調(diào),語速變?yōu)樵瓉淼?strong>Q/P琴锭,接著晰甚,在對其進行Q/P重采樣,這樣决帖,最后就得到了語速不變厕九,而音調(diào)變?yōu)樵瓉淼腜/Q倍
當(dāng)然,還有很多對聲音的處理地回,比如一些K歌軟件扁远,可以實現(xiàn)KTV、空靈刻像、磁性等效果畅买,那些效果就比較復(fù)雜,不在今天的討論范圍內(nèi)细睡,我們暫時只討論簡單的變聲
代碼實現(xiàn)(Java)
我們這樣是使用純Java代碼實現(xiàn)谷羞,其實這樣是存在效率問題的,如果音頻較大溜徙,還是得用C語言(使用JNI和NDK去實現(xiàn))湃缎,對于一些特殊情況,算法可能存在問題蠢壹,僅供參考
- 幀長
private static final int FRAME_LENGTH = 1024;
- 變調(diào)又變速(提高)
//變調(diào)又變速(提高)
public static byte[] up(byte[] data, int up) {
if (up == 1) {
return data;
}
int length = data.length;
int upLength = length / up;
byte[] upData = new byte[upLength];
for (int i = 0, j = 0; i < length; ) {
if (j >= upLength) {
break;
}
upData[j] = data[i];
i += up;
j++;
}
return upData;
}
- 變調(diào)又變速(降低)
public static byte[] down(byte[] data, int down) {
if (down == 1) {
return data;
}
int length = data.length;
int downLength = length * down;
byte[] downData = new byte[downLength];
for (int i = 0, j = 0; i < length - 1; ) {
for (int k = 0; k < down; k++) {
downData[j] = data[i];
j++;
}
i++;
}
return downData;
}
- 變速不變調(diào)(提高)
public static byte[] speedUp(byte[] data, int up) {
if (up == 1) {
return data;
}
int length = data.length;
int frameShift = FRAME_LENGTH * up;
int upLength = length / up;
byte[] upData = new byte[upLength];
for (int i = 0, j = 0; i < length; ) {
if (i + FRAME_LENGTH >= length) {
System.arraycopy(data, i, upData, j, length - i);
break;
}
System.arraycopy(data, i, upData, j, FRAME_LENGTH);
i += (FRAME_LENGTH + frameShift);
j += FRAME_LENGTH;
}
return upData;
}
- 變速不變調(diào)(降低)
public static byte[] speedDown(byte[] data, int down) {
if (down == 1) {
return data;
}
int length = data.length;
int downLength = length * down;
byte[] downData = new byte[downLength];
for (int i = 0, j = 0; i < length; ) {
if (i + FRAME_LENGTH >= length) {
int lastlength = length - i;
for (int k = 0; k < down; k++) {
System.arraycopy(data, lastlength, downData, j, lastlength);
j += lastlength;
}
break;
}
for (int k = 0; k < down; k++) {
System.arraycopy(data, i, downData, j, FRAME_LENGTH);
j += FRAME_LENGTH;
}
i += FRAME_LENGTH;
}
return downData;
}
- 設(shè)置語速
public static byte[] setSpeed(byte[] data, int up, int down) {
byte[] downData = speedDown(data, down);
byte[] upData = speedUp(downData, up);
return upData;
}
- 設(shè)置音調(diào)
public static byte[] setTone(byte[] data, int up, int down) {
byte[] speedData = setSpeed(data, down, up);
byte[] downData = down(speedData, down);
byte[] upData = up(downData, up);
return upData;
}
總結(jié)
我們在使用AudioRecord錄音結(jié)束后嗓违,可以調(diào)用以上函數(shù)進行處理,然后再使用AudioTrack進行播放图贸,對于up和down參數(shù)的配置蹂季,可以自己調(diào),我將up設(shè)為4求妹,down設(shè)為5乏盐,我的聲音就變得低沉大叔的聲音,更多的參數(shù)你可以自己去測試
注:如果設(shè)置的參數(shù)過大可能會出現(xiàn)異常制恍,比如50父能,可能是算法存在問題,還需改進净神。
變聲的簡單介紹何吝,希望大家喜歡溉委。