JAVA將MP3轉(zhuǎn)為WAV

想搞個(gè)百度語(yǔ)音識(shí)別玩玩箫老,但人家要固定格式的音頻(關(guān)于百度語(yǔ)音識(shí)別的請(qǐng)查看官方文檔——百度語(yǔ)音識(shí)別SDK)挺益,于是就上網(wǎng)找呀找呀娩践,結(jié)果轉(zhuǎn)出來(lái)的要不就是聽不了損壞了,要不就是不能給百度識(shí)別就是說(shuō)轉(zhuǎn)的格式不正確畜埋。后來(lái)看到一篇國(guó)外的解決方案終于搞定。廢話不多說(shuō)畴蒲,先把完整代碼弄上來(lái)悠鞍,然后在廢話吧。

代碼

import java.io.ByteArrayInputStream;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;

import javax.sound.sampled.AudioFileFormat;
import javax.sound.sampled.AudioFormat;
import javax.sound.sampled.AudioInputStream;
import javax.sound.sampled.AudioSystem;
import javax.sound.sampled.UnsupportedAudioFileException;

import org.json.JSONObject;

import com.baidu.aip.speech.AipSpeech;

public class MP3ToWav {
    /**
     * mp3的字節(jié)數(shù)組生成wav文件
     * @param sourceBytes
     * @param targetPath
     */
    public static boolean byteToWav(byte[] sourceBytes, String targetPath) {
        if (sourceBytes == null || sourceBytes.length == 0) {
            System.out.println("Illegal Argument passed to this method");
            return false;
        }

        try (final ByteArrayInputStream bais = new ByteArrayInputStream(sourceBytes); final AudioInputStream sourceAIS = AudioSystem.getAudioInputStream(bais)) {
            AudioFormat sourceFormat = sourceAIS.getFormat();
            // 設(shè)置MP3的語(yǔ)音格式,并設(shè)置16bit
            AudioFormat mp3tFormat = new AudioFormat(AudioFormat.Encoding.PCM_SIGNED, sourceFormat.getSampleRate(), 16, sourceFormat.getChannels(), sourceFormat.getChannels() * 2, sourceFormat.getSampleRate(), false);
            // 設(shè)置百度語(yǔ)音識(shí)別的音頻格式
            AudioFormat pcmFormat = new AudioFormat(AudioFormat.Encoding.PCM_SIGNED, 16000, 16, 1, 2, 16000, false);
            try (
                // 先通過MP3轉(zhuǎn)一次模燥,使音頻流能的格式完整
                final AudioInputStream mp3AIS = AudioSystem.getAudioInputStream(mp3tFormat, sourceAIS);
                // 轉(zhuǎn)成百度需要的流
                final AudioInputStream pcmAIS = AudioSystem.getAudioInputStream(pcmFormat, mp3AIS)) {
                // 根據(jù)路徑生成wav文件
                AudioSystem.write(pcmAIS, AudioFileFormat.Type.WAVE, new File(targetPath));
            }
            return true;
        } catch (IOException e) {
            System.out.println("文件轉(zhuǎn)換異常:" + e.getMessage());
            return false;
        } catch (UnsupportedAudioFileException e) {
            System.out.println("文件轉(zhuǎn)換異常:" + e.getMessage());
            return false;
        }
    }

    /**
     * 將文件轉(zhuǎn)成字節(jié)流
     * @param filePath
     * @return
     */
    private static byte[] getBytes(String filePath) {
        byte[] buffer = null;
        try {
            File file = new File(filePath);
            FileInputStream fis = new FileInputStream(file);
            ByteArrayOutputStream bos = new ByteArrayOutputStream(1000);
            byte[] b = new byte[1000];
            int n;
            while ((n = fis.read(b)) != -1) {
                bos.write(b, 0, n);
            }
            fis.close();
            bos.close();
            buffer = bos.toByteArray();
        } catch (FileNotFoundException e) {
            e.printStackTrace();
        } catch (IOException e) {
            e.printStackTrace();
        }
        return buffer;
    }

    public static void main(String args[]) {
        String filePath = "E:/data/storage/public/1111.mp3";
        String targetPath = "E:/data/storage/public/2222.wav";
        byteToWav(getBytes(filePath), targetPath);
        AipSpeech client = new AipSpeech("XXXXXX", "XXXXXXXX", "XXXXXXXX");
        JSONObject asrRes = client.asr(targetPath, "wav", 16000, null);
        System.out.println(asrRes);
        System.out.println(asrRes.get("result"));
    }
}

嘮嗑

看代碼就知道這里引得jar都是jdk里面的咖祭,不用另外找掩宜,網(wǎng)上的方法就是要下其余jar麻煩。么翰。牺汤。另外還有json和百度的其實(shí)就是語(yǔ)音識(shí)別要用而已。順便將maven地址放上來(lái)

<dependency>
    <groupId>com.baidu.aip</groupId>
    <artifactId>java-sdk</artifactId>
    <version>4.4.0</version>
</dependency>

要注意的是這里用到j(luò)dk7的特性浩嫌,就是將資源流使用完之后自己關(guān)閉并捕獲檐迟,(以前我也不知道有這樣的特性【遮臉!固该!】)

try (final ByteArrayInputStream bais = new ByteArrayInputStream(sourceBytes); final AudioInputStream sourceAIS = AudioSystem.getAudioInputStream(bais)) {
      //一些處理...
}

這里設(shè)置了兩個(gè)格式轉(zhuǎn)換锅减,下面也進(jìn)行了兩次格式轉(zhuǎn)換,為什么呢伐坏?本來(lái)就是MP3了呀怔匣,還要轉(zhuǎn)成MP3???
其實(shí)這里就是一個(gè)坑

// 設(shè)置MP3的語(yǔ)音格式,并設(shè)置16bit
AudioFormat mp3tFormat = new AudioFormat(AudioFormat.Encoding.PCM_SIGNED, sourceFormat.getSampleRate(), 16, sourceFormat.getChannels(), sourceFormat.getChannels() * 2, sourceFormat.getSampleRate(), false);
// 設(shè)置百度語(yǔ)音識(shí)別的音頻格式
AudioFormat pcmFormat = new AudioFormat(AudioFormat.Encoding.PCM_SIGNED, 16000, 16, 1, 2, 16000, false);

這里的sourceFormat 在debug下,可以看到有這么兩句unknown bits per sample, unknown frame size桦沉,所以跨格式轉(zhuǎn)換的時(shí)候就會(huì)出錯(cuò)每瞒,但只轉(zhuǎn)回自己就沒問題(上面格式的16和sourceFormat.getChannels() * 2,就是對(duì)應(yīng)的格式)纯露。經(jīng)過一次轉(zhuǎn)換之后剿骨,音頻流的格式信息就完整了,最后才能成功轉(zhuǎn)為wav.

AudioFormat sourceFormat = sourceAIS.getFormat();
//sourceFormat
//MPEG2L3 22050.0 Hz, unknown bits per sample, mono, unknown frame size, 38.28125 frames/second, 
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末埠褪,一起剝皮案震驚了整個(gè)濱河市浓利,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌钞速,老刑警劉巖贷掖,帶你破解...
    沈念sama閱讀 206,378評(píng)論 6 481
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異渴语,居然都是意外死亡苹威,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 88,356評(píng)論 2 382
  • 文/潘曉璐 我一進(jìn)店門驾凶,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)牙甫,“玉大人,你說(shuō)我怎么就攤上這事调违】卟福” “怎么了?”我有些...
    開封第一講書人閱讀 152,702評(píng)論 0 342
  • 文/不壞的土叔 我叫張陵翰萨,是天一觀的道長(zhǎng)脏答。 經(jīng)常有香客問我,道長(zhǎng),這世上最難降的妖魔是什么殖告? 我笑而不...
    開封第一講書人閱讀 55,259評(píng)論 1 279
  • 正文 為了忘掉前任阿蝶,我火速辦了婚禮,結(jié)果婚禮上黄绩,老公的妹妹穿的比我還像新娘羡洁。我一直安慰自己,他們只是感情好爽丹,可當(dāng)我...
    茶點(diǎn)故事閱讀 64,263評(píng)論 5 371
  • 文/花漫 我一把揭開白布筑煮。 她就那樣靜靜地躺著,像睡著了一般粤蝎。 火紅的嫁衣襯著肌膚如雪真仲。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 49,036評(píng)論 1 285
  • 那天初澎,我揣著相機(jī)與錄音秸应,去河邊找鬼。 笑死碑宴,一個(gè)胖子當(dāng)著我的面吹牛软啼,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播延柠,決...
    沈念sama閱讀 38,349評(píng)論 3 400
  • 文/蒼蘭香墨 我猛地睜開眼祸挪,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了贞间?” 一聲冷哼從身側(cè)響起贿条,我...
    開封第一講書人閱讀 36,979評(píng)論 0 259
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎增热,沒想到半個(gè)月后闪唆,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 43,469評(píng)論 1 300
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡钓葫,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 35,938評(píng)論 2 323
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了票顾。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片础浮。...
    茶點(diǎn)故事閱讀 38,059評(píng)論 1 333
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖奠骄,靈堂內(nèi)的尸體忽然破棺而出豆同,到底是詐尸還是另有隱情,我是刑警寧澤含鳞,帶...
    沈念sama閱讀 33,703評(píng)論 4 323
  • 正文 年R本政府宣布影锈,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏鸭廷。R本人自食惡果不足惜枣抱,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 39,257評(píng)論 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望辆床。 院中可真熱鬧佳晶,春花似錦、人聲如沸讼载。這莊子的主人今日做“春日...
    開封第一講書人閱讀 30,262評(píng)論 0 19
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)咨堤。三九已至菇篡,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間一喘,已是汗流浹背驱还。 一陣腳步聲響...
    開封第一講書人閱讀 31,485評(píng)論 1 262
  • 我被黑心中介騙來(lái)泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留津滞,地道東北人铝侵。 一個(gè)月前我還...
    沈念sama閱讀 45,501評(píng)論 2 354
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像触徐,于是被迫代替她去往敵國(guó)和親咪鲜。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 42,792評(píng)論 2 345