視音頻數(shù)據(jù)處理入門:FLV封裝格式解析

了解FLV格式的基礎(chǔ)可以參照
https://wuyuans.com/2012/08/flv-format/
前兩篇文章介紹了音頻碼流處理程序和視頻碼流處理程序,本文介紹將他們打包到一起后的數(shù)據(jù)——封裝格式數(shù)據(jù)的處理程序。封裝格式數(shù)據(jù)在視頻播放器中的位置如下所示丈冬。


本文中的程序是一個FLV封裝格式解析程序撑螺。該程序可以從FLV中分析得到它的基本單元Tag视事,并且可以簡單解析Tag首部的字段包帚。通過修改該程序可以實(shí)現(xiàn)不同的FLV格式數(shù)據(jù)處理功能。

原理

FLV封裝格式是由一個FLV Header文件頭和一個一個的Tag組成的镊叁。Tag中包含了音頻數(shù)據(jù)以及視頻數(shù)據(jù)。FLV的結(jié)構(gòu)如下圖所示走触。


有關(guān)FLV的格式本文不再做記錄晦譬。可以參考文章
http://blog.csdn.net/leixiaohua1020/article/details/17934487互广。
本文的程序?qū)崿F(xiàn)了FLV中的FLV Header和Tag的解析敛腌,并可以分離出其中的音頻流。

代碼

整個程序位于simplest_flv_parser()函數(shù)中惫皱,如下所示像樊。

/** 
 * 最簡單的視音頻數(shù)據(jù)處理示例 
 * Simplest MediaData Test 
 * 
 * 雷霄驊 Lei Xiaohua 
 * leixiaohua1020@126.com 
 * 中國傳媒大學(xué)/數(shù)字電視技術(shù) 
 * Communication University of China / Digital TV Technology 
 * http://blog.csdn.net/leixiaohua1020 
 * 
 * 本項(xiàng)目包含如下幾種視音頻測試示例: 
 *  (1)像素?cái)?shù)據(jù)處理程序。包含RGB和YUV像素格式處理的函數(shù)旅敷。 
 *  (2)音頻采樣數(shù)據(jù)處理程序生棍。包含PCM音頻采樣格式處理的函數(shù)。 
 *  (3)H.264碼流分析程序媳谁∽闵穑可以分離并解析NALU。 
 *  (4)AAC碼流分析程序韩脑∏饴瑁可以分離并解析ADTS幀。 
 *  (5)FLV封裝格式分析程序段多∈琢浚可以將FLV中的MP3音頻碼流分離出來。 
 *  (6)UDP-RTP協(xié)議分析程序进苍〖釉担可以將分析UDP/RTP/MPEG-TS數(shù)據(jù)包。 
 * 
 * This project contains following samples to handling multimedia data: 
 *  (1) Video pixel data handling program. It contains several examples to handle RGB and YUV data. 
 *  (2) Audio sample data handling program. It contains several examples to handle PCM data. 
 *  (3) H.264 stream analysis program. It can parse H.264 bitstream and analysis NALU of stream. 
 *  (4) AAC stream analysis program. It can parse AAC bitstream and analysis ADTS frame of stream. 
 *  (5) FLV format analysis program. It can analysis FLV file and extract MP3 audio stream. 
 *  (6) UDP-RTP protocol analysis program. It can analysis UDP/RTP/MPEG-TS Packet. 
 * 
 */  
#include <stdio.h>  
#include <stdlib.h>  
#include <string.h>  
  
//Important!  
#pragma pack(1)  
  
  
#define TAG_TYPE_SCRIPT 18  
#define TAG_TYPE_AUDIO  8  
#define TAG_TYPE_VIDEO  9  
  
typedef unsigned char byte;  
typedef unsigned int uint;  
  
typedef struct {  
    byte Signature[3];  
    byte Version;  
    byte Flags;  
    uint DataOffset;  
} FLV_HEADER;  
  
typedef struct {  
    byte TagType;  
    byte DataSize[3];  
    byte Timestamp[3];  
    uint Reserved;  
} TAG_HEADER;  
  
  
//reverse_bytes - turn a BigEndian byte array into a LittleEndian integer  
uint reverse_bytes(byte *p, char c) {  
    int r = 0;  
    int i;  
    for (i=0; i<c; i++)   
        r |= ( *(p+i) << (((c-1)*8)-8*i));  
    return r;  
}  
  
/** 
 * Analysis FLV file 
 * @param url    Location of input FLV file. 
 */  
  
int simplest_flv_parser(char *url){  
  
    //whether output audio/video stream  
    int output_a=1;  
    int output_v=1;  
    //-------------  
    FILE *ifh=NULL,*vfh=NULL, *afh = NULL;  
  
    //FILE *myout=fopen("output_log.txt","wb+");  
    FILE *myout=stdout;  
  
    FLV_HEADER flv;  
    TAG_HEADER tagheader;  
    uint previoustagsize, previoustagsize_z=0;  
    uint ts=0, ts_new=0;  
  
    ifh = fopen(url, "rb+");  
    if ( ifh== NULL) {  
        printf("Failed to open files!");  
        return -1;  
    }  
  
    //FLV file header  
    fread((char *)&flv,1,sizeof(FLV_HEADER),ifh);  
  
    fprintf(myout,"============== FLV Header ==============\n");  
    fprintf(myout,"Signature:  0x %c %c %c\n",flv.Signature[0],flv.Signature[1],flv.Signature[2]);  
    fprintf(myout,"Version:    0x %X\n",flv.Version);  
    fprintf(myout,"Flags  :    0x %X\n",flv.Flags);  
    fprintf(myout,"HeaderSize: 0x %X\n",reverse_bytes((byte *)&flv.DataOffset, sizeof(flv.DataOffset)));  
    fprintf(myout,"========================================\n");  
  
    //move the file pointer to the end of the header  
    fseek(ifh, reverse_bytes((byte *)&flv.DataOffset, sizeof(flv.DataOffset)), SEEK_SET);  
  
    //process each tag  
    do {  
  
        previoustagsize = _getw(ifh);  
  
        fread((void *)&tagheader,sizeof(TAG_HEADER),1,ifh);  
  
        //int temp_datasize1=reverse_bytes((byte *)&tagheader.DataSize, sizeof(tagheader.DataSize));  
        int tagheader_datasize=tagheader.DataSize[0]*65536+tagheader.DataSize[1]*256+tagheader.DataSize[2];  
        int tagheader_timestamp=tagheader.Timestamp[0]*65536+tagheader.Timestamp[1]*256+tagheader.Timestamp[2];  
  
        char tagtype_str[10];  
        switch(tagheader.TagType){  
        case TAG_TYPE_AUDIO:sprintf(tagtype_str,"AUDIO");break;  
        case TAG_TYPE_VIDEO:sprintf(tagtype_str,"VIDEO");break;  
        case TAG_TYPE_SCRIPT:sprintf(tagtype_str,"SCRIPT");break;  
        default:sprintf(tagtype_str,"UNKNOWN");break;  
        }  
        fprintf(myout,"[%6s] %6d %6d |",tagtype_str,tagheader_datasize,tagheader_timestamp);  
  
        //if we are not past the end of file, process the tag  
        if (feof(ifh)) {  
            break;  
        }  
  
        //process tag by type  
        switch (tagheader.TagType) {  
  
        case TAG_TYPE_AUDIO:{   
            char audiotag_str[100]={0};  
            strcat(audiotag_str,"| ");  
            char tagdata_first_byte;  
            tagdata_first_byte=fgetc(ifh);  
            int x=tagdata_first_byte&0xF0;  
            x=x>>4;  
            switch (x)  
            {  
            case 0:strcat(audiotag_str,"Linear PCM, platform endian");break;  
            case 1:strcat(audiotag_str,"ADPCM");break;  
            case 2:strcat(audiotag_str,"MP3");break;  
            case 3:strcat(audiotag_str,"Linear PCM, little endian");break;  
            case 4:strcat(audiotag_str,"Nellymoser 16-kHz mono");break;  
            case 5:strcat(audiotag_str,"Nellymoser 8-kHz mono");break;  
            case 6:strcat(audiotag_str,"Nellymoser");break;  
            case 7:strcat(audiotag_str,"G.711 A-law logarithmic PCM");break;  
            case 8:strcat(audiotag_str,"G.711 mu-law logarithmic PCM");break;  
            case 9:strcat(audiotag_str,"reserved");break;  
            case 10:strcat(audiotag_str,"AAC");break;  
            case 11:strcat(audiotag_str,"Speex");break;  
            case 14:strcat(audiotag_str,"MP3 8-Khz");break;  
            case 15:strcat(audiotag_str,"Device-specific sound");break;  
            default:strcat(audiotag_str,"UNKNOWN");break;  
            }  
            strcat(audiotag_str,"| ");  
            x=tagdata_first_byte&0x0C;  
            x=x>>2;  
            switch (x)  
            {  
            case 0:strcat(audiotag_str,"5.5-kHz");break;  
            case 1:strcat(audiotag_str,"1-kHz");break;  
            case 2:strcat(audiotag_str,"22-kHz");break;  
            case 3:strcat(audiotag_str,"44-kHz");break;  
            default:strcat(audiotag_str,"UNKNOWN");break;  
            }  
            strcat(audiotag_str,"| ");  
            x=tagdata_first_byte&0x02;  
            x=x>>1;  
            switch (x)  
            {  
            case 0:strcat(audiotag_str,"8Bit");break;  
            case 1:strcat(audiotag_str,"16Bit");break;  
            default:strcat(audiotag_str,"UNKNOWN");break;  
            }  
            strcat(audiotag_str,"| ");  
            x=tagdata_first_byte&0x01;  
            switch (x)  
            {  
            case 0:strcat(audiotag_str,"Mono");break;  
            case 1:strcat(audiotag_str,"Stereo");break;  
            default:strcat(audiotag_str,"UNKNOWN");break;  
            }  
            fprintf(myout,"%s",audiotag_str);  
  
            //if the output file hasn't been opened, open it.  
            if(output_a!=0&&afh == NULL){  
                afh = fopen("output.mp3", "wb");  
            }  
  
            //TagData - First Byte Data  
            int data_size=reverse_bytes((byte *)&tagheader.DataSize, sizeof(tagheader.DataSize))-1;  
            if(output_a!=0){  
                //TagData+1  
                for (int i=0; i<data_size; i++)  
                    fputc(fgetc(ifh),afh);  
  
            }else{  
                for (int i=0; i<data_size; i++)  
                    fgetc(ifh);  
            }  
            break;  
        }  
        case TAG_TYPE_VIDEO:{  
            char videotag_str[100]={0};  
            strcat(videotag_str,"| ");  
            char tagdata_first_byte;  
            tagdata_first_byte=fgetc(ifh);  
            int x=tagdata_first_byte&0xF0;  
            x=x>>4;  
            switch (x)  
            {  
            case 1:strcat(videotag_str,"key frame  ");break;  
            case 2:strcat(videotag_str,"inter frame");break;  
            case 3:strcat(videotag_str,"disposable inter frame");break;  
            case 4:strcat(videotag_str,"generated keyframe");break;  
            case 5:strcat(videotag_str,"video info/command frame");break;  
            default:strcat(videotag_str,"UNKNOWN");break;  
            }  
            strcat(videotag_str,"| ");  
            x=tagdata_first_byte&0x0F;  
            switch (x)  
            {  
            case 1:strcat(videotag_str,"JPEG (currently unused)");break;  
            case 2:strcat(videotag_str,"Sorenson H.263");break;  
            case 3:strcat(videotag_str,"Screen video");break;  
            case 4:strcat(videotag_str,"On2 VP6");break;  
            case 5:strcat(videotag_str,"On2 VP6 with alpha channel");break;  
            case 6:strcat(videotag_str,"Screen video version 2");break;  
            case 7:strcat(videotag_str,"AVC");break;  
            default:strcat(videotag_str,"UNKNOWN");break;  
            }  
            fprintf(myout,"%s",videotag_str);  
  
            fseek(ifh, -1, SEEK_CUR);  
            //if the output file hasn't been opened, open it.  
            if (vfh == NULL&&output_v!=0) {  
                //write the flv header (reuse the original file's hdr) and first previoustagsize  
                    vfh = fopen("output.flv", "wb");  
                    fwrite((char *)&flv,1, sizeof(flv),vfh);  
                    fwrite((char *)&previoustagsize_z,1,sizeof(previoustagsize_z),vfh);  
            }  
#if 0  
            //Change Timestamp  
            //Get Timestamp  
            ts = reverse_bytes((byte *)&tagheader.Timestamp, sizeof(tagheader.Timestamp));  
            ts=ts*2;  
            //Writeback Timestamp  
            ts_new = reverse_bytes((byte *)&ts, sizeof(ts));  
            memcpy(&tagheader.Timestamp, ((char *)&ts_new) + 1, sizeof(tagheader.Timestamp));  
#endif  
  
  
            //TagData + Previous Tag Size  
            int data_size=reverse_bytes((byte *)&tagheader.DataSize, sizeof(tagheader.DataSize))+4;  
            if(output_v!=0){  
                //TagHeader  
                fwrite((char *)&tagheader,1, sizeof(tagheader),vfh);  
                //TagData  
                for (int i=0; i<data_size; i++)  
                    fputc(fgetc(ifh),vfh);  
            }else{  
                for (int i=0; i<data_size; i++)  
                    fgetc(ifh);  
            }  
            //rewind 4 bytes, because we need to read the previoustagsize again for the loop's sake  
            fseek(ifh, -4, SEEK_CUR);  
  
            break;  
            }  
        default:  
  
            //skip the data of this tag  
            fseek(ifh, reverse_bytes((byte *)&tagheader.DataSize, sizeof(tagheader.DataSize)), SEEK_CUR);  
        }  
  
        fprintf(myout,"\n");  
  
    } while (!feof(ifh));  
  
  
    _fcloseall();  
  
    return 0;  
}

結(jié)果

本程序的輸入為一個FLV的文件路徑觉啊,輸出為FLV的統(tǒng)計(jì)數(shù)據(jù)拣宏,如下圖所示。



此外本程序還可以分離FLV中的視頻碼流和音頻碼流杠人。需要注意的是本程序并不能分離一些特定類型的音頻(例如AAC)和視頻.
Ps:非原創(chuàng),原作者雷霄驊

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末勋乾,一起剝皮案震驚了整個濱河市宋下,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌辑莫,老刑警劉巖学歧,帶你破解...
    沈念sama閱讀 218,941評論 6 508
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異各吨,居然都是意外死亡枝笨,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 93,397評論 3 395
  • 文/潘曉璐 我一進(jìn)店門揭蜒,熙熙樓的掌柜王于貴愁眉苦臉地迎上來横浑,“玉大人,你說我怎么就攤上這事屉更♂闳冢” “怎么了?”我有些...
    開封第一講書人閱讀 165,345評論 0 356
  • 文/不壞的土叔 我叫張陵偶垮,是天一觀的道長。 經(jīng)常有香客問我帝洪,道長似舵,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 58,851評論 1 295
  • 正文 為了忘掉前任葱峡,我火速辦了婚禮砚哗,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘砰奕。我一直安慰自己蛛芥,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,868評論 6 392
  • 文/花漫 我一把揭開白布军援。 她就那樣靜靜地躺著仅淑,像睡著了一般。 火紅的嫁衣襯著肌膚如雪胸哥。 梳的紋絲不亂的頭發(fā)上涯竟,一...
    開封第一講書人閱讀 51,688評論 1 305
  • 那天,我揣著相機(jī)與錄音空厌,去河邊找鬼庐船。 笑死,一個胖子當(dāng)著我的面吹牛嘲更,可吹牛的內(nèi)容都是我干的筐钟。 我是一名探鬼主播,決...
    沈念sama閱讀 40,414評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼赋朦,長吁一口氣:“原來是場噩夢啊……” “哼篓冲!你這毒婦竟也來了李破?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 39,319評論 0 276
  • 序言:老撾萬榮一對情侶失蹤纹因,失蹤者是張志新(化名)和其女友劉穎喷屋,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體瞭恰,經(jīng)...
    沈念sama閱讀 45,775評論 1 315
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡屯曹,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,945評論 3 336
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了惊畏。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片恶耽。...
    茶點(diǎn)故事閱讀 40,096評論 1 350
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖颜启,靈堂內(nèi)的尸體忽然破棺而出偷俭,到底是詐尸還是另有隱情,我是刑警寧澤缰盏,帶...
    沈念sama閱讀 35,789評論 5 346
  • 正文 年R本政府宣布涌萤,位于F島的核電站,受9級特大地震影響口猜,放射性物質(zhì)發(fā)生泄漏负溪。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,437評論 3 331
  • 文/蒙蒙 一济炎、第九天 我趴在偏房一處隱蔽的房頂上張望川抡。 院中可真熱鬧,春花似錦须尚、人聲如沸崖堤。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,993評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽密幔。三九已至,卻和暖如春撩轰,著一層夾襖步出監(jiān)牢的瞬間老玛,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,107評論 1 271
  • 我被黑心中介騙來泰國打工钧敞, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留蜡豹,地道東北人。 一個月前我還...
    沈念sama閱讀 48,308評論 3 372
  • 正文 我出身青樓溉苛,卻偏偏與公主長得像镜廉,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子愚战,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,037評論 2 355

推薦閱讀更多精彩內(nèi)容