解封裝.png
ffmpeg的功能主要有兩方面:
- 解封裝
- 解碼
FFmpeg核心模塊
- libavutil
? 核心工具庫袋毙,該模塊是最基礎(chǔ)的模塊之一,下面的許多其他模塊都會依賴該庫做一些基本的音視頻處理操作憎妙。 - libavformat
用于各種音視頻封裝格式的生成和解析,包括獲取解碼所需信息以生成解碼上下文結(jié)構(gòu)和讀取音視頻幀等功能曲楚;音視頻的格式解析協(xié)議厘唾,為 libavcodec 分析碼流提供獨立的音頻或視頻碼流源。 - libavcodec
用于各種類型聲音/圖像編解碼龙誊;該庫是音視頻編解碼核心抚垃,實現(xiàn)了市面上可見的絕大部分解碼器的功能,libavcodec 庫被其他各大解碼器 ffdshow趟大,Mplayer 等所包含或應(yīng)用鹤树。封裝了Codec層,但是有一些Codec是具備自己的License的逊朽,F(xiàn)Fmpeg是不會默認(rèn)添加像libx264罕伯、FDK-AAC、lame等庫的叽讳,但是FFmpeg就像一個平臺一樣追他,可以將其他的第三方的Codec以插件的方式添加進來,然后為開發(fā)者提供統(tǒng)一的接口岛蚤。 - libavfilter
? filter(FileIO湿酸、FPS、DrawText)音視頻濾波器的開發(fā)灭美,如水印推溃、倍速播放等。音視頻濾鏡庫届腐,該模塊提供了包括音頻特效和視頻特效的處理铁坎,在使用FFmpeg的API進行編解碼的過程中,直接使用該模塊為音視頻數(shù)據(jù)做特效處理是非常方便同時也非常高效的一種方式犁苏。 - libswresample
? 原始音頻格式轉(zhuǎn)碼硬萍。該模塊可用于音頻重采樣,可以對數(shù)字音頻進行聲道數(shù)围详、數(shù)據(jù)格式朴乖、采樣率等多種基本信息的轉(zhuǎn)換。 - libswscale
該模塊是將圖像進行格式轉(zhuǎn)換的模塊助赞,比如买羞,可以將YUV的數(shù)據(jù)轉(zhuǎn)換為RGB的數(shù)據(jù),(原始視頻格式轉(zhuǎn)換)用于視頻場景比例縮放雹食、色彩映射轉(zhuǎn)換畜普;圖像顏色空間或格式轉(zhuǎn)換,如 rgb565,rgb888 等與 yuv420 等之間轉(zhuǎn)換群叶。
安裝結(jié)束之后吃挑,進入到prefix指定的目錄下查看钝荡,具體會看到如下幾個目錄。
include:編譯結(jié)束的頭文件都存放在該目錄下面舶衬,如果要以編寫代碼的方式調(diào)用FFmpeg的API去完成工作(這也是后面會介紹的內(nèi)容)埠通,就需要把include中的目錄放到includes的配置中(Android下的makefile文件)。
lib:其中存放的是編譯出來的靜態(tài)庫文件逛犹,其在以編寫代碼的方式調(diào)用FFmpeg的API時會使用到植阴,在編譯階段會使用到上一步提到的include目錄,而在鏈接階段則會使用到這個lib目錄下面的靜態(tài)庫了圾浅。
share:該目錄中存放了一些examples掠手,其中展示了如何使用代碼的方式調(diào)用FFmpeg的API,其實可以切換到configure腳本所在的目錄狸捕,然后執(zhí)行make examples命令及make install喷鸽,再到doc下面的example里找到對應(yīng)的二進制文件,這樣就可以進行調(diào)試或者寫出自己的測試程了灸拍。
統(tǒng)一下術(shù)語做祝,具體如下。
- 容器/文件(Conainer/File):即特定格式的多媒體文件鸡岗,比如MP4混槐、flv、mov等轩性。
- 媒體流(Stream):表示時間軸上的一段連續(xù)數(shù)據(jù)声登,如一段聲音數(shù)據(jù)、一段視頻數(shù)據(jù)或一段字幕數(shù)據(jù)揣苏,可以是壓縮的悯嗓,也可以是非壓縮的,壓縮的數(shù)據(jù)需要關(guān)聯(lián)特定的編解碼器卸察。
- 數(shù)據(jù)幀/數(shù)據(jù)包(Frame/Packet):通常脯厨,一個媒體流是由大量的數(shù)據(jù)幀組成的,對于壓縮數(shù)據(jù)坑质,幀對應(yīng)著編解碼器的最小處理單元合武,分屬于不同媒體流的數(shù)據(jù)幀交錯存儲于容器之中。
- 編解碼器:編解碼器是以幀為單位實現(xiàn)壓縮數(shù)據(jù)和原始數(shù)據(jù)之間的相互轉(zhuǎn)換的涡扼。