簡述MP4文件中的音視頻

大家使用播放器播放MP4文件時拳氢,可以看到畫面践剂,也可以聽到聲音弓摘,這里就涉及到幾個知識點:

  • MP4文件是什么?
  • 畫面怎么來的?
  • 聲音怎么來的?

先來講講畫面是什么。我們最容易理解的畫面就是一張圖片刃宵,一張圖片是靜止的衡瓶,如果把一張張圖片拼接起來,就會形成動態(tài)效果组去。微信上的動態(tài)表情就是由一張張圖片拼接起來形成的gif動圖鞍陨。

MP4文件中的畫面就是由一幀幀的畫面組成的,每一幀就類似于一張圖片从隆。但是有個問題诚撵,每張圖片所占用的空間比較大,如果直接把它們組合在一起键闺,會形成一個非常大的文件缩筛,那就不方便文件的存儲和傳播了嚎京。所以我們需要一些方式來把這些圖片進(jìn)行壓縮,類似于把一個1M大小的txt文本文件一壓縮就可能不到1K大小了,壓縮了1000倍近尚。這個技術(shù)在視頻領(lǐng)域就叫“編碼”搜变,對應(yīng)的解壓過程就叫“解碼”艘蹋。視頻編解碼目前最常用的就是H264技術(shù)车酣。聲音也類似畫面,其中的編解碼一般用的是AAC榴都。

有了這些連續(xù)的畫面和聲音待锈,得需要有個東西或者說容器把這些東西裝起來,這個容器就是MP4嘴高。我們還會看到FLV竿音,MKV文件和屎,與MP4一樣也是容器,只是他們的規(guī)則有些不同而已春瞬。類似word可以把文字和圖片裝在一個文件里面柴信,pdf也可以做相同的事情。

現(xiàn)在大部分視頻都采用H264協(xié)議宽气,這個協(xié)議最主要的好處是高的視頻壓縮比良好的網(wǎng)絡(luò)親和性随常。協(xié)議很復(fù)雜,我們只說說它的幾個關(guān)鍵知識:I抹竹、P线罕、B、SPS窃判、PPS幀,碼率喇闸,分辨率袄琳。

我們回想一下看視頻的場景,一般情況下燃乍,一段場景內(nèi)變化的圖像都不會太多唆樊,比如直播視頻中,一般都只有主播的嘴在動刻蟹,背景啊逗旁,服飾什么的都基本不會變化。參照一段時間內(nèi)圖像的統(tǒng)計結(jié)果表明舆瘪,在相鄰幾幅圖像畫面中片效,一般有差別的像素只有10%以內(nèi)的點,亮度差值變化不超過2%,而色度差值的變化只有1%以內(nèi)英古。所以對于一段變化不大圖像畫面淀衣,我們可以先編碼出一個完整的圖像幀A,隨后的B幀就不編碼全部圖像召调,只寫入與A幀的差別膨桥,這樣B幀的大小就只有完整幀的1/10或更小唠叛!B幀之后的C幀如果變化不大只嚣,我們可以繼續(xù)以參考B的方式編碼C幀,這樣循環(huán)下去艺沼。這段圖像我們稱為一個序列(序列就是有相同特點的一段數(shù)據(jù))册舞,當(dāng)某個圖像與之前的圖像變化很大,無法參考前面的幀來生成澳厢,那我們就結(jié)束上一個序列环础,開始下一段序列囚似,也就是對這個圖像生成一個完整幀A1,隨后的圖像就參考A1生成线得,只寫入與A1的差別內(nèi)容饶唤。如此循環(huán)......

接下來來一段比較專業(yè)化的描述:在H264中圖像以序列為單位進(jìn)行組織,一個序列是一段圖像編碼后的數(shù)據(jù)流贯钩,以I幀開始募狂,到下一個I幀結(jié)束。一個序列的第一個圖像叫做 IDR 圖像(立即刷新圖像)角雷,IDR 圖像都是 I 幀圖像祸穷。H.264 引入 IDR 圖像是為了解碼的重同步,當(dāng)解碼器解碼到 IDR 圖像時勺三,立即將參考幀隊列清空雷滚,將已解碼的數(shù)據(jù)全部輸出或拋棄,重新查找參數(shù)集吗坚,開始一個新的序列祈远。這樣,如果前一個序列出現(xiàn)重大錯誤商源,在這里可以獲得重新同步的機(jī)會车份。IDR圖像之后的圖像永遠(yuǎn)不會使用IDR之前的圖像的數(shù)據(jù)來解碼。一個序列就是一段內(nèi)容差異不太大的圖像編碼后生成的一串?dāng)?shù)據(jù)流牡彻。當(dāng)運(yùn)動變化比較少時扫沼,一個序列可以很長,因為運(yùn)動變化少就代表圖像畫面的內(nèi)容變動很小庄吼,所以就可以編一個I幀缎除,然后一直P幀、B幀了霸褒。當(dāng)運(yùn)動變化多時伴找,可能一個序列就比較短了,比如就包含一個I幀和3废菱、4個P幀技矮。

I幀是關(guān)鍵幀,你可以理解為這一幀畫面的完整保留殊轴;P幀是前向預(yù)測編碼幀衰倦,表示的是這一幀跟之前的一個關(guān)鍵幀(或P幀)的差別;B幀是雙向預(yù)測內(nèi)插編碼幀旁理,也就是B幀記錄的是本幀與前后幀的差別樊零。一般直播場景下都會把B幀丟掉,以節(jié)省帶寬。

另外還有SPS(序列參數(shù)集)和PPS(圖像參數(shù)集)兩種類型的幀驻襟,其包含了初始化H.264解碼器所需要的信息參數(shù)夺艰,包括編碼所用的profile,level沉衣,圖像的寬和高郁副,deblock濾波器等,這兩類幀一種出現(xiàn)在H264文件前面豌习;在直播場景下存谎,一般會在I幀之前都發(fā)送這兩類幀,以便接收端能從中途判定流媒體的參數(shù)肥隆。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末既荚,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子栋艳,更是在濱河造成了極大的恐慌恰聘,老刑警劉巖,帶你破解...
    沈念sama閱讀 222,183評論 6 516
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件吸占,死亡現(xiàn)場離奇詭異憨琳,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī)旬昭,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 94,850評論 3 399
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來菌湃,“玉大人问拘,你說我怎么就攤上這事【逅” “怎么了骤坐?”我有些...
    開封第一講書人閱讀 168,766評論 0 361
  • 文/不壞的土叔 我叫張陵,是天一觀的道長下愈。 經(jīng)常有香客問我纽绍,道長,這世上最難降的妖魔是什么势似? 我笑而不...
    開封第一講書人閱讀 59,854評論 1 299
  • 正文 為了忘掉前任拌夏,我火速辦了婚禮,結(jié)果婚禮上履因,老公的妹妹穿的比我還像新娘障簿。我一直安慰自己,他們只是感情好栅迄,可當(dāng)我...
    茶點故事閱讀 68,871評論 6 398
  • 文/花漫 我一把揭開白布站故。 她就那樣靜靜地躺著,像睡著了一般毅舆。 火紅的嫁衣襯著肌膚如雪西篓。 梳的紋絲不亂的頭發(fā)上愈腾,一...
    開封第一講書人閱讀 52,457評論 1 311
  • 那天,我揣著相機(jī)與錄音岂津,去河邊找鬼虱黄。 笑死,一個胖子當(dāng)著我的面吹牛寸爆,可吹牛的內(nèi)容都是我干的礁鲁。 我是一名探鬼主播,決...
    沈念sama閱讀 40,999評論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼赁豆,長吁一口氣:“原來是場噩夢啊……” “哼仅醇!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起魔种,我...
    開封第一講書人閱讀 39,914評論 0 277
  • 序言:老撾萬榮一對情侶失蹤析二,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后节预,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體叶摄,經(jīng)...
    沈念sama閱讀 46,465評論 1 319
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 38,543評論 3 342
  • 正文 我和宋清朗相戀三年安拟,在試婚紗的時候發(fā)現(xiàn)自己被綠了蛤吓。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 40,675評論 1 353
  • 序言:一個原本活蹦亂跳的男人離奇死亡糠赦,死狀恐怖会傲,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情拙泽,我是刑警寧澤淌山,帶...
    沈念sama閱讀 36,354評論 5 351
  • 正文 年R本政府宣布,位于F島的核電站顾瞻,受9級特大地震影響泼疑,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜荷荤,卻給世界環(huán)境...
    茶點故事閱讀 42,029評論 3 335
  • 文/蒙蒙 一退渗、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧梅猿,春花似錦氓辣、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,514評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春体斩,著一層夾襖步出監(jiān)牢的瞬間梭稚,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 33,616評論 1 274
  • 我被黑心中介騙來泰國打工絮吵, 沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留弧烤,地道東北人。 一個月前我還...
    沈念sama閱讀 49,091評論 3 378
  • 正文 我出身青樓蹬敲,卻偏偏與公主長得像暇昂,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子伴嗡,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 45,685評論 2 360

推薦閱讀更多精彩內(nèi)容

  • 硬件編碼相關(guān)知識(H264,H265) 閱讀人群:研究硬件編碼器應(yīng)用于iOS開發(fā)中,從0研究關(guān)于硬件編解碼急波,碼流中...
    小東邪啊閱讀 12,786評論 0 18
  • [TOC] 音視頻&流媒體 是什么促使我要寫這一篇音視頻入門文章?那是因為和一妹子打賭碼率的概念瘪校,結(jié)果輸了澄暮;對一個...
    AllenWu閱讀 4,838評論 1 24
  • 為什么要進(jìn)行編碼 因為未經(jīng)過編碼(壓縮)的視頻,具有極大的數(shù)據(jù)量,不利于存儲,傳輸,實時應(yīng)用. 視頻編碼的原理 空...
    癡人會說夢閱讀 3,279評論 6 3
  • 為什么進(jìn)行壓縮編碼? 視頻是由一幀幀的圖像組成(見實例)比如一張Gif圖片其實就可以被分解成若干張單獨的圖片1.g...
    Tate_code閱讀 975評論 0 3
  • 視頻編碼介紹 為什么進(jìn)行壓縮編碼? 視頻是由一幀幀的圖像組成(見實例)比如一張Gif圖片其實就可以被分解成若干張單...
    coderwhy閱讀 2,327評論 3 15