作者:cynic ?原文鏈接:https://testerhome.com/topics/20436
開篇
從抖音亿扁、火山、快手等短視頻app的不斷流行鸟廓,越來越多的人開始自己制作視頻从祝。由于本人工作原因襟己,也是以視頻剪輯app為主的測試,在工作過程中牍陌,對于視音頻的一些知識需要有所理解擎浴。
本文主要介紹視頻技術(shù)相關(guān)知識概念。像素毒涧、分辨率贮预、色彩空間、幀速率链嘀、碼率、比特率档玻、編碼方式怀泊、封裝格式。误趴。霹琼。。對于視頻文件的相關(guān)術(shù)語凉当,在非專業(yè)人員看來都是一些搞不清楚的詞匯枣申。希望通過本文,可以對視頻中提及的相關(guān)術(shù)語能夠有更加深刻的理解看杭。
一個視頻文件忠藤,可以簡單理解為由一系列的圖片拼接組合而成的文件,在介紹視頻之前楼雹,先從一張圖片開始模孩。
像素
一個圖像可以視作一個二維矩陣。如果將色彩考慮進來贮缅,我們可以做出推廣:將這個圖像視作一個三維矩陣——多出來的維度用于儲存色彩信息榨咐。
如果我們選擇三原色(紅、綠谴供、藍)代表這些色彩块茁,這就定義了三個平面:第一個是紅色平面,第二個是綠色平面桂肌,最后一個是藍色平面数焊。
我們把這個矩陣里的每一個點稱為像素(圖像元素)。像素的色彩由三原色的強度(通常用數(shù)值表示)表示崎场。例如昌跌,一個紅色像素是指強度為 0 的綠色,強度為 0 的藍色和強度最大的紅色照雁。粉色像素可以通過三種顏色的組合表示蚕愤。如果規(guī)定強度的取值范圍是 0 到 255答恶,紅色 255、綠色 192萍诱、藍色 203 則表示粉色悬嗓。
一個像素通常被視為影像的最小的完整取樣。包含了在影像中的位置信息和色彩信息裕坊。
顏色深度
還有許多其它模型也可以用來表示色彩包竹,進而組成圖像。例如籍凝,給每種顏色都標上序號(如下圖)周瞎,這樣每個像素僅需一個字節(jié)就可以表示出來,而不是 RGB 模型通常所需的 3 個饵蒂。在這樣一個模型里我們可以用一個二維矩陣來代替三維矩陣去表示我們的色彩声诸,這將節(jié)省存儲空間,但色彩的數(shù)量將會受限退盯。
例如以下幾張圖片彼乌。第一張包含所有顏色平面。剩下的分別是紅渊迁、綠慰照、藍色平面(顯示為灰調(diào))(注:顏色強度高的地方顯示為亮色,強度低為暗色)琉朽。
?我們可以看到毒租,對于最終的成像,紅色平面對強度的貢獻更多(三個平面最亮的是紅色平面)箱叁,藍色平面(最后一張圖片)的貢獻大多只在馬里奧的眼睛和他衣服的一部分蝌衔。所有顏色平面對馬里奧的胡子(最暗的部分)均貢獻較少。
?存儲顏色的強度蝌蹂,需要占用一定大小的數(shù)據(jù)空間噩斟,這個大小被稱為顏色深度。假如每個顏色(平面)的強度占用 8 bit(取值范圍為 0 到 255)孤个,那么顏色深度就是 24(8*3)bit剃允,我們還可以推導(dǎo)出我們可以使用 2 的 24 次方種不同的顏色。
顏色深度越高齐鲤,畫面中就能顯示更多種不同的顏色斥废,色彩還原效果也就越好。
分辨率
圖片的另一個屬性是分辨率给郊,即一個平面內(nèi)像素的數(shù)量牡肉。通常表示成寬*高,例如下面這張 4x4 的圖片淆九。
寬高比
圖像或視頻還有一個屬性是寬高比统锤,它簡單地描述了圖像或像素的寬度和高度之間的比例關(guān)系毛俏。
當人們說這個電影或照片是 16:9 時,通常是指顯示寬高比(DAR)饲窿,然而我們也可以有不同形狀的單個像素煌寇,我們稱為像素寬高比(PAR)。
?DVD 的 DAR 是 4:3逾雄,雖然 DVD 的實際分辨率是 704x480阀溶,但它依然保持 4:3 的寬高比,因為它有一個 10:11(704x10/480x11)的 PAR鸦泳。
幀速率 FPS
現(xiàn)在我們可以將視頻定義為在單位時間內(nèi)連續(xù)的 n 幀银锻,這可以視作一個新的維度,n 即為幀率做鹰,若單位時間為秒击纬,則等同于 幀速率FPS (每秒幀數(shù) Frames Per Second)。
截至2013年誊垢,在電視和電影制作行業(yè)主要有三種常見幀率:24FPS掉弛、25FPS症见、30FPS喂走,以及HDTV常用的50FPS和60FPS。
比特率
播放一段視頻每秒所需的數(shù)據(jù)量就是它的比特率(即常說的碼率)谋作。
比特率 = 寬 * 高 * 顏色深度 * 幀速率
例如芋肠,一段每秒 30 幀,每像素 24 bits遵蚜,分辨率是 480x240 的視頻帖池,如果我們不做任何壓縮,它將需要 82,944,000 比特每秒或 82.944 Mbps (30x480x240x24)吭净。
當比特率幾乎恒定時稱為恒定比特率(CBR)睡汹;但它也可以變化,稱為可變比特率(VBR)寂殉。
這個圖形顯示了一個受限的 VBR囚巴,當幀為黑色時不會花費太多的數(shù)據(jù)量。
隔行掃描友扰、逐行掃描
在早期彤叉,工程師們想出了一項技術(shù)能將視頻的感官幀率加倍而沒有消耗額外帶寬。這項技術(shù)被稱為隔行掃描村怪;總的來說秽浇,它在一個時間點發(fā)送一個畫面——畫面用于填充屏幕的一半,而下一個時間點發(fā)送的畫面用于填充屏幕的另一半甚负。
如今的屏幕渲染大多使用逐行掃描技術(shù)柬焕。這是一種顯示审残、存儲、傳輸運動圖像的方法击喂,每幀中的所有行都會被依次繪制维苔。
平時所說的480P 、1080i 懂昂、1080P 指的是什么呢介时?
前面的數(shù)字指的視頻的寬高比中的高度,后面的P表示逐行掃描凌彬、i表示隔行掃描沸柔。
現(xiàn)在我們知道了數(shù)字化圖像的原理;它的顏色的編排方式铲敛;給定幀率和分辨率時褐澎,展示一個視頻需要花費多少比特率;它是恒定的(CBR)還是可變的(VBR)伐蒋;還有很多其它內(nèi)容工三,如隔行掃描、逐行掃描先鱼。
通過medinfo軟件俭正,可以查看一個視頻文件的上述信息
軟件測試,與你同行焙畔!公眾號:測試人追風掸读,領(lǐng)取一線大廠軟件測試&Python自動化面試題資料。