音頻
數字音頻:采用數字編碼的方式也就是使用0和1來記錄存放蝙叛、編輯、壓縮或播放音頻的技術绞惦。
采樣率:即指在一秒鐘內對聲音信號的采樣次數逼纸,它采用赫茲(Hz)來表示,比如44.1KHz采樣率的聲音就是要花費44000個數據點來描述1秒鐘的聲音波形翩隧。原則上采樣率越高樊展,聲音質量越好。
采樣得到的數據寫成計算機的數據格式堆生,去除冗余信息者稱之為編碼专缠,再把音頻數據還原成采樣值叫解碼。把某一幅度范圍內的電壓用一個數字表示淑仆,這稱之為量化涝婉。采樣的值用多少位01表示即為量化精度。
碼率 = 采樣頻率 * 量化精度 * 聲道個數蔗怠,也就是一秒內數據量墩弯。
視頻
連續(xù)的圖像變化每秒超過24幀(Frame)畫面以上時,根據視覺暫留原理寞射,人眼無法辨別單幅的靜態(tài)畫面渔工,看上去時平滑連續(xù)的視覺效果,這樣連續(xù)的畫面的叫做視頻
幀是影像中常用的最小單位桥温,相當于電影中膠片的每一個鏡頭引矩,一幀就是一幅靜止的畫面,連續(xù)的幀就形成了視頻。
幀率:每秒鐘所傳輸圖片的個數旺韭,也可以理解為處理器每秒刷新的次數氛谜,通常用FPS標識,當然幀數越高区端,畫面也就越流暢值漫。
轉碼:指將一段多媒體包括音頻、視頻或者其他的內容從一種編碼格式轉換為另外一種編碼格式织盼。(原視頻 -- 解碼 -- 像素數據 -- 編碼 -- 目標視頻)杨何。
視頻編碼:就是文件當中的視頻所采用的壓縮算法,視頻編碼的主要作用是將視頻像素數據(RGB, YUV等)壓縮成為視頻碼流悔政,從而降低視頻的數據量晚吞。
其他概念入采樣、采樣率谋国、碼率和音頻類似。
視頻常用的編碼格式:H.265, H.264, MPEG-4d等等迁沫,常用的就是H.264
H.264可簡單的概括為幀內壓縮和幀間壓縮
幀內壓縮即可對每個獨立幀中的冗余信息去除芦瘾,盡可能壓縮圖片尺寸
幀間壓縮:多個幀組合在一起,被稱為GOP集畅,這組圖片中有一張關鍵圖片近弟,被稱為I幀,向前參考挺智,只考慮前面已經處理的幀祷愉,被稱為P幀,通過前后幀進行編碼得到的幀被稱為B幀赦颇。
所以 I 幀是很關鍵的存在二鳄,壓縮 I 幀就可以很容易壓制掉空間的大小,二壓縮 P/B 幀可以壓縮掉時間上的冗余信息媒怯。
視頻的清晰度主要和分辨率和碼率正相關订讼,一般分辨率越高,清晰度越高扇苞,但超過屏幕分辨率后欺殿,視頻分辨率對清晰度沒什么影響了。