自2012年,AlexNet在ImageNet圖像識別一戰(zhàn)成名后,基于深度學(xué)習(xí)的圖像識別快速發(fā)展鼓寺。
圖像識別也是深度學(xué)習(xí)研究的主要領(lǐng)域。
本文解釋在機(jī)器角度勋磕,圖片的存在形式妈候,這也是圖片在深度學(xué)習(xí)的輸入對象。
單通道圖片
單通道圖片/灰度圖在計(jì)算機(jī)中以數(shù)字的形式存儲挂滓,數(shù)值范圍在0-255(0是暗色苦银,255是亮色)
三通道圖片
彩色圖像通常由幾個疊加的彩色通道構(gòu)成。
例如赶站,平時常見的圖片一般都是RGB圖片幔虏,即由紅色、綠色贝椿、藍(lán)色三個通道組成的圖片想括,在表達(dá)每個像素點(diǎn)時用三個值表示,每個值取0~255烙博。
可以把這三個值理解為各種顏色的深度瑟蜈,比如(0烟逊,255,0)就是綠色铺根,是最深的那種綠色,比如(255,255,255)就是白色宪躯,因?yàn)榧t綠藍(lán)組合一起就是白色
例如下圖是一張的RGB圖片,對應(yīng)到計(jì)算機(jī)上是三張數(shù)據(jù)表位迂,每張表有個數(shù)值眷唉。位置(i,j)的值為分別取三張表位置(i,j)的值組成