一. 眼睛
光纖進(jìn)入眼睛之后亮隙,經(jīng)過(guò)cornea和lens途凫,到達(dá)retina。我們的retina上有兩種sensor溢吻,rods和cones维费。rods分布在retina的絕大多數(shù)地方,擅長(zhǎng)在昏暗的環(huán)境中看東西促王;而cones用來(lái)看明亮的光線犀盟,但是cones分布集中在fovea上,所以我們通秤牵看東西需要變換視點(diǎn)阅畴,集中看一個(gè)物體。另外迅耘,retina上有一個(gè)點(diǎn)是什么sensor都沒有的贱枣,稱為blind spot,我們沒法看到正好進(jìn)入這個(gè)點(diǎn)的光線颤专。
?
眼睛會(huì)給我們帶來(lái)許多錯(cuò)覺纽哥,例如:
我們可以看清昏暗環(huán)境,也可以看清很亮的環(huán)境栖秕,但是我們沒法同時(shí)看清春塌。
昏暗環(huán)境下我們要分辨兩個(gè)物體,需要它們?cè)诹炼壬嫌懈蟮牟顒e;相對(duì)的摔笤,在明亮的地方够滑,微小的差別都能被我們識(shí)別。
淺色和深色相交的地方吕世,淺色看起來(lái)更淺彰触,深色看起來(lái)更深。
周邊的線條會(huì)讓我們對(duì)形狀命辖、長(zhǎng)度况毅、位置等幾何特征產(chǎn)生錯(cuò)覺。
二. 圖像表達(dá)
攝像機(jī)捕捉到連續(xù)信號(hào)尔艇,然后將其轉(zhuǎn)化為離散的信號(hào)尔许。這一過(guò)程在兩個(gè)方面影響著圖片。
sample: 將圖片分成若干像素终娃,即常說(shuō)的分辨率味廊;分辨率越高/像素越多,圖像看起來(lái)更像連續(xù)的棠耕。
quantity: 對(duì)顏色進(jìn)行量化余佛,越細(xì)分圖像失真越小。
RGB圖:常常有三張圖窍荧,分別表示R辉巡,G,B三個(gè)channel蕊退,來(lái)表示一幀畫面郊楣。舉例來(lái)說(shuō),一秒鐘30幀瓤荔,則需要30*3*512*512*8 bit净蚤,即大約188mb。廉價(jià)的處理方法是在一張圖上每個(gè)像素只取一種顏色茉贡,而鄰近像素分別取不同像素塞栅。
如果采取較少的顏色,可以使圖像所占空間變小腔丧,但是使圖像的顏色變化不再圓滑放椰。常用方法是n*ceil(x/n),其中n為壓縮倍數(shù)愉粤,通常為2的m次方砾医。
簡(jiǎn)單來(lái)說(shuō),圖像是一個(gè)二維矩陣衣厘,每個(gè)元素是一個(gè)RGB如蚜;或者三個(gè)二維矩陣压恒,分別表達(dá)RGB。
三. 圖像基本操作
鄰居:有4鄰居和8鄰居(包含角)兩種定義错邦。不同定義方法有不同的操作方法探赫。
相加:直接將兩張圖的矩陣相加。舉例:增強(qiáng)(去噪)撬呢。
相減:直接將兩張圖的矩陣相減伦吠。
union:集合取union
取反:略
用自己+所有相鄰像素的平均值取代自己:模糊、去噪
傅里葉變換: