[TOC]
第二章 數(shù)字圖像處理基礎(chǔ)
- 人眼視覺(jué)特性
- 圖像感知和獲取
- 圖像數(shù)字化
- 像素間的基本關(guān)系
- 圖像文件格式
人眼視覺(jué)特效
1.光與電磁波譜
可見(jiàn)光譜:380nm~780nm
波長(zhǎng)越小,呈色越冷讲冠,波長(zhǎng)越長(zhǎng),呈色越暖洞难”纫蓿可見(jiàn)光譜區(qū)間之外,下區(qū)間為紫外線,上區(qū)間為紅外線莫秆,這些區(qū)間內(nèi)的光譜成像需要特殊的硬件設(shè)備。
2.人類視覺(jué)基礎(chǔ)
人眼生理結(jié)構(gòu):視網(wǎng)膜中三種椎體細(xì)胞對(duì)三種波長(zhǎng)的光最敏感悔详,也就是RGB镊屎,一個(gè)顏色進(jìn)入人眼,實(shí)際就是這三種細(xì)胞的感受茄螃。當(dāng)RGB以某種比例進(jìn)入人眼杯道,顏色感會(huì)消失,只剩下亮度感责蝠。
3.人眼視覺(jué)特性
小孔成像模型党巾,倒置成像。
視覺(jué)的空間特性
- 視覺(jué)的空間分辨能力為1‘(一分)
- 灰度分辨能力大約64級(jí)
視覺(jué)的時(shí)間特性
- > 15幀每妙霜医,具有連貫的感覺(jué)齿拂。
亮度適應(yīng)能力:人眼能通過(guò)改變靈敏度來(lái)適應(yīng)非常大的光強(qiáng)度變動(dòng)范圍。
主觀亮度:視覺(jué)系統(tǒng)感受到的亮度肴敛,是進(jìn)入人眼的光強(qiáng)度的對(duì)數(shù)函數(shù)署海,并不是光強(qiáng)度本身。
對(duì)比靈敏度:人能分辨的強(qiáng)度差△I医男,是I的函數(shù)砸狞,韋伯分?jǐn)?shù)=△I/I,韋伯分?jǐn)?shù)約等于0.02镀梭,就是說(shuō)刀森,強(qiáng)度相差2%的時(shí)候才能感受到光強(qiáng)度的不同,這個(gè)值和背景光強(qiáng)度也有關(guān)报账。target1和target2光強(qiáng)度相差大約2%研底,能感受兩個(gè)目標(biāo)不同,但是這個(gè)2%的閾值隨著整個(gè)背景的不同而有所不同透罢。
馬赫帶效應(yīng)榜晦,Mach Band,人的視覺(jué)系統(tǒng)會(huì)過(guò)高或過(guò)低估計(jì)不同亮度區(qū)域邊界值(簡(jiǎn)單理解為對(duì)不同強(qiáng)度具體天然分割功能羽圃,一種濾波處理)乾胶。
同時(shí)對(duì)比度:人的眼睛無(wú)法判斷出視場(chǎng)中目標(biāo)物的絕對(duì)亮度,因?yàn)槿祟愐曈X(jué)對(duì)亮度的主觀響應(yīng)與背景亮度有密切關(guān)系。
空間錯(cuò)覺(jué)和假輪廓:人對(duì)物體形狀的感知中另一個(gè)重要現(xiàn)象是錯(cuò)覺(jué)识窿。
圖像感知與獲取
1.傳感器
- 膠片(化學(xué)反應(yīng))斩郎,模擬圖像,需要數(shù)字化
- 電荷耦合器件CCD腕扶,charge coupled device孽拷,將光轉(zhuǎn)為電荷,存儲(chǔ)轉(zhuǎn)換后的電荷半抱。
- CMOS金屬-氧化物-半導(dǎo)體脓恕,metal-oxide-semiconductor。
CCD靈敏度窿侈、解析度炼幔、分辨率噪聲控制、成像等方面都優(yōu)于CMOS史简,但CMOS成本低乃秀、功耗低,整合度高的優(yōu)點(diǎn)圆兵。
2.成像方式
單個(gè)傳感器跺讯、帶狀傳感器、整列傳感器
圖像數(shù)字化
1.數(shù)字化殉农,digitizing-scanning/sampling and quantization刀脏。
將模擬圖像經(jīng)過(guò)離散化之后,得到數(shù)字表示的圖像超凳。
-
采樣:空間xy的離散化愈污,即像素。二維采樣定理(xy上離散的程度轮傍,通俗說(shuō)就是劃分多少格合適)暂雹。根據(jù)一維的香濃采樣定理推導(dǎo)二維上的采樣定理。二維采樣定理创夜,Nyguist準(zhǔn)則:
1/△x杭跪,1/△y ≥ 2倍的圖像函數(shù)上限頻帶
目前的數(shù)字圖像采樣通常都滿足,無(wú)需額外考慮采樣定理的限制挥下。
量化:強(qiáng)度Z的離散化揍魂。采樣后的各像素的灰度值從模擬量到離散量的轉(zhuǎn)換稱為圖像灰度的量化。若只取2級(jí)量化棚瘟,只有0和1,則為二值圖像喜最。
編碼:對(duì)離散的Z進(jìn)行編碼偎蘸,如對(duì)數(shù)據(jù)進(jìn)行PCM編碼(脈碼調(diào)制)。
2.數(shù)字圖像的性質(zhì)
分辨率
- 圖像分辨率,組成圖像的像素密度迷雪,單位為:像素*像素
- 顯示分辨率限书,顯示器上能顯示出的像素?cái)?shù)目。
- 其他的分辨率章咧,dpi倦西,display pixels/ inch。單位長(zhǎng)度顯示的像素?cái)?shù)量赁严。
像素深度:存儲(chǔ)每個(gè)像素所用的位數(shù)扰柠,也用來(lái)度量圖像的分辨率
位面層數(shù):區(qū)分灰度圖和彩色圖的√墼迹灰度圖只有一個(gè)位面卤档,彩色圖有三個(gè)位面——紅色分量、綠色分量程剥、藍(lán)色分量
像素之間的基本關(guān)系
1.像素的領(lǐng)域和鄰接
鄰域:與某一像素相鄰的像素的集合劝枣,反映像素間的空間關(guān)系。
- 4鄰域:$N_4(p)$织鲸,像素p的上下左右4個(gè)相鄰像素舔腾。它們到p點(diǎn)的距離都為1.
- 對(duì)角鄰域:$N_D(p)$.像素p的對(duì)角相鄰的4個(gè)像素。到p點(diǎn)的距離都為$\sqrt2$.
- 8-鄰域:4鄰域+對(duì)角鄰域搂擦,正好組成一個(gè)3*3矩陣稳诚。
當(dāng)P位于圖像邊界,認(rèn)為某些鄰域的點(diǎn)落在圖像外盾饮。
像素鄰接采桃,connectivity,空間上相鄰丘损,且像素灰度值相似普办。
- 鄰接判斷:1)是否存在鄰域關(guān)系?2)灰度值是否滿足某個(gè)特定的相似準(zhǔn)則v(相似的一種度量徘钥,如相等衔蹲、同處一個(gè)灰度值集合中)
- 三種鄰接:假設(shè)V為灰度值集合
- 4-鄰接:1)p和q都在v中取值(同處一個(gè)灰度值集合中)。2)q在p的4-鄰域中呈础。
- 8-鄰接:與上面4-鄰接相似舆驶,條件2改為q在p的8-鄰域中。
- m-鄰接(混合鄰接):兩個(gè)條件滿足一個(gè)即可而钞。
2.連通性
反應(yīng)兩個(gè)像素間的空間關(guān)系沙廉。
- 通路:像素p到q的一條通路,由一系列具有坐標(biāo)的獨(dú)立像素組成臼节,且路徑中的前后路徑點(diǎn)相鄰接撬陵。
- 連通:通路上所有像素灰度值滿足相似準(zhǔn)則珊皿。
3.距離度量
距離:對(duì)于像素p(x,y)和q(s,t)及z(u,v),若:
- D大于等于0巨税,且當(dāng)且僅當(dāng)p=q時(shí)蟋定,D=0
- D(p,q) = D(q,p)
- D(p,z)<=D(p,q)+D(q,z)
則,D可以作為距離的度量或D是距離函數(shù)
- 歐式距離:De草添,平面兩點(diǎn)距離公式驶兜。歐氏距離為半徑形成一個(gè)圓平面。
- 城市距離:D4远寸,兩個(gè)像素坐標(biāo)的絕對(duì)差值之和抄淑,等于△x+△y,城市距離為半徑而晒,形成一個(gè)菱形蝇狼。
圖像的文件格式
1.數(shù)字圖像類型
靜態(tài)圖像可分為矢量圖Vector和位圖Bitmap。
-
矢量圖:數(shù)學(xué)公式描述的圖像倡怎,可用一系列繪圖指令表示圖像迅耘。
優(yōu)點(diǎn):數(shù)據(jù)量小监署;質(zhì)量與分辨率無(wú)關(guān)颤专;無(wú)論圖像放大縮小多少倍,總是以顯示設(shè)備允許的最大清晰度顯示钠乏。
缺點(diǎn):色調(diào)栖秕、色彩不夠豐富;不夠逼真晓避;不易在不同軟件間交換使用簇捍。
-
位圖:用過(guò)像素點(diǎn)表示圖像,每個(gè)像素具有顏色屬性和位置屬性俏拱。
優(yōu)點(diǎn):顯示速度快暑塑;真實(shí)世界圖像可通過(guò)設(shè)備轉(zhuǎn)換為點(diǎn)位圖。
缺點(diǎn):存儲(chǔ)傳輸過(guò)程中數(shù)據(jù)量大锅必;縮放事格、旋轉(zhuǎn)時(shí)算法復(fù)雜且容易失真。
分類:
- 線畫(huà)稿LineArt搞隐,只有黑白兩種顏色驹愚,二值圖
- 灰度圖GrayScale,從黑到白的若干種灰度的單色圖像劣纲,常說(shuō)的黑白照片實(shí)際是灰度圖逢捺。
- 索引顏色位圖Index Color,映射顏色癞季,顏色是一組預(yù)先定義的蒸甜、有限的顏色棠耕,圖像最多只能顯示256種顏色余佛。
- 真彩色圖True Color柠新,24位圖,由RGB三個(gè)通道辉巡,每個(gè)通道8bit表示0到255之間的不同亮度值恨憎,共表示256*256*256=約為1670萬(wàn)中顏色。
2.圖像文件格式
圖像文件的格式即圖像文件的數(shù)據(jù)構(gòu)成郊楣,通常是一個(gè)文件頭憔恳,之后是圖像數(shù)據(jù)。
文件頭一般包括了文件類型净蚤、作者钥组、時(shí)間、版本號(hào)今瀑、文件大小等內(nèi)容程梦。
圖像數(shù)據(jù)包含圖像的壓縮方式和存儲(chǔ)效率等。
例如橘荠,BMP圖像文件格式
- 位圖文件頭屿附,bitmap fileheader
- 位圖信息頭,bitmap infoheader
- 調(diào)色板哥童,palette挺份,用于索引色,真彩色圖像不用調(diào)色板贮懈,infoheader之后就是實(shí)際位圖數(shù)據(jù)匀泊。
- 實(shí)際位圖數(shù)據(jù),image data朵你,真彩色下就是RGB的實(shí)際值各聘,索引圖像(用到調(diào)色板)下就是該店顏色在調(diào)色板中的顏色索引。