圖像如函數(shù)

好久沒寫博客了尖啡,寫一波婉宰。此為umich eecs504的第二課筆記妙色。

圖像分類

完美圖像

完美圖像(perfect image)是連續(xù)圖形,完美圖像由一個(gè)物理過程所產(chǎn)生赵辕。

將這個(gè)物理過程用I所表示既绩,他們代表了從平面上的點(diǎn)到一個(gè)數(shù)字的映射,即

I: R^2\rightarrow R

Remark: 0<I(\cdot)<\infty

Remark: 抽象后我們可以將定義域看作超平面上的點(diǎn)匆帚,其維度可以超過2 熬词。如此旁钧,哦我們可以將它們定義成一個(gè)映射:

I: R^k \rightarrow R

由所經(jīng)受的物理過程所決定

Remark: 完美圖像僅在無法取樣的時(shí)候存在抽象化吸重。

例子:朗伯模型(Lambertian Image)

朗伯模型是一個(gè)經(jīng)典的漫反射模型。朗博模型中光的反射量由入射角的余弦角所決定歪今。

考慮一個(gè)點(diǎn)x \in R^3 在朗伯表面上嚎幸,其對此表面的法向量n(x) 。入射角的方向是l(x)寄猩。 此時(shí)反射可以寫作:

R(x) = \rho l(x)^Tn(x)

其中\rho是一個(gè)常量嫉晶,用于描述材料屬性。

仍和的反射光與我們的圖像平面相交時(shí)田篇,都會引起我們的完美圖像

I(u) = P(R(x))

其中P投影函數(shù)替废,I(u)是投影的能量

問題:朗伯模型的缺點(diǎn)是什么?

朗伯模型難以對光滑的表面泊柬,比如金屬椎镣,進(jìn)行建模。此時(shí)我們需要Phong模型兽赁。

lambertian.png

數(shù)字圖像

雖然我們不能直接獲得完美圖像状答,但是我們可以通過電子設(shè)備將其轉(zhuǎn)換之。如此做刀崖,我們可以通過量化取樣完美圖像來獲得數(shù)字圖像惊科。

定義:數(shù)字圖像是取樣和量化完美圖像所獲得。它們展現(xiàn)出從點(diǎn)到非負(fù)自然像素(non-negative natural pixels)到自然數(shù)的映射

N_0 ^2\rightarrow N_0

Remark:數(shù)字化是一個(gè)投影(R^2 \rightarrow R)

Remark:“取樣”指的是坐標(biāo)值的數(shù)字化亮钦,“量化”指的是(能量馆截,亮度)強(qiáng)度值的數(shù)字化。

Remark:取樣密度由傳感器的物理限制所約束

Remark:量化深度由特殊的硬件所決定蜂莉。8bit的量化廣泛應(yīng)用于數(shù)字化的圖像蜡娶。

Remark: 在特定的數(shù)字化情境下(可能指Bayer pattern)完美圖像被用于梳理感興趣的信號。

數(shù)字圖像建模

對數(shù)字圖像的數(shù)學(xué)解釋

  1. 一個(gè)從像素到數(shù)字的離散函數(shù)
  2. 作為對于原來完美圖像的一個(gè)近似巡语,我們對一個(gè)函數(shù)的值域和定義域進(jìn)行了一個(gè)泛化翎蹈,并且用函數(shù)的形式呈現(xiàn)出來。(We generalize domain and range of this function to once again consider a continuous image, albeit an approximate one to our original perfect image男公,這句話有點(diǎn)離譜)

定義:一個(gè)離散圖像是一個(gè)數(shù)字圖像的自然數(shù)的數(shù)字型概述荤堪。它獲取數(shù)字圖像中的整數(shù)像素位置并且將其映射到整數(shù)像素值上合陵。I:Z^3\rightarrow Z

Remark:它可以表示更高維的圖像,比如Z^3(視頻)澄阳,并且值域維度也可以更高拥知,比如Z^ 3(三色圖像)。

Remark:我們將一個(gè)圖像的值于的整數(shù)的子集稱作\Lambda

例子:Potts 模型

Potts模型是一個(gè)離散圖像模型碎赢。Potts模型最初在統(tǒng)機(jī)物理學(xué)中作為雙態(tài)化模型(two-state Ising model)的推廣而派生出來的低剔。它假定了一個(gè)分段常熟圖像信號。對于大小為n\times n的圖像肮塞,我們將其寫作能量泛函(energy functional)襟齿。

E(I)=\beta \Sigma^{n-1}_{s=1}\Sigma^{n}_{t=1}(1[I(s, t)\neq(s+1, t)]+\beta \Sigma^{n-1}_{s=1}\Sigma^{n}_{t=1}(1[I(s, t)\neq(s, t+1)])

\beta是一個(gè)建模常數(shù),最初與所研究的材料的物理性質(zhì)有關(guān)枕赵,我們忽略了區(qū)域上的邊界條件1是指示器函數(shù)猜欺。根據(jù)Potts模型的定義,我們發(fā)現(xiàn)模型的能量正比于橫縱像素的變化拷窜。當(dāng)圖像I由大的恒定取與开皿,他將具有相應(yīng)的能量。

定義:一個(gè)連續(xù)圖像可以將離散圖像泛化(generalize)為定義域與值域篮昧。

Remark:對于離散圖像的相似的定義域和值于的泛化可以用于連續(xù)模型

Remark:離散與連續(xù)混合的表現(xiàn)是非常常見的

Remark:插值赋荆。通過數(shù)字化過程,最初的完美圖像已經(jīng)被量化到整數(shù)坐標(biāo)了懊昨。為了研究連續(xù)圖形并分析窄潭,我們需要不斷地對非整數(shù)坐標(biāo)進(jìn)行插值。

圖像操作

在圖像的函數(shù)解釋下疚颊,我們可以用數(shù)學(xué)的角度去處理圖像狈孔。

在圖像的函數(shù)解釋下,圖像的三個(gè)主要操作:

  1. 空間范圍操作(Spatial Range Operation)如計(jì)算圖像所有強(qiáng)度值的和
  2. 范圍映射操作(Range map operation)比如計(jì)算圖的差別
  3. 定義域操作或幾何變換比如平移和旋轉(zhuǎn)

空間范圍操作

空間范圍操作講一個(gè)區(qū)域內(nèi)所有信息集合起來材义,將一個(gè)圖像的區(qū)域定義成W\subseteq \Lambda \subseteq Z^2 均抽。其中W代表一張圖像中的窗口(windows)。

定義:一個(gè)空間范圍操作f是一個(gè)講一張圖映射到一個(gè)實(shí)數(shù)的函數(shù)

f: W\times(Z^2\rightarrow Z)\rightarrow R / W \times I \rightarrow R

其中I為圖像本身其掂。

Remark:我們使用縮寫I[W]來表示定義域由W所截取的新圖油挥,這種新圖也叫子圖(sub-image),或者image patch款熬。

Remark:我們可以講W當(dāng)作一種函數(shù)深寥,當(dāng)W=\Lambda\rightarrow B^{\Lambda}時(shí),這種函數(shù)講像素映射到B=\{0, 1\}贤牛。我們可以將mask應(yīng)用在圖像上惋鹅。在空間范圍操作應(yīng)用之前,我們也可以基于窗口W在函數(shù)f上實(shí)現(xiàn)特殊的定義域殉簸。

Remark:一個(gè)空間范圍操作是線性的當(dāng)

f_W(\alpha_i I_i + \alpha_j I_j)=\alpha_i f_W(I_i)+\alpha_jf_W(I_j)

\alpha_i\alpha_j是任意常標(biāo)量闰集。

Remark:空間范圍操作可以在圖像領(lǐng)域中被組合去組成復(fù)雜的操作符沽讹。

范圍映射操作

范圍映射擦歐總作用于圖像值域,他們將單個(gè)操作作用域整個(gè)圖像域\Lambda

定義:一個(gè)范圍映射操作g:(W\times I \rightarrow R)\times I \rightarrow J對于圖像J來說武鲁,是一個(gè)函數(shù)f作用域圖像定義域\Lambda的每一個(gè)空間中爽雄,范圍映射操作會產(chǎn)生一個(gè)新的圖像。

圖像J f: W \times I \rightarrow R

procedure GENERIC_RANGE_MAP_OPERATOR:
foreach pixel s \in \Lambda_J do

? let W_s be the window into \Lambda at centered at s

? J(s)=f(I, W_s)

? end for

end procedure

Remark:范圍映射操作的輸出集是實(shí)數(shù)集沐鼠。實(shí)際操作上挚瘟,它常被放寬到實(shí)數(shù)或者其他的范圍。

Remark:范圍映射操作通常被用于一個(gè)被稱作強(qiáng)度轉(zhuǎn)換(intensity transformations)的像素窗口饲梭。文獻(xiàn)中存在許多可能的強(qiáng)度變換 (very many possibly intensity transformations exist in the literature乘盖,不會翻譯)并且包括了操作符比如直方圖均衡化(histogram equalization),線性放大(linear scaling)或者log轉(zhuǎn)換等排拷。

例子單像素范圍映射強(qiáng)度轉(zhuǎn)換侧漓。一個(gè)強(qiáng)度轉(zhuǎn)換的例子是對負(fù)圖像的轉(zhuǎn)換。每一個(gè)新像素的值是輸入值的負(fù)值监氢。

J(S)=-I(S)

Remark:一個(gè)特殊的范圍映射例子是映射到二進(jìn)制像素而不是實(shí)數(shù):

g:(W\times I\rightarrow B)\times I \rightarrow B

對于二進(jìn)制圖像B

例子二進(jìn)制函數(shù)的范圍映射

考研率一個(gè)二進(jìn)制閾值操作符f_b藤违。在一個(gè)確定的范圍對每一個(gè)像素窗口浪腐,f_b選擇像素值(\Gamma^-\le I[W]\le \Gamma^+)

f_b(I[W];\Gamma^-,\Gamma^+)=\left\{ \begin{aligned} 1\quad & \Gamma^-\leq I[W]\leq\Gamma^+\\ 0\quad & otherwise \end{aligned} \right.

或在更大的窗口中使用空間范圍操作符顿乒,比如:

f_b(I议街,W;\Gamma^-,\Gamma^+)=\left\{ \begin{aligned} 1\quad & \Gamma^-\leq sum(I, W)\leq\Gamma^+\\ 0\quad & otherwise \end{aligned} \right.

Remark:在一個(gè)范圍操作符中,空間范圍操作在一個(gè)大窗口W將應(yīng)用相同的操作在這個(gè)圖的每一個(gè)區(qū)域內(nèi)璧榄。

Remark:一個(gè)特別重要的參數(shù)在一個(gè)空間操作符中的是核(kernel)特漩。一個(gè)核\kappa是一個(gè)與W大小相同的矩陣。核的值都是實(shí)數(shù)骨杂,\kappa\in\mathbb{R}^{|W|}涂身。在核操作中,核\kappa與圖像窗口I[W]的元素積操作被計(jì)算與累加起來搓蚪。這個(gè)操作最容易被向量化的核\kappa與圖像窗口I[W]的點(diǎn)積所表示蛤售。向量化一個(gè)矩陣代表連接一個(gè)矩陣的所在列,并且將其連成一個(gè)長列向量妒潭。

當(dāng)核操作被應(yīng)用于整個(gè)圖像中的一個(gè)范圍映射的時(shí)候悴能,我們可以將這個(gè)過程稱作離散卷積,并用符號\otimes表示雳灾。我們?yōu)榱溯敵鰣D像位置J(s, t)而寫下這個(gè)卷積漠酿。核的大小是2m+1\times 2m+1因此一個(gè)窗口可以索引至s-m ...s+mt-n ... t+n被寫作

J(s, t) = \kappa \otimes I[W]=\Sigma^m_{k=-m}\Sigma^n_{l=-n}\kappa(k,l)I(s-k, t-l)=\vec{\kappa}^TI\vec{[W]}

我們將核映射應(yīng)用于所有位置,適當(dāng)?shù)乜紤]圖像邊界谎亩,即簡單的說\kappa\otimes I炒嘲,它是創(chuàng)建圖像的函數(shù)谈竿。這里有一個(gè)卷積的連續(xù)模擬,但是我們暫不進(jìn)行討論摸吠。假如維度與核相匹配空凸,這個(gè)操作可以清晰地泛化到高維。

例子離散圖像求導(dǎo)

在圖像的函數(shù)解釋下寸痢,像這樣的計(jì)算式非常正常的呀洲。

I(x, y)的部分求導(dǎo)是

\frac{\partial I(x,y)}{\partial x} = lim_{h\rightarrow 0}\frac{I(x+h, y)-I(x, y)}{h}

考慮一個(gè)離散圖像模型,我們有一個(gè)固定的值h可以讓我們?nèi)タ紤]一個(gè)有限(離散)差別的解釋:

\frac{dI(x,y)}{dx}=\frac{I(x+h,y)-I(x,y)}{h}

最后啼止,考慮到離散圖像I道逗,我們可以將h設(shè)為1來表示一個(gè)像素的差別。我們將有限差別符設(shè)為\nabla_x=\frac{dI(x,y)}{dx}=I(x+1,y)-I(x,y)

將其用于核中献烦,則縱向?yàn)?img class="math-inline" src="https://math.jianshu.com/math?formula=%5Ckappa%3D%5B1%2C-1%5D%5ET" alt="\kappa=[1,-1]^T" mathimg="1">滓窍,橫向?yàn)?img class="math-inline" src="https://math.jianshu.com/math?formula=%5Ckappa%3D%5B1%2C-1%5D" alt="\kappa=[1,-1]" mathimg="1">

Remark:范圍操作可以是二元,三元巩那,或者同時(shí)任意數(shù)字

例子圖像拉普拉斯與0-crossing

考慮圖像I 被核\kappa_1\kappa_2所卷積處理吏夯,\kappa_1\kappa_2是分別從\sigma=1\sigma=2的高斯函數(shù)中取樣出來。將卷積出來的圖像稱為G_1G_2即横。取兩者之差G_2-G_1噪生。可以發(fā)現(xiàn)圖像的邊緣被凸顯出來东囚。

一個(gè)突然的強(qiáng)度改變會在一階導(dǎo)提升到頂峰跺嗽,或者在二階導(dǎo)達(dá)到0-crossing

之前的例子(離散圖像求導(dǎo))表現(xiàn)了一階導(dǎo),這個(gè)例子考慮二階導(dǎo)

\nabla^2=\frac{\partial^2}{\partial x^2}+\frac{\partial^2}{\partial y^2}

這兩個(gè)(二階導(dǎo)和高斯核)效果相近

專業(yè)術(shù)語翻譯對照(不確定是不是對的)

完美圖像: perfect Image

定義域: Domain

值域:range

朗伯模型Lambertian Model

數(shù)字圖像 digital Image

非負(fù)自然像素 non-negative natural pixels

取樣:Sampling

量化:quantization

感興趣的信號 signals of interest.

雙態(tài)化模型:two-state Ising model

指示器函數(shù):indicator function

泛化generalize

空間范圍操作 Spatial Range Operation

范圍映射操作 Range map operation

文獻(xiàn)中 in the literature

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末页藻,一起剝皮案震驚了整個(gè)濱河市桨嫁,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌份帐,老刑警劉巖璃吧,帶你破解...
    沈念sama閱讀 216,591評論 6 501
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異弥鹦,居然都是意外死亡肚逸,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 92,448評論 3 392
  • 文/潘曉璐 我一進(jìn)店門彬坏,熙熙樓的掌柜王于貴愁眉苦臉地迎上來朦促,“玉大人,你說我怎么就攤上這事栓始∥衩幔” “怎么了?”我有些...
    開封第一講書人閱讀 162,823評論 0 353
  • 文/不壞的土叔 我叫張陵幻赚,是天一觀的道長禀忆。 經(jīng)常有香客問我臊旭,道長,這世上最難降的妖魔是什么箩退? 我笑而不...
    開封第一講書人閱讀 58,204評論 1 292
  • 正文 為了忘掉前任离熏,我火速辦了婚禮,結(jié)果婚禮上戴涝,老公的妹妹穿的比我還像新娘滋戳。我一直安慰自己,他們只是感情好啥刻,可當(dāng)我...
    茶點(diǎn)故事閱讀 67,228評論 6 388
  • 文/花漫 我一把揭開白布奸鸯。 她就那樣靜靜地躺著,像睡著了一般可帽。 火紅的嫁衣襯著肌膚如雪娄涩。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 51,190評論 1 299
  • 那天映跟,我揣著相機(jī)與錄音蓄拣,去河邊找鬼。 笑死申窘,一個(gè)胖子當(dāng)著我的面吹牛弯蚜,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播剃法,決...
    沈念sama閱讀 40,078評論 3 418
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼路鹰!你這毒婦竟也來了贷洲?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 38,923評論 0 274
  • 序言:老撾萬榮一對情侶失蹤晋柱,失蹤者是張志新(化名)和其女友劉穎优构,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體雁竞,經(jīng)...
    沈念sama閱讀 45,334評論 1 310
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡钦椭,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 37,550評論 2 333
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了碑诉。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片彪腔。...
    茶點(diǎn)故事閱讀 39,727評論 1 348
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖进栽,靈堂內(nèi)的尸體忽然破棺而出德挣,到底是詐尸還是另有隱情,我是刑警寧澤快毛,帶...
    沈念sama閱讀 35,428評論 5 343
  • 正文 年R本政府宣布格嗅,位于F島的核電站番挺,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏屯掖。R本人自食惡果不足惜玄柏,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 41,022評論 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望贴铜。 院中可真熱鬧粪摘,春花似錦、人聲如沸阀湿。這莊子的主人今日做“春日...
    開封第一講書人閱讀 31,672評論 0 22
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽陷嘴。三九已至映砖,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間灾挨,已是汗流浹背邑退。 一陣腳步聲響...
    開封第一講書人閱讀 32,826評論 1 269
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留劳澄,地道東北人地技。 一個(gè)月前我還...
    沈念sama閱讀 47,734評論 2 368
  • 正文 我出身青樓,卻偏偏與公主長得像秒拔,于是被迫代替她去往敵國和親莫矗。 傳聞我的和親對象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 44,619評論 2 354