姓名:杜敏剛? ? ? 學(xué)號(hào):17021211253
【嵌牛導(dǎo)讀】計(jì)算機(jī)視覺是使用計(jì)算機(jī)及相關(guān)設(shè)備對(duì)生物視覺的一種模擬摇肌。它的主要任務(wù)就是通過對(duì)采集的圖片或視頻進(jìn)行處理以獲得相應(yīng)場(chǎng)景的三維信息庵佣,就像人類和許多其他類生物每天所做的那樣痪宰。由于計(jì)算機(jī)視覺學(xué)在工農(nóng)業(yè)生產(chǎn)役耕、地質(zhì)學(xué)贸铜、天文學(xué)秽五、氣象學(xué)孽查、醫(yī)學(xué)及軍事并學(xué)等領(lǐng)域有著極大的潛在應(yīng)用價(jià)值,所以它在國(guó)際上越來(lái)越受人重視。本文簡(jiǎn)要地介紹了計(jì)算機(jī)視覺學(xué)結(jié)構(gòu)和研究?jī)?nèi)容,它同附近學(xué)科的關(guān)系,計(jì)算機(jī)視覺研究中面臨的技術(shù)難點(diǎn)以及計(jì)算機(jī)視覺學(xué)的歷史,現(xiàn)狀和研究動(dòng)向坦喘。
【嵌牛鼻子】計(jì)算機(jī)視覺;圖像;應(yīng)用
【嵌牛提問】什么是計(jì)算機(jī)視覺盲再?計(jì)算機(jī)視覺技術(shù)有哪些應(yīng)用?
【嵌牛正文】
1緒論
計(jì)算機(jī)視覺學(xué)是自二十世紀(jì)六十年代中期迅速發(fā)展起來(lái)的一門新學(xué)科瓣铣。它是個(gè)邊緣學(xué)科答朋,集眾家之所長(zhǎng),是個(gè)工程性很強(qiáng)的技術(shù)棠笑,主要需要有空間幾何梦碗、矩陣分析、光電技術(shù)蓖救、圖像處理洪规、應(yīng)用數(shù)學(xué)、離散數(shù)學(xué)及計(jì)算機(jī)技術(shù)等等各個(gè)方面的知識(shí)循捺,才能正確的指導(dǎo)視覺系統(tǒng)的建模淹冰、解模及實(shí)際工程問題的解決方法。計(jì)算機(jī)視覺系統(tǒng)一般有光源巨柒、攝像機(jī)樱拴、采集卡及PC軟件系統(tǒng)等組成柠衍,可以完成圖像的采集與處理、目標(biāo)的識(shí)別功能晶乔,視覺系統(tǒng)的結(jié)構(gòu)一般是從系統(tǒng)的模型的角度理解的珍坊。
計(jì)算機(jī)視覺既是工程領(lǐng)域,也是科學(xué)領(lǐng)域中的一個(gè)富有挑戰(zhàn)性重要研究領(lǐng)域正罢。計(jì)算機(jī)視覺是一門綜合性的學(xué)科阵漏,它已經(jīng)吸引了來(lái)自各個(gè)學(xué)科的研究者參加到對(duì)它的研究之中。其中包括計(jì)算機(jī)科學(xué)和工程翻具、信號(hào)處理履怯、物理學(xué)、應(yīng)用數(shù)學(xué)和統(tǒng)計(jì)學(xué)裆泳,神經(jīng)生理學(xué)和認(rèn)知科學(xué)等叹洲。
計(jì)算機(jī)視覺學(xué)所研究的對(duì)象,簡(jiǎn)單地說(shuō)就是研究如何讓計(jì)算機(jī)通過圖象傳感器或其它光傳感器來(lái)感知、分析和理解周圍環(huán)境工禾。
人類感知外界環(huán)境主要通過視覺,聽覺和觸覺等四大感覺系統(tǒng)运提。其中視覺系統(tǒng)是最復(fù)雜的。人類從外界獲得的信息中視覺信號(hào)量最大闻葵。
模仿人類的視覺系統(tǒng),計(jì)算機(jī)視覺系統(tǒng)中信息的處理和分析大致可以分成兩個(gè)階段:圖象處理階段又稱視覺處理中的低水平和中水平階段民泵;圖象分析、理解階段又稱視覺處理中的高水平處理階段槽畔。
在圖象處理階段,計(jì)算機(jī)對(duì)圖象信息進(jìn)行一系列的加工處理,這主要是:
1栈妆、校正成象過程中系統(tǒng)引進(jìn)的光度學(xué)和幾何學(xué)的畸變,抑制和去除成象過程中引進(jìn)的噪聲—統(tǒng)稱為圖象的恢復(fù)。
2厢钧、從圖象信息如亮度分布信息中提取諸如邊沿信息,深度信息圖象點(diǎn)沿軸方向的尺度,表面三維傾斜方向信息等反映客觀景物特征的信息鳞尔。
3、根據(jù)抽取的特征信息把反映三維客體的各個(gè)圖象基元,如輪廓坏快、線條、紋理憎夷、邊緣莽鸿、邊界、物體的各個(gè)面等從圖象中分離出來(lái),并且建立起各個(gè)基元之間的拓樸學(xué)上的和幾何學(xué)上的關(guān)系—稱之基元的分割和關(guān)系的確定拾给。
在圖象分析和理解階段,計(jì)算機(jī)根據(jù)事先存貯在數(shù)據(jù)庫(kù)中的預(yù)知識(shí)模型,識(shí)別出各個(gè)基元或某些基元組合所代表的客觀世界中的某些實(shí)體稱之為模型匹配以及根據(jù)圖象中各基元之間的關(guān)系在預(yù)知識(shí)的指導(dǎo)下得出圖象所代表的實(shí)際景物的含義,得出圖象的解釋或描述祥得。
必須強(qiáng)調(diào),預(yù)知識(shí)在視覺系統(tǒng)中起著相當(dāng)重要的作用。在預(yù)知識(shí)庫(kù)中存放著各種實(shí)際可能遇到的物體的知識(shí)模型,和實(shí)際景物中各種物體之間的約束關(guān)系蒋得。計(jì)算機(jī)的作用是根據(jù)被分析的圖象中的各基元及其關(guān)系,利用預(yù)知識(shí)作為指導(dǎo),通過匹配,搜索和推理等手段,最終得到對(duì)圖象的描述级及。在整個(gè)過程中預(yù)知識(shí)時(shí)刻提供處理的樣板和證據(jù)。每一步的處理結(jié)果隨時(shí)同預(yù)知識(shí)進(jìn)行對(duì)比额衙。有時(shí),處理的中間結(jié)果和最終結(jié)果還要饋送給預(yù)知識(shí)庫(kù)作為知識(shí)的更新和積累饮焦。
2圖像分割研究
圖像分割是圖像處理與機(jī)器視覺的基本問題之一怕吴。其要點(diǎn)是:把圖像劃分成若干互不交迭區(qū)域的集合。這些區(qū)域要么對(duì)當(dāng)前的任務(wù)有意義,要么有助于說(shuō)明它們與實(shí)際物體或物體的某些部分之間的對(duì)應(yīng)關(guān)系县踢。圖像分割的應(yīng)用十分廣泛,幾乎出現(xiàn)在有關(guān)圖像處理的所有領(lǐng)域,并涉及各種類型的圖像转绷。例如,在遙感應(yīng)中,合成孔徑雷達(dá)圖像中目標(biāo)的分割;遙感云圖中不同云系和背景分布的分割;在交通圖像分析中,把車輛目標(biāo)從背景中分割出來(lái)。在這些應(yīng)用中,分割通常是為了進(jìn)一步對(duì)圖像進(jìn)行分析硼啤、識(shí)別议经、壓縮編碼,分割的準(zhǔn)確性直接影響后續(xù)任務(wù)的有效性。
一般來(lái)講,分割出的區(qū)域需同時(shí)滿足均勻性和連通性的條件谴返。其中均勻性是指在該區(qū)域中的所有象素點(diǎn)都滿足基于灰度煞肾、紋理、彩色等特征的某種相似性準(zhǔn)則;連通性是指在該區(qū)域內(nèi)存在任意兩點(diǎn)的路徑嗓袱。盡管圖像處理和機(jī)器視覺界的研究者們?yōu)榇烁冻隽碎L(zhǎng)期的努力,符合以上兩點(diǎn)的通用性分割仍面臨著巨大的困難;大部分研究成果都是針對(duì)某一類型圖像籍救、某一具體應(yīng)用的分割∷髯ィ可以概括為以下內(nèi)容钧忽。
2.1數(shù)據(jù)驅(qū)動(dòng)的分割
常見的數(shù)據(jù)驅(qū)動(dòng)分割包括基于邊緣檢測(cè)的分割、基于區(qū)域的分割逼肯、邊緣與區(qū)域相結(jié)合的分割等耸黑。對(duì)于基于邊緣檢測(cè)的分割,其基本思想是先檢測(cè)圖像中的邊緣點(diǎn),再按一定策略連接成輪廓,從而構(gòu)成分割區(qū)域。難點(diǎn)在于邊緣檢測(cè)時(shí)抗噪聲性能和檢測(cè)精度的矛盾,若提高檢測(cè)精度,則噪聲產(chǎn)生的偽邊緣會(huì)導(dǎo)致不合理的輪廓;若提高抗噪聲性能,則會(huì)產(chǎn)生輪廓漏檢和位置偏差篮幢。為此,人們提出各種多尺度邊緣檢測(cè)方法,根據(jù)實(shí)際問題設(shè)計(jì)多尺度邊緣信息的結(jié)合方案,以較好地兼顧抗噪聲性能和檢測(cè)精度大刊。
基于區(qū)域的分割的基本思想是根據(jù)圖像數(shù)據(jù)的特征將圖像空間劃分成不同的區(qū)域。常用的特征包括:直接來(lái)自原始圖像的灰度或彩色特征;由原始灰度或彩色值變換得到的特征三椿。方法有閾值法缺菌、區(qū)域生長(zhǎng)法、聚類法搜锰、松弛法等伴郁。
邊緣檢測(cè)能夠獲得灰度或彩色值的局部變化強(qiáng)度,區(qū)域分割能夠檢測(cè)特征的相似性與均勻性。將兩者結(jié)合起來(lái),通過邊緣點(diǎn)的限制,避免區(qū)域的過分割;同時(shí)通過區(qū)域分割補(bǔ)充漏檢的邊緣,使輪廓更加完整蛋叼。例如,先進(jìn)行邊緣檢測(cè)與連接,再比較相鄰區(qū)域的特征(灰度均值焊傅、方差),若相近則合并;對(duì)原始圖像分別進(jìn)行邊緣檢測(cè)和區(qū)域生長(zhǎng),獲得邊緣圖和區(qū)域片段圖后,再按一定的準(zhǔn)則融合,得到最終分割結(jié)果。
2.2模型驅(qū)動(dòng)的分割
常見的模型驅(qū)動(dòng)分割包括基于動(dòng)態(tài)輪廓(Snakes)模型狈涮、組合優(yōu)化模型狐胎、目標(biāo)幾何與統(tǒng)計(jì)模型。Snakes模型用于描述分割目標(biāo)的動(dòng)態(tài)輪廓歌馍。由于其能量函數(shù)采用積分運(yùn)算,具有較好的抗噪聲性,對(duì)目標(biāo)的局部模糊也不敏感,因而適用性很廣握巢。但這種分割方法容易收斂到局部最優(yōu),因此要求初始輪廓應(yīng)盡可能靠近真實(shí)輪廓。
近年來(lái)對(duì)通用分割方法的研究?jī)A向于將分割看作一個(gè)組合優(yōu)化問題,并采用一系列優(yōu)化策略完成圖像分割任務(wù)松却。主要思路是在分割定義的約束條件之外,根據(jù)具體任務(wù)再定義一個(gè)優(yōu)化目標(biāo)函數(shù),所求分割的解就是該目標(biāo)函數(shù)在約束條件下的全局最優(yōu)解暴浦。以組合優(yōu)化的觀點(diǎn)處理分割問題,主要是利用一個(gè)目標(biāo)函數(shù)綜合表示分割的各種要求和約束,將分割變?yōu)槟繕?biāo)函數(shù)的優(yōu)化求解溅话。由于目標(biāo)函數(shù)通常是一個(gè)多變量函數(shù),可采用隨機(jī)優(yōu)化方法。
基于目標(biāo)幾何與統(tǒng)計(jì)模型的分割是將目標(biāo)分割與識(shí)別集成在一起的方法,常稱作目標(biāo)檢測(cè)或提取肉渴」基本思想是將有關(guān)目標(biāo)的幾何與統(tǒng)計(jì)知識(shí)表示成模型,將分割與識(shí)別變?yōu)槠ヅ浠虮O(jiān)督分類。常用的模型有模板同规、特征矢量模型循狰、基于連接的模型等。這種分割方法能夠同時(shí)完成部分或全部識(shí)別任務(wù),具有較高的效率券勺。然而由于成像條件變化,實(shí)際圖像中的目標(biāo)往往與模型有一定的區(qū)別,需要面對(duì)誤檢與漏檢的矛盾,匹配時(shí)的搜索步驟也頗為費(fèi)時(shí)绪钥。
2.3圖像分割的半自動(dòng)方法
從人工參與程度來(lái)看,圖像分割可分為人工、半自動(dòng)关炼、自動(dòng)等三種類型程腹。其中人工分割完全由操作者利用鼠標(biāo)勾畫出分割區(qū)域的輪廓,費(fèi)時(shí)費(fèi)力,且容易受操作者主觀因素的影響,重復(fù)性差。自動(dòng)分割不需人機(jī)交互,但適應(yīng)性差,很難實(shí)現(xiàn)對(duì)一批圖像同時(shí)獲得滿意的分割效果儒拂。半自動(dòng)分割將人機(jī)交互與自動(dòng)分割相結(jié)合,能夠適應(yīng)不同的圖像和需求,且有效降低計(jì)算復(fù)雜度寸潦。目前半自動(dòng)分割中人機(jī)交互的方式有:勾畫目標(biāo)的大致輪廓,構(gòu)成自動(dòng)分割的初始化;根據(jù)特定的圖像和任務(wù)調(diào)整算法參數(shù);在分割過程中加入人工交互節(jié)等∩缤矗總之,從實(shí)用化的角度看,自動(dòng)分割仍是長(zhǎng)期努力的方向见转。目前更為現(xiàn)實(shí)的是在自動(dòng)分割前或分割過程中加入人機(jī)交互的半自動(dòng)分割。其發(fā)展方向?yàn)楸M可能少和簡(jiǎn)便的人機(jī)交互蒜哀≌扼铮可見,圖像分割是圖像處理和機(jī)器視覺必不可少的重要環(huán)節(jié),也是圖像理論發(fā)展的瓶頸之一。隨著計(jì)算機(jī)速度與容量的快速進(jìn)展,圖像處理與機(jī)器視覺實(shí)用化系統(tǒng)碩果累累撵儿。例如,基于內(nèi)容的圖像檢索系統(tǒng)乘客、智能監(jiān)視系統(tǒng)、視覺引導(dǎo)的智能交通系統(tǒng)淀歇、手寫體字符/人臉/指紋/虹膜識(shí)別系統(tǒng)等易核。然而有關(guān)的理論研究并沒有取得突破性進(jìn)展。
3視覺技術(shù)的研究
人類很多研究都是以延伸人類能力為目的的,早期的工作是在體力上延伸,計(jì)算機(jī)發(fā)明以來(lái),就拓展到對(duì)人類腦力和感知能力的延伸上浪默。對(duì)人類視覺感知能力的計(jì)算機(jī)模擬導(dǎo)致了計(jì)算機(jī)視覺的產(chǎn)生牡直。計(jì)算機(jī)視覺也經(jīng)常被稱為圖像理解,是指研究完成一項(xiàng)任務(wù)所需的視覺信息及如何從圖像中獲取這些信息的研究領(lǐng)域。其基本目的有三個(gè):
(1)根據(jù)一幅或多幅二維投影圖像計(jì)算出觀察點(diǎn)到目標(biāo)物體的距離;
(2)根據(jù)一幅或多幅二維投影圖像計(jì)算出觀察點(diǎn)到目標(biāo)物體的運(yùn)動(dòng)參數(shù);
(3)根據(jù)一幅或多幅二維投影圖像計(jì)算出觀察點(diǎn)到目標(biāo)物體的表面物理特性浴鸿。要達(dá)到的最終目的是實(shí)現(xiàn)對(duì)于三維景物世界的理解,即實(shí)現(xiàn)人的視覺系統(tǒng)的某些功能井氢。也就是利用二維投影圖像來(lái)重構(gòu)三維物體的可視部分弦追。
3.1計(jì)算機(jī)視覺研究的對(duì)象與方法
3.1.1以模型世界為主要對(duì)象的視覺基本方法研究
這個(gè)階段以Roberts的開創(chuàng)性工作為標(biāo)志岳链。在Roberts的工作中引入了三維物體與二維成像的關(guān)系,采用了一些簡(jiǎn)單的邊緣特征提取方法并引入了組合線段的方法。這些早期的工作對(duì)視覺的發(fā)展起了促進(jìn)作用,但對(duì)于稍微復(fù)雜的景物便難于奏效劲件。
為他對(duì)三維關(guān)系的分析僅僅是靠簡(jiǎn)單的邊緣線段的約束關(guān)系,并沒有充分考慮人類或其他動(dòng)物視覺系統(tǒng)感知三維空間關(guān)系的方式掸哑。
3.1.2以計(jì)算理論為核心的視覺模型研究
20世紀(jì)70年代開始,對(duì)計(jì)算機(jī)視覺的研究進(jìn)入更為理性化的階段,主要集中于各種本征特性的恢復(fù),包括三維形狀约急、運(yùn)動(dòng)、光源等的恢復(fù)苗分。主要出發(fā)點(diǎn)是從生理學(xué)厌蔽、光學(xué)和射影幾何的方法出發(fā),研究成像及其逆問題。在這一階段中,以Marr為代表的一些研究者提出了以表示為核心摔癣、以算法為中間轉(zhuǎn)換過程的一般性視覺處理模型奴饮。在其理論中強(qiáng)調(diào)表示的重要性以及從不同層次上去研究信息處理問題,在計(jì)算理論和算法實(shí)現(xiàn)上又特別強(qiáng)調(diào)計(jì)算理論的重要性。在三維信息的感知方面,根據(jù)人類感知深度的不同提出了一系列ShapefromX的方法择浊。
3.2計(jì)算機(jī)視覺的應(yīng)用領(lǐng)域
計(jì)算機(jī)視覺的應(yīng)用領(lǐng)域主要包括對(duì)照片戴卜、視頻資料如航空照片、衛(wèi)星照片琢岩、視頻片段等的解釋投剥、精確制導(dǎo)、移動(dòng)機(jī)器人視覺導(dǎo)航担孔、醫(yī)學(xué)輔助診斷江锨、工業(yè)機(jī)器人的手眼系統(tǒng)、地圖繪制糕篇、物體三維形狀分析與識(shí)別及智能人機(jī)接口等啄育。
早期進(jìn)行數(shù)字圖像處理的目的之一就是要通過采用數(shù)字技術(shù)提高照片的質(zhì)量,輔助進(jìn)行航空照片和衛(wèi)星照片的讀取判別與分類。由于需要判讀的照片數(shù)量很多,于是希望有自動(dòng)的視覺系統(tǒng)進(jìn)行判讀解釋,在這樣的背景下,產(chǎn)生了許多航空照片和衛(wèi)星照片判讀系統(tǒng)與方法娩缰。自動(dòng)判讀的進(jìn)一步應(yīng)用就是直接確定目標(biāo)的性質(zhì),進(jìn)行實(shí)時(shí)的自動(dòng)分類,并與制導(dǎo)系統(tǒng)相結(jié)合灸撰。目前常用的制導(dǎo)方式包括激光制導(dǎo)、電視制導(dǎo)和圖像制導(dǎo),在導(dǎo)彈系統(tǒng)中常常將慣性制導(dǎo)與圖像制導(dǎo)結(jié)合,利用圖像進(jìn)行精確的末制導(dǎo)拼坎。
工業(yè)機(jī)器人的手眼系統(tǒng)是計(jì)算機(jī)視覺應(yīng)用最為成功的領(lǐng)域之一,由于工業(yè)現(xiàn)場(chǎng)的諸多因素,如光照條件浮毯、成像方向均是可控的,因此使得問題大為簡(jiǎn)化,有利于構(gòu)成實(shí)際的系統(tǒng)。與工業(yè)機(jī)器人不同,對(duì)于移動(dòng)機(jī)器人而言,由于它具有行為能力,于是就必須解決行為規(guī)劃問題,即是對(duì)環(huán)境的了解泰鸡。隨著移動(dòng)式機(jī)器人的發(fā)展,越來(lái)越多地要求提供視覺能力,包括道路跟蹤债蓝、回避障礙、特定目標(biāo)識(shí)別等盛龄。目前移動(dòng)機(jī)器人視覺系統(tǒng)研究仍處于實(shí)驗(yàn)階段,大多采用遙控和遠(yuǎn)視方法饰迹。
在醫(yī)學(xué)上采用的圖像處理技術(shù)大致包括壓縮、存儲(chǔ)余舶、傳輸和自動(dòng)/輔助分類判讀,此外還可用于醫(yī)生的輔助訓(xùn)練手段啊鸭。與計(jì)算機(jī)視覺相關(guān)的工作包括分類、判讀和快速三維結(jié)構(gòu)的重建等方面匿值。長(zhǎng)期以來(lái),地圖繪制是一件耗費(fèi)人力赠制、物力和時(shí)間的工作。以往的做法是人工測(cè)量,現(xiàn)在更多的是利用航測(cè)加上立體視覺中恢復(fù)三維形狀的方法繪制地圖,大大提高了地圖繪制的效率挟憔。同時(shí),通用物體三維形狀分析與識(shí)別一直是計(jì)算機(jī)視覺的重要研究目標(biāo),并在景物的特征提取钟些、表示烟号、知識(shí)的存儲(chǔ)、檢索以及匹配識(shí)別等方面都取得了一定的進(jìn)展,構(gòu)成了一些用于三維景物分析的系統(tǒng)政恍。
近年來(lái),基于生物特征(biometrics)的鑒別技術(shù)得到了廣泛重視,主要集中在對(duì)人臉汪拥、虹膜、指紋篙耗、聲音等特征上,這其中大多都與視覺信息有關(guān)迫筑。與生物特征識(shí)別密切相關(guān)的另一個(gè)重要應(yīng)用是用于構(gòu)成智能人機(jī)接口。現(xiàn)在計(jì)算機(jī)與人的交流還是機(jī)械式的,計(jì)算機(jī)無(wú)法識(shí)別用戶的真實(shí)身份,除鍵盤宗弯、鼠標(biāo)外,其他輸入手段還不成熟铣焊。利用計(jì)算機(jī)視覺技術(shù)可以使計(jì)算機(jī)檢測(cè)到用戶是否存在、鑒別用戶身份罕伯、識(shí)別用戶的體勢(shì)(如點(diǎn)頭曲伊、搖頭)。此外,這種人機(jī)交互方式還可推廣到一切需要人機(jī)交互的場(chǎng)合,如入口安全控制追他、過境人員的驗(yàn)放等坟募。
4對(duì)計(jì)算機(jī)視覺研究的認(rèn)識(shí)
計(jì)算機(jī)視覺研究經(jīng)歷了近40年的過程,仍面臨許多問題。主要由于這一方向是多學(xué)科的交叉與結(jié)合,同時(shí)視覺是一個(gè)涉及生理邑狸、心理的復(fù)雜過程,不僅與眼睛有關(guān),還和大腦的推理懈糯、學(xué)習(xí)有關(guān)。研究計(jì)算機(jī)視覺的目的是要實(shí)現(xiàn)對(duì)人類視覺的模擬和延伸单雾。對(duì)于人類而言,視覺是一個(gè)輕而易舉的功能,對(duì)機(jī)器卻不同赚哗。視覺過程很難用類似于問題求解的方法符號(hào)化。隨著計(jì)算機(jī)科學(xué)領(lǐng)域中對(duì)定量研究的重視,這種狀況會(huì)得到改善硅堆。在計(jì)算機(jī)視覺的研究過程中,應(yīng)考慮將功能模擬與認(rèn)知模擬相結(jié)合屿储。人類延伸其他能力的過程中,功能模擬起到了主要作用,但視覺是涉及心理和生理兩方面的過程,因此必須在功能模擬的同時(shí)重視認(rèn)知模擬。
計(jì)算理論的進(jìn)步與感知手段的改進(jìn)有助于計(jì)算機(jī)視覺的研究渐逃。在計(jì)算機(jī)視覺中計(jì)算理論占有十分重要的地位,計(jì)算理論的進(jìn)步,新的計(jì)算模型的提出可以解決以往一些困難的問題;另一方面,感知手段的進(jìn)步也可以起到同樣的作用够掠。采用主動(dòng)視覺可從另一個(gè)側(cè)面去處理面對(duì)的視覺問題。要實(shí)現(xiàn)完整的視覺系統(tǒng),視覺知識(shí)的獲取茄菊、管理和利用是必不可少的疯潭。一個(gè)相對(duì)完備的視覺系統(tǒng)同時(shí)也是一個(gè)知識(shí)管理系統(tǒng),在視覺過程中對(duì)一幅圖像的理解需要大量的關(guān)于任務(wù)領(lǐng)域的知識(shí),這些知識(shí)不同于問題求解中的知識(shí)可以明確的顯性表示,而且人類獲取信息的80%是通過視覺得到的,因而這些知識(shí)涉及面之廣難以預(yù)測(cè),因此視覺系統(tǒng)中的知識(shí)管理是一個(gè)重要問題。
從以往的研究看,過去的幾十年雖然提出面殖、解決了一些問題,但是由于視覺問題的特殊性和復(fù)雜性,還有大量的問題需要研究竖哩。研究的重點(diǎn)包括對(duì)新方法、新手段的探索脊僚。當(dāng)然,在原有問題上采用新的描述方法相叁、求解手段也是一個(gè)可能的突破點(diǎn)。在視覺領(lǐng)域中多數(shù)的問題不是問題本身正確與否,而是描述是否恰當(dāng)以及求解是否有效的問題,因而描述方式、求解手段的探索是十分重要的钝荡。總之,隨著對(duì)定量研究的重視,新的描述方式舶衬、求解手段的研究,以及感知手段的改進(jìn),計(jì)算機(jī)視覺的研究必將迎來(lái)一個(gè)更加繁榮的時(shí)代埠通。
參考文獻(xiàn):
[1]陳熙霖.計(jì)算機(jī)視覺:算法與系統(tǒng)原理,清華大學(xué)出版社,2000
[2]高滿屯.計(jì)算機(jī)視覺研究中的投影理論和方法,西北工業(yè)大學(xué)出版社,1998
[3]馬頌德,張正友.計(jì)算機(jī)視覺—計(jì)算理論與算法基礎(chǔ),科學(xué)出版社,1998
[4]章毓晉.圖像工程下-圖像理解與計(jì)算機(jī)視覺,清華大學(xué)出版社,2000
[5] (美)福賽思.計(jì)算機(jī)視覺:一種現(xiàn)代方法,電子工業(yè)出版社,2004