一、圖像檢索
圖像檢索兩個框架:基于文本和基于內(nèi)容
1.基于文本
?常規(guī)的圖像檢索框架国旷,圖像由文本注釋矛物,然后通過文本在圖像數(shù)據(jù)庫中檢索。
缺點:
人工注釋需要相當(dāng)大的人力開銷
由于人類的主觀性會導(dǎo)致文本的注釋不準(zhǔn)確為克服基于文本檢索框架的缺點议街,在20世紀(jì)80年代引入了基于內(nèi)容的圖像檢索泽谨。
2.基于內(nèi)容
?基于內(nèi)容的圖像檢索(CBIR)系統(tǒng),使得用戶能夠在系統(tǒng)中找到與查詢圖像類似的圖像。
?圖像內(nèi)容:例如顏色吧雹,紋理骨杂,形狀等
二、項目介紹
?本項目是采用keras深度學(xué)習(xí)框架雄卷,在MNIST數(shù)據(jù)集上實現(xiàn)基本的圖像檢索功能搓蚪。
基于內(nèi)容的圖像檢索的框架:
基于內(nèi)容的圖像檢索.png
1.圖像特征提取
?基于內(nèi)容的圖像檢索的關(guān)鍵是特征提取。
手工特征提榷○摹:
顏色直方圖定義顏色
方向梯度直方圖限定形狀CNN特征提榷侍丁:
使用為分類而訓(xùn)練的CNN來提取圖像特征,如VGG16揣钦、ResNet等雳灾。
但這種方法仍然需要標(biāo)記數(shù)據(jù)來訓(xùn)練神經(jīng)網(wǎng)絡(luò),打標(biāo)簽的工作成本非常高冯凹。去噪自動編碼器提取
無監(jiān)督的深度學(xué)習(xí)方法
2.去噪自動編碼器
?去噪自動編碼器是用于圖像去噪的神經(jīng)網(wǎng)絡(luò)谎亩,它可以學(xué)習(xí)到圖像上的重要特征,即提取圖像的本質(zhì)宇姚。
- 去噪自動編碼器結(jié)構(gòu)
去噪自動編碼器.png